You are on page 1of 265

INTRODUCTION

LINFORMATIQUE QUANTIQUE
VOLUME I

PRINCIPES MATHMATIQUES
ET PHYSIQUES

Pierre Vinet
c Tous droits rservs 2016

Prface

ii

Prface

Liste de symboles

iv

Liste de symboles

Table des matires


Prface

Liste de symboles

iii

Table des figures

ix

Liste des tableaux

xi

1 Lespace de Hilbert
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . .
1.2 Les espaces vectoriels . . . . . . . . . . . . . . . . .
1.2.1 Exemples despaces vectoriels . . . . . . . .
1.2.2 Sous-espaces vectoriels . . . . . . . . . . . .
1.2.3 Bases et dimensions . . . . . . . . . . . . .
1.2.4 Applications linaires et isomorphismes . .
1.2.5 Lespace dual . . . . . . . . . . . . . . . . .
1.3 Les espaces pr-hilbertiens . . . . . . . . . . . . . .
1.3.1 Le produit scalaire . . . . . . . . . . . . . .
1.4 Les espaces vectoriels norms . . . . . . . . . . . .
1.5 Les espaces mtriques . . . . . . . . . . . . . . . .
1.6 Les espaces de Hilbert de dimension infinie . . . . .
1.6.1 Topologie usuelle sur les espaces mtriques*
1.6.2 Les espaces complets* . . . . . . . . . . . .
1.6.3 Les espaces sparables* . . . . . . . . . . .
1.6.4 Les espaces vectoriels topologiques . . . . .
1.6.4.1 Lespace dual topologique . . . . .
1.6.5 Les bases hilbertiennes . . . . . . . . . . . .
1.7 Quelques reprsentations de H . . . . . . . . . . .
1.7.1 Lespace l2 * . . . . . . . . . . . . . . . . . .
1.7.2 Lespace fonctionnel L2 * . . . . . . . . . . .

1
1
2
2
4
5
7
11
13
13
18
22
25
25
30
35
38
40
41
57
57
59

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

vi

TABLE DES MATIRES


1.7.3 Lespace dtat . .
1.8 La notation de Dirac : bra
1.9 Les triplets de Gelfand* .
1.10 Problmes du Chapitre 1 .

. . . .
et ket
. . . .
. . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

64
66
67
70

Annexes du Chapitre 1
73
Annexe 1.A Les structures algbriques . . . . . . . . . . . . . . . 75
1.A.1 Le produit cartsien . . . . . . . . . . . . . . . . . . . 75
1.A.2 Loi de composition interne . . . . . . . . . . . . . . . . 75
1.A.3 Loi de composition externe . . . . . . . . . . . . . . . 76
1.A.4 La structure algbrique de corps . . . . . . . . . . . . 76
1.A.5 La structure despace vectoriel . . . . . . . . . . . . . 77
1.A.6 Les algbres . . . . . . . . . . . . . . . . . . . . . . . . 80
Annexe 1.B Les nombres complexes . . . . . . . . . . . . . . . . . 82
1.B.1 Les oprations arithmtiques sur les nombres complexes 82
1.B.2 La conjugaison complexe . . . . . . . . . . . . . . . . . 84
1.B.3 La forme algbrique des nombres complexes . . . . . . 84
1.B.4 La forme trigonomtrique des nombres complexes . . . 85
1.B.5 Les fonctions de la variable complexe . . . . . . . . . . 87
1.B.6 La forme exponentielle des nombres complexes . . . . 88
1.B.7 Apprciation des nombres complexes . . . . . . . . . . 91
Annexe 1.C Topologie gnrale . . . . . . . . . . . . . . . . . . . . 97
1.C.1 Les espaces topologiques . . . . . . . . . . . . . . . . . 97
1.C.2 Voisinage dun point . . . . . . . . . . . . . . . . . . . 99
1.C.3 Prbase dun espace topologique . . . . . . . . . . . . 100
1.C.4 Base dun espace topologique . . . . . . . . . . . . . . 102
1.C.5 Topologie induite . . . . . . . . . . . . . . . . . . . . . 104
1.C.6 Continuit . . . . . . . . . . . . . . . . . . . . . . . . . 105
1.C.7 quivalence topologique . . . . . . . . . . . . . . . . . 109
1.C.8 Convergence . . . . . . . . . . . . . . . . . . . . . . . . 110
1.C.9 Adhrence . . . . . . . . . . . . . . . . . . . . . . . . . 111
1.C.10 Espaces de Hausdorff . . . . . . . . . . . . . . . . . . . 113
1.C.11 Axiomes de dnombrabilit . . . . . . . . . . . . . . . 115
1.C.12 Sparabilit . . . . . . . . . . . . . . . . . . . . . . . . 118
1.C.13 Compacit . . . . . . . . . . . . . . . . . . . . . . . . . 119
2 Les oprateurs linaires sur lespace de Hilbert
133
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
2.2 Algbre linaire . . . . . . . . . . . . . . . . . . . . . . . . . . 134
2.2.1 Lespace vectoriel LK (V, W) . . . . . . . . . . . . . . 134

vii

TABLE DES MATIRES

2.3

2.4

2.5

2.6
2.7
2.8

2.2.2 Composition dapplications linaires . . . . . . . . . .


2.2.3 Lalgbre linaire LK (V) . . . . . . . . . . . . . . . . .
2.2.4 Reprsentations . . . . . . . . . . . . . . . . . . . . . .
2.2.5 Transformations linaires inversibles . . . . . . . . . .
Les oprateurs linaires . . . . . . . . . . . . . . . . . . . . .
2.3.1 Les oprateurs sur H . . . . . . . . . . . . . . . . . . .
2.3.2 Les oprateurs adjoints . . . . . . . . . . . . . . . . . .
2.3.3 Reprsentation matricielle des bras . . . . . . . . . . .
2.3.4 Reprsentation matricielle des oprateurs linaires . .
2.3.5 Valeurs propres et vecteurs propres dun oprateur . .
Proprits des oprateurs linaires . . . . . . . . . . . . . . .
2.4.1 galit de deux oprateurs linaires . . . . . . . . . . .
2.4.2 Trace dun oprateur . . . . . . . . . . . . . . . . . . .
2.4.3 Commutateur et relations de commutation . . . . . . .
2.4.4 Fonctions doprateurs . . . . . . . . . . . . . . . . . .
Types doprateurs linaires . . . . . . . . . . . . . . . . . . .
2.5.1 Loprateur identit . . . . . . . . . . . . . . . . . . .
2.5.2 Projecteurs . . . . . . . . . . . . . . . . . . . . . . . .
2.5.2.1 Restriction dun oprateur un sous-espace .
2.5.3 Oprateurs hermitiens . . . . . . . . . . . . . . . . . .
2.5.3.1 Oprateurs positifs . . . . . . . . . . . . . . .
2.5.4 Oprateurs unitaires . . . . . . . . . . . . . . . . . . .
2.5.4.1 Changement de reprsentation . . . . . . . .
2.5.4.2 Transformation des lments de matrice dun
oprateur . . . . . . . . . . . . . . . . . . . .
2.5.5 Oprateurs normaux . . . . . . . . . . . . . . . . . . .
2.5.5.1 Dcomposition spectrale dun oprateur normal . . . . . . . . . . . . . . . . . . . . . . .
2.5.5.2 Diagonalisation simultane doprateurs . . .
Dcomposition polaire* . . . . . . . . . . . . . . . . . . . . .
Oprateurs borns* . . . . . . . . . . . . . . . . . . . . . . . .
Problmes du Chapitre 2 . . . . . . . . . . . . . . . . . . . . .

Annexes du Chapitre 2
Annexe 2.A Les matrices . . . . . . . . . . . . . . . .
2.A.1 Lalgbre des matrices carres . . . . . . .
2.A.2 Transposition et conjugaison de matrices .
2.A.3 Matrices symtriques et antisymtriques .
2.A.4 Matrices hermitiennes et antihermitiennes
2.A.5 Le dterminant . . . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

137
139
139
146
147
149
150
153
157
158
160
160
162
163
165
167
167
168
171
172
174
177
179
182
183
185
194
196
202
211
215
217
217
219
221
222
222

viii

TABLE DES MATIRES


2.A.6
2.A.7
2.A.8
2.A.9
2.A.10
2.A.11

Linverse dune matrice . . . . . . . .


Trace et rang dune matrice . . . . . .
quation caractristique dune matrice
Matrices semblables . . . . . . . . . .
Matrices diagonisables . . . . . . . . .
Matrices normales . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

228
231
232
237
238
240

Bibliographie

243

Index

245

Table des figures


1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
1.10
1.11
1.12
1.13
1.14
1.15
1.16
1.17
1.18
1.19
1.20
1.21
1.22
1.23
1.24
1.25

Oprations vectorielles . . . . . . . . . . . . . . . . . . . . .
Injections, surjections et bijections . . . . . . . . . . . . . .
Boules ouvertes dans R2 et C . . . . . . . . . . . . . . . . .
Une boule ouverte est un voisinage de chacun de ses points
Intersection de deux boules ouvertes . . . . . . . . . . . . .
Boules ouvertes en tant quouverts de Td . . . . . . . . . . .
Espace de Hausdorff . . . . . . . . . . . . . . . . . . . . . .
Projection orthogonale . . . . . . . . . . . . . . . . . . . . .
Comparaison entre le plan cartsien et le plan dArgand . .
Le cercle unit dans le plan complexe . . . . . . . . . . . . .
Nombres complexes dans le plan dArgand . . . . . . . . . .
Racines de lquation quadratique . . . . . . . . . . . . . . .
Racines de lquation cubique . . . . . . . . . . . . . . . . .
Voisinage dun point . . . . . . . . . . . . . . . . . . . . . .
Base dun espace topologique . . . . . . . . . . . . . . . . .
Continuit . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exemple dapplication continue . . . . . . . . . . . . . . . .
Continuit en un point . . . . . . . . . . . . . . . . . . . . .
Exemple dapplication continue en un point . . . . . . . . .
Thorme de Heine-Borel . . . . . . . . . . . . . . . . . . .
Partie ferme dun ensemble compact . . . . . . . . . . . . .
Ensemble compact dun espace de Hausdorff . . . . . . . . .
Espaces localement compacts . . . . . . . . . . . . . . . . .
Espaces borns . . . . . . . . . . . . . . . . . . . . . . . . .
Sous-ensemble totalement born (prcompact) . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

3
8
24
27
28
28
36
52
86
89
90
92
93
99
103
105
106
108
109
120
121
124
127
129
130

2.1
2.2
2.3

Composition dapplications . . . . . . . . . . . . . . . . . . . 138


Associativit de la composition dapplications . . . . . . . . . 138
Transformations du plan R2 . . . . . . . . . . . . . . . . . . . 148

TABLE DES FIGURES

Liste des tableaux


1.1

Morphismes despaces vectoriels . . . . . . . . . . . . . . . . .

10

2.1
2.2

Isomorphisme dalgbre . . . . . . . . . . . . . . . . . . . . . 144


Spectre doprateurs normaux . . . . . . . . . . . . . . . . . . 193

xii

LISTE DES TABLEAUX

PRINCIPES
MATHMATIQUES
ET PHYSIQUES

Chapitre 1

Lespace de Hilbert
I am sitting on a table not necessarily in Hilbert space.
Martin J.G. Veldman

1.1

Introduction

Le cadre mathmatique formel de la mcanique quantique est lespace


de Hilbert, un espace vectoriel norm de dimension infinie, complet, qui
admet une base vectorielle dnombrable. Un espace de Hilbert est un cas
particulier dun espace de Banach, celui o la norme drive dun produit
scalaire. Tous les espaces de Hilbert de dimension infinie sont isomorphes
entre eux ; autrement dit, un isomorphisme prs, il nexiste quun seul
espace de Hilbert.
Ce chapitre contient considrablement plus dinformations que lon en retrouve gnralement dans les ouvrages dinformatique quantique ou mme de
mcanique quantique. Il dveloppe en effet la thorie des espaces de Hilbert
de faon comprhensive et complte.
Lespace de Hilbert est un espace trs vaste. Toutefois, la pleine comprhension des algorithmes quantiques ne ncessite que ltude de sous-espaces
de dimension finie, ce qui a lavantage de rduire considrablement les difficults mathmatiques. De plus, dans les premiers volumes de cette srie,
le traitement rserv lunit quantique dinformation, le qubit 1 , sera purement abstrait, sans faire aucune rfrence une quelconque incarnation
physique.
Puisque lespace dtat du qubit nest que bi-dimensionnel, le modle
quantique du qubit est lun des plus simples qui soient et son tude se dis1. Contraction linguistique anglophone de quantum bit , ou de bit quantique.

Lespace de Hilbert

pense dun traitement quantique des variables externes telles que r et p. Il


est donc possible daccder au coeur du sujet en rduisant au strict minimum
les notions ncessaires.
Mais le chemin le plus court et le plus rapide nest ni ncessairement
le plus dsirable ni le plus utile. Le grand philosophe Edgar Morin ne nous
met-il pas en garde contre la trop grande simplicit de nos modles qui compartimente la pense, dfigure le rel et conduit une forme de connaissance
aveugle[10] ? Malgr son apparente simplicit, le qubit manifeste pleinement
toutes les merveilleuses et droutantes proprits qui font de la mcanique
quantique cet tincelant joyau de la pense scientifique. Peut-on rver dune
meilleure opportunit dtudier les fondements de la plus russie de toutes
les sciences ?
La dcision ultime revient au lecteur qui est seul responsable du rythme
et de la profondeur de son apprentissage. Le lecteur press qui possde dj
les connaissances suffisantes en algbre linaire peut se contenter de lire les
encadrs des pages 25 et 57 ainsi que la section 1.8 sur la notation de Dirac.
Celui qui dsire rafrachir ces notions saura se contenter, en premire lecture,
des sections non annotes dun astrisque.
Mais, plus quun expos de connaissances, cet ouvrage se veut un appel
un changement de paradigme. Et le lecteur qui fournira leffort additionnel
de chercher en comprendre toutes les sections et de sattaquer aux diffrents problmes acquirera une vision nouvelle, fascinante et indlbile de
cet magnifique monde physique dont il fait lui-mme partie intgrante.

1.2

Les espaces vectoriels

Nous allons maintenant passer en revue certaines notions essentielles dalgbre linaire. Pour les deux prochaines sections, notre intrt portera principalement sur les espaces vectoriels de dimension finie.

1.2.1

Exemples despaces vectoriels

Nous supposons que le lecteur est dj familier avec les oprations fondamentales daddition vectorielle et de multiplication scalaire sur les vecteurs
telles quillustres la Fig. 1.1. Pour une dfinition axiomatique dun espace vectoriel ou une explication sur les conventions de notation, le lecteur
est pri de consulter lappendice 1.A sur les structures algbriques.
Voici quelques exemples despaces vectoriels qui sont particulirement
pertinents pour linformatique quantique.

1.2.1

Exemples despaces vectoriels


5u
0.

u
v

u
u
1.5

v
u
(a)

(b)

Figure 1.1 (a) addition vectorielle (loi du paralllogramme) et (b) multiplication scalaire sur un espace vectoriel rel
Exemple 1.1. Soit V = Rn et dfinissons les oprations daddition
vectorielle et de multiplication scalaire sur les n-uplets par :
(x1 , x2 , . . . , xn ) + (y1 , y2 , . . . , yn ) = (x1 + y1 , x2 + y2 , . . . , xn + yn ) (1.1a)
(x1 , x2 , . . . , xn ) = (x1 , x2 , . . . , xn )

(1.1b)

Alors V est un espace vectoriel qui vrifie tous les axiomes de la dfinition
1A.5. Les vecteurs de V sont les n-uplets x = (x1 , x2 , . . . , xn ) et V est un
exemple despace vectoriel rel, que nous dsignerons par Rn .
Exemple 1.2. Si dans lexemple prcdent nous remplaons Rn par Cn
et les n-uplets rels par des n-uplets complexes, nous obtenons un espace vectoriel complexe. Ce sont ces espaces vectoriels Cn qui sont dune importance
fondamentale en informatique quantique.
Note. Si le besoin dun rappel sur les nombres complexes se fait sentir,
le lecteur est invit consulter lappendice 1.B.
Exemple 1.3. Lensemble Mm,n (K) des matrices m n dot des oprations daddition vectorielle et de multiplication scalaire suivantes possde
aussi la structure despace vectoriel :

x11 x1n
y11 y1n
.
.
..
..
..
.
xij
yij
.
.

+ .

xm1 xmn
ym1 ymn

x11 + y11

.
..
=
xij + yij

xm1 + ym1

x1n + y1n

..
(1.2a)
.

xmn + ymn

Lespace de Hilbert


x11 x1n
x11
.
.
.
.
.
.

xij
.
xij
.
= .
xm1 xmn
xm1

x1n
..
.

xmn

(1.2b)

Si les exemples lmentaires dcrits ci-haut conviennent parfaitement


nos besoins, en revanche ils ne font queffleurer le concept despace vectoriel.
Les vecteurs peuvent assumer des identits aussi diffrentes que des n-uplets,
des polynmes, des applications, des suites convergentes ou encore des solutions dquations diffrentielles linaires homognes. En particulier, la notion
despace vectoriel de fonctions, ou despace fonctionnel, a jou un rle trs
important dans le dveloppement de la mcanique quantique.

1.2.2

Sous-espaces vectoriels

De faon informelle, un sous-espace vectoriel de V nest autre quun


sous-ensemble U V tel que (U, +, ) possde aussi la structure despace
vectoriel. Selon nos conventions, nous dsignerons ce sous-espace vectoriel
(ou simplement sous-espace en labsence dambigut) par U.
La dfinition suivante permet den formaliser le concept.
Dfinition 1.1 Soient V un espace vectoriel sur un corps K et
{v1 , v2 , . . . , vn } un ensemble fini de vecteurs arbitraires de V. Une combinaison linaire est toute expression de la forme :
1 v1 + 2 v2 + + n vn
o les i sont des scalaires quelconques de K.

Dfinition 1.2 Soient V un espace vectoriel et U , un sous-ensemble


non-vide de V . Nous dirons que U est un sous-espace vectoriel de V si toute
combinaison linaire dlments de U est aussi un lment de U.
Nous dirons alors que le sous-espace U est stable par combinaison linaire.
Remarque. La dfinition 1.2 implique que 0 soit un lment de tout
sous-espace vectoriel (Pourquoi ?).
Exemple 1.4. Le sous-ensemble {0} est un sous-espace de tout espace
V et constitue un exemple de sous-espace trivial.

1.2.3

Bases et dimensions

Exemple 1.5. Soient u et v, deux vecteurs de R3 non nuls et non


colinaires (c.--d. tels quil nexiste aucun scalaire pour lequel u = v).
Alors le plan contenant la fois les vecteurs u et v ramens lorigine est
un sous-espace de R3 .
Il existe une recette simple pour fabriquer des sous-espaces vectoriels.
Thorme 1.1 Soient V un espace vectoriel et A = {v1 , v2 , . . . , vn },
une famille quelconque de vecteurs de V. Lensemble des combinaisons linaires des vecteurs v1 , v2 , . . . , vn engendre un sous-espace vectoriel de V,
dnot Vect(A).
Remarques.
1. Par convention, si A = , alors Vect(A) = {0}.
2. Vect(A) est le plus petit sous-espace vectoriel contenant A.
3. A est un sous-espace vectoriel ssi Vect(A) = A.
Il est facile de dmontrer que lintersection U V de deux sous-espaces
issus dun mme espace vectoriel W constitue aussi un sous-espace de W.
De plus, si nous dfinissons la somme U + V des deux sous-espaces
comme suit :
U + V = {u + v | u U, v V}
(1.3)
alors la somme U + V constitue aussi un sous-espace de W.

1.2.3

Bases et dimensions

Il conviendra ici de rafrachir la notion dindpendance linaire.


Dfinition 1.3 Un ensemble fini {v1 , v2 , . . . , vn } de vecteurs distincts
est dit linairement indpendant si aucun des vecteurs vi nest une combinaison linaire des autres vecteurs. Dans le cas contraire, nous dirons que
les vecteurs sont linairement dpendants entre eux.
Remarques.
1. Il existe beaucoup de propositions qui sont quivalentes la dfinition
1.3. Nous retiendrons celle-ci : les vecteurs v1 , v2 , . . . , vn sont linairement indpendants entre eux si :
1 v1 + 2 v2 + + n vn = 0

i = 0, i.

Lespace de Hilbert
2. Si les vecteurs v1 , v2 , . . . , vn contiennent le vecteur 0, alors ils sont
automatiquement linairement dpendants.

Dfinition 1.4 Une famille de vecteurs {v1 , v2 , . . . , vn } forme une base


dun espace vectoriel V si les deux conditions suivantes sont remplies :
1. les vecteurs {v1 , v2 , . . . , vn } sont linairement indpendants.
2. les vecteurs {v1 , v2 , . . . , vn } engendrent V,
c.--d. Vect(v1 , v2 , . . . , vn ) = V.
La dfinition 1.4 quivaut dire que tout lment v de V sexprime de
faon unique en tant que combinaison linaire des vecteurs de base, c.--d.
quil existe toujours des 1 , 2 , . . . , n K tels que :
v = 1 v1 + 2 v2 + + n vn
Dans Rn , il existe une infinit de bases admissibles. Lensemble des
n-uplets indpendants {(1, 0, . . . , 0), (0, 1, . . . , 0), . . . , (0, 0, . . . , 1)} forme une
base particulirement simple quil convient dappeler la base usuelle ou encore la base canonique et qui sert tablir un repre cartsien.
Si lensemble des vecteurs de base est de cardinal fini n, nous disons que
lespace vectoriel est de dimension n ou encore que nous sommes en prsence
dun espace n-dimensionnel. Tout ensemble de n + 1 vecteurs dun espace
n-dimensionnel est ncessairement linairement dpendent.
Remarque. On peut dmontrer que tout espace vectoriel, mme ceux de
dimension infinie, admet une (des) base(s) 2 .
Exemple 1.6. Prcisons la dimension des espaces vectoriels finis vus
jusqu prsent.
Lespace Rn de lexemple 1.1 est de dimension n.
Lespace Cn de lexemple 1.2 est aussi de dimension n.
Lespace Mm,n de lexemple 1.3 est de dimension mn.
Lespace {0} de lexemple 1.4 est de dimension 0.
Le sous-espace dcrit lexemple 1.5 est un espace de dimension 2 dont
{u, v} constitue une base.
Notons aussi que lespace Pn des polynmes de degr gal ou infrieur
n est un espace vectoriel de dimension n + 1 et que les monmes
{1, x, x2 , . . . , xn } constituent une base de Pn .
2. Cette dmonstration ncessite le lemme de Zorn, qui est une formulation quivalente
de laxiome du choix.

1.2.4

Applications linaires et isomorphismes

Nous dsignerons la dimension dun espace V par dim V. Si dim V = n,


alors pour tout sous-espace U de V, dim U 6 n.
De plus, si dim U = n, alors U = V.
Proposition 1.2 Soit V, un espace vectoriel de dimension finie n.
Alors tout ensemble {v1 , v1 , . . . , vn } de n vecteurs linairement indpendants
est une base de V.
Dfinition 1.5 Un espace vectoriel V est la somme directe de ses sousespaces V1 , V2 , . . . , Vk , ce que nous dnoterons par :
V = V1 V2 Vk
ssi tout vecteur v V sexprime de faon unique en tant que :
v = v1 + v2 + + vk
o v1 V1 , v2 V2 , . . . , vk Vk .
Proposition 1.3 Un espace vectoriel V est la somme directe des ses
sous-espaces V1 , V2 , . . . , Vk ssi :
1. V = V1 + V2 + + Vk
2. Vi Vj = {0}
i6=j

Remarque. Soient V un espace vectoriel et {B1 , B2 , . . . , Bk } une partition quelconque dune base de V. Alors,
V = Vect(B1 ) Vect(B2 ) Vect(Bk )

1.2.4

(1.4)

Applications linaires et isomorphismes

Cette section se veut essentiellement tre un rappel terminologique.


Dfinition 1.6 Soient X et Y , deux ensembles non-vides. Une application F : X Y est une rgle qui fait correspondre chaque lment x X
un unique lment y Y . Nous utiliserons le symbole 7 pour indiquer cette
correspondance unique et nous crirons :
x 7 y

ou encore

x 7 F (x)

et dirons que y est l image de x (par F ) et que x est la pr-image de y.


Lensemble X est le domaine de F et lensemble Y son co-domaine.

Lespace de Hilbert

Remarque. Lorsque le co-domaine est R ou C, nous prfrerons le terme


fonction (relle ou complexe selon le cas) celui dapplication. Nous utiliserons des caractres minuscules romains, par exemple f : X C, pour
dsigner les fonctions. Nous dirons que y est limage de x par f si y = f (x).
Une application est dite injective, ou encore est une injection, si limage
de chaque lment x X est unique. Autrement dit :
x 6= y

F (x) 6= F (y)

Une application est dite surjective, ou encore est une surjection, si chaque
y Y est limage dau moins un x X.
Une application est dite bijective, ou encore est une bijection, si elle est
la fois injective et surjective.
Une application bijective F : X Y est inversible, c.--d. quil existe
toujours une application rciproque F 1 : Y X qui soit elle aussi bijective.
F

a
X

b
c
d

m
n
o Y
p
q

m
n
Y
o
p

b
X c
d
e

(a)

(b)
a

F 

b
X c
d
e

F 1

m
n
o Y
p
q

(c)

Figure 1.2 (a) application injective mais non surjective (b) application
surjective mais non injective (c) application bijective (injective et surjective)
Nous nous limiterons aux applications dont le domaine et le co-domaine
possdent la structure despace vectoriel. Plus particulirement, nous nous
concentrerons sur les applications linaires.

1.2.4

Applications linaires et isomorphismes

), deux espaces vectoriels dDfinition 1.7 Soient (V, +, ) et (W, +,


finis sur un mme corps K et F : V W, une application quelconque. Nous
dirons que F est une application linaire si :
(v)
1. u, v V,
F (u + v) = F (u)+F
2. K et v V,

F (v) = F (v)

Remarque. Les conditions 1 et 2 peuvent tre condenses ainsi :

F (u + v) = F (u)+F
(v)
De plus, il est toujours vrai que F (0V ) = 0W (Pourquoi ?).
Note. Les lois de composition interne ne sont pas ncessairement identiques pour les espaces vectoriels V et W ce qui, strictement, exigerait de
Il est dusage toutefois de reconserver les notations diffrentes + et +.
laxer cette contrainte et de nutiliser quun seul symbole + dans les deux cas
puisque le contexte ne porte pas la confusion.
Convention. Lorsque le co-domaine de lapplication linaire est R ou
C, nous utiliserons lappellation forme linaire plutt que celle de fonction
linaire.
Une application linaire est un exemple dhomomorphisme 3 despaces
vectoriels. Lapplication linaire respecte la structure algbrique despace
vectoriel.
Si lapplication linaire est dfinie sur un seul et mme espace vectoriel,
F : V V, nous sommes en prsence dun endomorphisme.
Une application linaire qui est aussi une bijection est un exemple disomorphisme despaces vectoriels. Un endomorphisme bijectif est appel un
automorphisme. La table 1.1 jette un peu de clart sur cette nomenclature
qui peut prter confusion.
Dans ce premier chapitre, cest la notion disomorphisme qui bnficie
dun traitement de faveur. En rgle gnrale, si nous sommes en mesure de
trouver une application linaire bijective F , entre deux K-espaces vectoriels
V et W, alors lapplication F est un isomorphisme despaces vectoriels et
nous dirons que les deux espaces sont isomorphes.
Convention. Nous utiliserons le symbole
= pour reprsenter le fait que
deux espaces vectoriels sont isomorphes, par exemple :
V
=W
3. Du grec, homos mme et morph forme .

10

Lespace de Hilbert

Application linaire
F

F :VW

F :VV

non bijective

homomorphisme

endomorphisme

bijective

isomorphisme

automorphisme

Table 1.1 Une application linaire est un homomorphisme despaces vectoriels. Si lapplication linaire est bijective, alors les espaces vectoriels sont
isomorphes
Deux espaces vectoriels isomorphes peuvent tre considrs comme tant
deux ralisations diffrentes dun mme espace abstrait. tre isomorphe
est une relation dquivalence, c.--d. la fois rflexive (V
= V), symtrique

(si V
W
alors
W
V)
et
transitive
(si
U
V
et
V
W
alors U
=
=
=
=
= W).
Dmontrons maintenant que tout K-espace vectoriel V de dimension n
est isomorphe Kn .
Exemple 1.7. Soit une base quelconque {v1 , v2 , . . . , vn } de V. Puisque
tout vecteur v V sexprime dune faon unique en tant que combinaison
linaire des vecteurs de base, nous pouvons toujours crire :
v = 1 v1 + 2 v2 + + n vn

(1.5)

o les i K. Dfinissons F : V Kn par :


v 7 (1 , 2 , . . . , n )
Nous tablissons ainsi une correspondance unique entre tout vecteur de V
et le n-uplet de ses coordonnes relatives la base choisie. linverse, tout
n-uplet de Kn nous pouvons faire correspondre un vecteur de V laide de
lquation 1.5. La correspondance tant biunivoque, lapplication F est donc
une bijection 4 . Par consquent :
V
= Kn
4. Le n-uplet est alors un vecteur de coordonnes (relatif la base choisie).

1.2.5

11

Lespace dual

Proposition 1.4 Deux K-espaces vectoriels V et W de dimension finie


sont isomorphes ssi ils ont la mme dimension.
Remarque. De cette dernire proposition, on retient que tous les espaces
vectoriels de dimension finie n sont isomorphes entre eux. En dautres termes,
il nexiste, un isomorphisme prs, quun seul espace vectoriel de dimension
finie n.
Une mise en garde serait maintenant approprie. Le lieu gomtrique des
nombres complexes est le plan dArgand (voir Fig. 1.10b) qui ressemble sy
mprendre au plan cartsien deux dimensions. Si lapplication F : C R2
dfinie par :
z 7 (<(z), =(z))
(o <(z) est la partie relle de z et =(z) sa partie imaginaire) est effectivement une bijection, il serait malheureux den conclure htivement que
C
= R2 et quainsi lespace vectoriel C est 2-dimensionnel 5 . Le lecteur
devrait se convaincre que lapplication F telle que dfinie nest pas une application linaire (Pourquoi ?) et que tout espace vectoriel K dfini sur son
propre corps K est unidimensionnel.
Convention. Lensemble de tous les isomorphismes F : V W est
dnot par LK (V, W) ou tout simplement par L(V, W). Lensemble de tous
les endomorphismes est dnot par L(V) plutt que par L(V, V).

1.2.5

Lespace dual

Il est souvent utile dtablir, en mathmatiques, une relation biunivoque


entre deux familles dobjets mathmatiques de nature possiblement trs diffrente. La notion de dualit a t forge partir de ce besoin. Le point
essentiel de cette section est de faire ressortir lisomorphisme qui existe entre
un espace vectoriel de dimension finie V et son espace dual 6 V .
5. Un risque de confusion existe car si R2 et C, pris en tant quespaces vectoriels ne
sont pas quivalents, par contre R2 et C, pris en tant quespaces mtriques le sont (voir
lexemple 1.12.
6. Il est question ici despace dual algbrique. Une notion apparente qui sapplique aux
espaces vectoriels topologiques, est celle despace dual topologique, V0 , qui est lensemble
de toutes les formes linaires continues Lc (V, K). En dimension finie, les deux notions
concident. En dimension infinie, V0 est un sous-espace vectoriel strict de V .

12

Lespace de Hilbert

Dfinition 1.8 Soit un K-espace vectoriel V de dimension finie. Soit


L(V, K), lensemble de toutes les formes linaires f : V K. Dotons cet
ensemble dune loi de composition interne additive et dune loi de composition
externe multiplicative :
f, g L(V, K),

(f + g)(v) = f (v) + g(v)

K, f L(V, K),

(f )(v) = f (v)

Alors L(V, K) est lui aussi un K-espace vectoriel que nous appellerons
l espace dual (algbrique) de V et que nous dnoterons par V .
Convention. Selon la dfinition 1.8, V est un espace vectoriel bona
fide et ses lments sont des vecteurs qui mritent dtre dnots par
des caractres gras. Nous allons faire exception cette rgle et nous nous
contenterons de dsigner les formes linaires de lespace dual par des lettres
minuscules de lalphabet latin sans avoir recours aux caractres gras.
Remarque. Intuitivement toutefois, il semble oprationnellement justifiable de maintenir une diffrence entre un espace de vecteurs dune part et
un espace de formes linaires de lautre. Cest pourquoi, si nous continuerons
dappeler vecteurs les lments de V, partir de maintenant, les lments
de lespace dual V seront dsigns par lappellation covecteurs 7 .

Thorme 1.5 Soit un K-espace vectoriel V de dimension finie n et


{v1 , v2 , . . . , vn } une base de V. Soit de plus {f1 , f2 , . . . , fn } un ensemble de
covecteurs de lespace dual V tels que :
(
1 si i = j
i, j = 1, . . . , n
fi (vj ) = ij =
(1.6)
0 si i 6= j
Alors {f1 , f2 , . . . , fn } est une base de V .
Remarques.
1. On dit que la base {f1 , f2 , . . . , fn } de covecteurs de V est la base duale
des vecteurs {v1 , v2 , . . . , vn } de V.
7. Cette distinction est justifie par le fait que les coordonnes des vecteurs et des
covecteurs se transforment de faon inverse : de faon contravariante pour les premiers et
de faon covariante pour les seconds.

1.3

Les espaces pr-hilbertiens

13

2. Le symbole ij est le delta de Kronecker. En pratique, il arrive souvent


quun des indices est fixe (indice rel ) alors que lautre varie librement
(indice muet). Un exemple typique de lutilisation du delta de Kronecker dans une sommation (ici lindice j est rel) serait :
X

ai ij = aj

Une consquence directe du thorme 1.5 est que lespace V est lui aussi
n-dimensionnel et donc isomorphe V :
V
= V
Puisque les espaces de dimension finie V et V sont isomorphes, il existe
toujours une correspondance biunivoque entre leurs lments. Nous verrons
que si lespace V est un espace pr-hilbertien, il est possible dtablir cette
correspondance biunivoque laide du produit scalaire. La mthode stend
aux espaces de dimension infinie, mais cette fois lisomorphisme est tabli
entre V et son dual topologique V0 .

1.3

Les espaces pr-hilbertiens

Pour le lecteur press qui dsire acqurir le minimum de notions ncessaires une comprhension rapide de linformatique quantique, cette section
est sans doute la plus importante du chapitre. Il devra toutefois souffrir une
dfinition redondante du produit scalaire dont le seul but est de faire ressortir
les diffrences qui existent entre les cas rel et complexe.

1.3.1

Le produit scalaire

Il est grand temps de doter nos espaces vectoriels dun produit scalaire,
ce qui nous permettra dintroduire la notion dorthogonalit. Commencons
par dfinir le produit scalaire euclidien.

14

Lespace de Hilbert

Dfinition 1.9 Soit V un espace vectoriel sur le corps des rels R.


Lapplication h , i :
h , i : V V R
qui vrifie les conditions suivantes :
u, v, w V

hu , v + wi = hu , vi + hu , wi

u, v V, R

(1.7a)

hu , vi = hu , vi

(1.7b)

u, v V

hu , vi = hv , ui

(1.7c)

v V

hv , vi > 0

(1.7d)

v V

hv , vi = 0 = v = 0

(1.7e)

est un produit scalaire euclidien sur V.


Les quations 1.7a, 1.7b et 1.7c peuvent tre combines pour donner :
hu , v + wi = hu , vi + hu , wi = hu , vi + hu , wi

(1.8a)

et
hv + w , ui = hu , v + wi = hu , vi + hu , wi
= hu , vi + hu , wi = hv , ui + hw , ui

(1.8b)

Nous voyons bien que lapplication h , i est linaire relativement chacunes de ses variables ; nous disons alors que h , i est une forme bilinaire.
Par 1.7c, h , i est symtrique, par 1.7d et 1.7e, h , i est dfinie positive.
En conclusion, le produit scalaire euclidien est une forme bilinaire, symtrique et dfinie positive.
Lingalit de Cauchy-Schwartz dcoule directement des conditions imposes au produit scalaire :
|hu , vi|2 6 hu , uihv , vi

(1.9)

Remarque. Le symbole de valeur absolue dans le membre de gauche de


lingalit est superflu puisque nous avons affaire ici un produit scalaire
euclidien ; nous le conservons quand mme par soui de compatibilit avec
le produit scalaire hermitien o il sera alors interprt comme le module du
nombre complexe h u | v i.
Dfinition 1.10 Nous dirons que deux vecteurs u et v sont orthogonaux si :
hu , vi = 0
La relation dorthogonalit entre deux vecteurs sexprime aussi symboliquement par u v.

1.3.1

15

Le produit scalaire

La dfinition 1.10 implique que le vecteur 0 est orthogonal tout vecteur


de V.
Remarque. Le fait que hu , wi = hv , wi nimplique pas ncessairement
que u = v mais bien que u v w.
Soient u = (u1 , u2 , . . . , un ) et v = (v1 , v2 , . . . , vn ), deux n-uplets de Rn .
Le produit scalaire canonique sur Rn est dfini par :
hu , vi = u1 v1 + u2 v2 + + un vn

(1.10)

Il est facile de dmontrer que les conditions 1.7a 1.7e sont bien remplies.
Puisque hu , ui et hv , vi sont des quantits relles positives pour des
vecteurs u et v non-nuls, nous pouvons reformuler lingalit de CauchySchwartz en extrayant la racine carre de 1.9 :
0 6 |hu , vi| 6

p
p
hu , ui hv , vi

hu , vi
p
16 p
61
hu , ui hv , vi

(1.11a)

(1.11b)

Cette dernire ingalit sert dfinir langle entre deux vecteurs non-nuls :
= arccos p

hu , vi
p
hu , ui hv , vi

(1.12)

o 0 6 6 , ( est un angle saillant non-orient).


La dfinition du produit scalaire hermitien se poursuit selon des lignes
similaires mais accuse toutefois des diffrences notables. Les identits de base
des nombres complexes sont numres au mdaillon de la Fig. 1.11. Voici
par ailleurs un bref rappel terminologique :
z est le conjugu complexe de z
|z| est le module 8 de z
8. La notation |z| est utilise aussi bien pour les nombres complexes que pour les
nombres rels. Dans ce dernier cas, elle signifie une valeur absolue.

16

Lespace de Hilbert

Dfinition 1.11 Soit V un espace vectoriel sur le corps des nombres


complexes C. Lapplication h | i :
h|i : V V C
qui vrifie les conditions suivantes :
u, v, w V
u, v V, C
u, v V

hu|v + wi = hu|vi + hu|wi


h u | v i = h u | v i
hu|vi = hv|ui

(1.13a)
(1.13b)
(1.13c)

v V

h v | v i R et h v | v i > 0

(1.13d)

v V

h v | v i = 0 = v = 0

(1.13e)

est un produit scalaire hermitien sur V.


Remarque. La premire chose noter est que la forme h | i nest plus
symtrique proprement parler mais possde plutt la proprit de symtrie
hermitienne (1.13c). La deuxime chose noter est que h | i nest plus une
forme bilinaire. En effet, en combinant 1.13a, 1.13b et 1.13c, nous obtenons :

h u | v + w i = h u | v i + h u | w i = h u | v i + h u | w i

(1.14a)

et
h
i
h v + w | u i = h u | v + w i = h u | v i + h u | w i
h
i
= h u | v i + h u | w i = h u | v i + h u | w i
= h v | u i + h w | u i
(1.14b)
Nous sommes maintenant en prsence dune forme qui est linaire par
rapport la deuxime variable et semi-linaire par rapport la premire.
Nous dirons alors que le produit scalaire hermitien est une forme sesquilinaire 9 .
La sesquilinarit permet de prserver la positivit du produit scalaire
hermitien. En effet, v V :
h iv | iv i = i ih v | v i = i2 h v | v i = h v | v i
9. Cette expression veut dire de faon trs littrale : une fois et demie linaire.

1.3.1

Le produit scalaire

17

Une forme bilinaire aurait plutt donn h iv | iv i = h v | v i, nous gratifiant dun signe moins particulirement fcheux. Enfin, la mention explicite
h v | v i R en 1.13d nest quune instance de renforcement positif puisque
par 1.13c, nous avons toujours h v | v i = h v | v i , ce qui constitue la dfinition mme dun nombre rel.
Convention. La dfinition de sesquilinarit donne plus haut est celle
que lon retrouve habituellement dans les textes de physique. Les ouvrages
mathmatiques inversent la plupart du temps lordre des variables, soit linaire par rapport la premire et semi-linaire par rapport la seconde.
Dans cet ouvrage, nous nous en tiendrons la convention utilise en physique.
En rsum, le produit scalaire hermitien est une forme sesquilinaire,
hermitienne et dfinie positive.
Le produit scalaire hermitien satisfait lui aussi lingalit de CauchySchwartz :
|h u | v i|2 6 h u | u ih v | v i

(1.15)

Remarquez que, contrairement la formule 1.9, les barres verticales sont


maintenant obligatoires puisque, pour un produit scalaire hermitien, h u | v i
est gnralement un nombre complexe. Le membre de gauche de lingalit
1.15 reprsente donc le carr du module du nombre complexe h u | v i, soit
h u | v ih u | v i (voir lidentit 7 du mdaillon de la Fig. 1.11).
Le produit scalaire canonique sur Cn est dfini par :
h u | v i = u1 v1 + u2 v2 + + un vn

(1.16)

Si la notion dorthogonalit demeure valide pour deux vecteurs dun espace vectoriel hermitien, ce nest plus le cas pour la notion dangle puisque
le numrateur de lexpression :
hu|vi
p
p
hu|ui hv|vi
nest plus ncessairement un nombre rel. Il est toujours permis dutiliser le
symbole u v, mais cela ne saurait insinuer daucune faon que les vecteurs
font un angle droit entre eux.
Dfinition 1.12 Un espace vectoriel V dot dun produit scalaire est
un espace pr-hilbertien ( V, h | i ).

18

Lespace de Hilbert

Convention. Nous navons plus de raisons de maintenir artificiellement


deux notations diffrentes pour indiquer dune part un produit scalaire euclidien h , i et de lautre un produit scalaire hermitien h | i. Dsormais, seule
la notation h u | v i 10 aura cours lgal.
Dans un espace pr-hilbertien, le produit scalaire nous permet toujours
dtablir une correspondance biunivoque entre les vecteurs de V et les formes
linaires de lespace dual V .
Thorme 1.6 Soit V, un K-espace pr-hilbertien de dimension finie
et V , son dual algbrique.
Alors pour toute forme linaire f V , il existe un unique vecteur u V
tel que :
f (v) = h u | v i,
v V
Nous diffrerons la preuve de ce thorme au chapitre 2. Pour linstant
nous conviendrons que dans un espace pr-hilbertien de dimension finie,
tout vecteur u de lespace V correspond un unique covecteur fu h u | i de
V et vice-versa 11 .

1.4

Les espaces vectoriels norms

Les espaces pr-hilbertiens vus jusqu prsent demeurent des structures


algbriques plutt limites car, outre laddition vectorielle et la multiplication
scalaire, tout ce quils nous permettent de faire, cest de vrifier lorthogonalit de ses lments, pris deux deux. Mme la notion de grandeur dun
vecteur sy trouve absente.
Mais il ne faudrait pas sous-estimer la riche potentialit de lespace prhilbertien. En effet, le produit scalaire permet dinduire une norme qui ellemme induit une mtrique qui elle-mme gnre une topologie de sorte quen
un clin doeil nous nous retrouvons avec une structure complexe qui supporte
de nombreuses applications.
Cest cet enchanement que nous nous proposons dtudier, en commenant par la notion de norme qui nous permettra de dfinir une grandeur
pour chaque vecteur de lespace.
10. Cette notation a lavantage dtre compatible avec la notation de Dirac (section 1.8).
11. En notation de Dirac, le covecteur fu est simplement reprsent par le bra h u |.

1.4

19

Les espaces vectoriels norms

Dfinition 1.13 Soit V, un espace pr-hilbertien sur le corps des complexes. Lapplication k k :
kk : V R
qui vrifie les conditions suivantes :
v V

kvk > 0

v V

k v k = 0 = v = 0

(1.17b)

k v k = || k v k

(1.17c)

v V, C
u, v V

(1.17a)

ku + vk 6 kuk + kvk

(1.17d)

est une norme sur V et (V, k k) est un espace vectoriel norm.


Remarque. Par 1.17a et 1.17b, la norme est une forme dfinie positive.
Cependant, cette forme nest pas linaire, mais respecte plutt lingalit de
Minkowski 12 (1.17d).
Remarque. Lingalit 1.17a nest pas indpendante car elle peut tre
dduite des trois conditions subsquentes. Dabord, on constate que limplication dans la condition 1.17b est valide dans les deux sens. En effet, puisque
v V, on a 0 = 0v, alors la condition 1.17c nous donne :
k 0 k = k 0v k = |0|k v k = 0
Par la suite, on a que v V :
0 = k 0 k = k v v k 6 k v k + k v k
6 k v k + | 1| k v k

par 1.17b et 1.17d


par 1.17c

6 2 kvk
do il est clair que k v k > 0. Son inclusion nest quune simple mesure de
renforcement.
Dfinition 1.14 Tout vecteur v dont la norme est de grandeur unit :
kvk = 1
est appel vecteur unitaire.
On peut associer une norme tout produit scalaire. Pour cela, il suffit
de prendre :
kvk =

hv|vi

12. Communment appele ingalit triangulaire.

(1.18)

20

Lespace de Hilbert

Remarque. Cette dfinition de la norme est consistante puisque par


1.13d, h v | v i est toujours un rel dfini positif.
Cette norme associe donne lingalit de Cauchy-Schwartz 1.11a sa
forme la plus lgante :
|h u | v i| 6 k u k k v k

(1.19)

Les conditions 1.17a, 1.17b et 1.17c sont immdiatement vrifies. Lingalit de Minkowski se dmontre facilement laide de lingalit de CauchySchwartz (qui ne dpend que de lexistence dun produit scalaire).
Dmonstration.
k u + v k2 = h u + v | u + v i
= hu|ui + hu|vi + hv|ui + hv|vi
= k u k2 + h u | v i + h u | v i + k v k2
= k u k2 + 2 < ( h u | v i ) + k v k2
2

par 1B-4g
2

6 k u k + 2 |< ( h u | v i )| + k v k

Mais puisque pour tout nombre complexe z, nous avons |<(z)| 6 |z|,
k u + v k2 6 k u k2 + 2|h u | v i| + k v k2
6 k u k2 + 2k u kk v k + k v k2

par 1.19

6 (k u k + k v k)

Extrayant la racine carre des deux cts, nous retrouvons lingalit de


Minkowski.
La troisime ligne de la dmonstration ci-dessus contient le germe du
thorme de Pythagore :
hu|vi = 0

k u + v k2 = k u k2 + k v k2

La norme drivant du produit scalaire usuel sur Rn est appele norme


euclidienne,
q
(1.20)
k v k = v12 + v22 + + vn2
et la norme drivant du produit scalaire usuel sur Cn est appele norme
hermitienne.
p
p
k v k = v1 v1 + v2 v2 + + vn vn = |v1 |2 + |v2 |2 + + |vn |2 (1.21)

1.4

21

Les espaces vectoriels norms

Si tout produit scalaire nous pouvons associer une norme, linverse par
contre nest pas ncessairement vrai. Par exemple, la norme uniforme k k ,
applique ici un vecteur de coordonnes :
k v k = sup |vi |

(1.22)

ne drive daucun produit scalaire.


Il est facile de dmontrer quune norme drivant dun produit scalaire
hermitien doit respecter lidentit du paralllogramme :
k u + v k2 + k u v k2 = 2( k u k2 + k v k2 )

(1.23)

Si tel est le cas et que pour tout vecteur v la valeur k v k correspondante est connue, lidentit de polarisation permet de reconstituer le produit
scalaire hermitien :
1
h u | v i = ( k u + v k2 k u v k2 + i k u + iv k2 i k u iv k2 ) (1.24)
4
La norme drivant dun produit scalaire 1.18 est unique. linverse, une
norme qui respecte lidentit du paralllogramme 1.23 dtermine un produit
scalaire 1.24 qui est unique lui aussi.
Deux normes diffrentes dfinies sur un mme espace vectoriel sont toutefois considres quivalentes si elles engendrent une mme topologie sur cet
espace 13 . Le critre suivant est utilis pour dterminer lquivalence entre les
normes.
Dfinition 1.15 Soit V un espace vectoriel et k k1 , k k2 , deux normes
diffrentes sur ce mme espace. Ces normes sont dites quivalentes sil existe
des nombres rels , > 0 tels que :
k v k1 < k v k2 < k v k1
v V.
Note. On dmontre que, pour un R-espace vectoriel ou un C-espace vectoriel norm de dimension finie, toutes les normes sont quivalentes, quelles
soient induites par un produit scalaire ou non. Ce nest pas le cas pour un
espace de dimension infinie.
13. Les notions de topologie et despace topologique sont expliques lannexe 1.C.

22

Lespace de Hilbert

1.5

Les espaces mtriques

Un espace mtrique est un couple (X, d) o X est un ensemble quelconque, pas ncessairement un espace vectoriel, et d est une fonction qui
dfinit une notion de distance entre chaque paire dlments de X.
Dfinition 1.16 Soit X un ensemble non vide. La fonction d(, ) :
d(, ) : X X R
qui vrifie les conditions suivantes :
x, y X
x, y X

d(x, y) > 0

(1.25a)

d(x, y) = 0 x = y

(1.25b)

x, y X

d(x, y) = d(y, x)

(1.25c)

x, y, z X

d(x, y) 6 d(x, z) + d(z, y)

(1.25d)

est une mtrique ou distance sur X et (X, d) est un espace mtrique.


Remarque. Lingalit 1.25a nest pas indpendante car elle peut tre
dduite des trois conditions subsquentes. En effet,
0 = d(x, x) 6 d(x, y) + d(y, x)
6 2 d(x, y)

par 1.25b et 1.25d


par 1.25c

do il est clair que d(x, y) > 0. Son inclusion nest quune simple mesure de
renforcement.
Note. Il est possible de doter nimporte quel ensemble X dune mtrique
en utilisant la distance triviale (espace mtrique trivial) :
(
1 si x 6= y
d(x, y) =
0 si x = y
Aussi, il est possible de dfinir plusieurs mtriques sur un mme ensemble.
Par exemple, la mtrique suivante :
d0 (x, y) =

d(x, y)
1 + d(x, y)

limite la distance entre deux points lintervalle semi-ouvert [0,1).

1.5

23

Les espaces mtriques

Un espace mtrique (X, d) est une instance dun espace plus gnral, soit
un espace topologique. Les lments dun espace topologique sont gnralement appels tout simplement des points.
Une boule ouverte est un sous-ensemble particulier dun espace mtrique,
trs utile pour construire une topologie sur lespace.
Dfinition 1.17 Soit x, un point quelconque de lespace mtrique (X, d)
et r > 0, un nombre rel quelconque. Lensemble de tous les points qui sont
situs une distance de x qui soit infrieure r forme une boule ouverte
B(x, r) de centre x et de rayon r :
B(x, r) = {y | d(x, y) < r, r > 0}
Si lensemble X possde la structure despace vectoriel, les points de
lespace mtrique (X, d) se confondent avec les vecteurs de X. Laddition
vectorielle permet alors laddition de points dans (X, d), ce qui nest pas
toujours le cas pour un espace mtrique plus gnral (X, d). Si, de plus,
lespace vectoriel est norm, alors la norme son tour induit une mtrique :
d(x, y) = k x y k

(1.26)

Il est alors trivial de vrifier que cette mtrique associe la norme


satisfait toutes les conditions de la dfinition 1.16 et quelle possde en
plus la proprit dinvariance translationnelle :
x, y, z X,

d(x + z, y + z) = d(x, y)

(1.27)

La mtrique associe la norme euclidienne 1.20 dans Rn est videmment


la mtrique ou distance euclidienne :
v
u n
p
uX
2
2
d(x, y) = (x1 y1 ) + + (xn yn ) = t (xi yi )2

(1.28)

i=1

Selon 1.27, cette distance est indpendante du choix de lorigine. De plus,


on dmontre que cette distance est invariante pour une rotation quelconque
du systme de coordonnes.
Un vecteur dont lorigine se confond avec lorigine du repre cartsien est
appel vecteur position. Dans un espace mtrique Rn , la norme dun vecteur
position est donc gale la distance euclidienne entre lextrmit du vecteur
position et lorigine du repre (soit le vecteur 0).

24

Lespace de Hilbert

R2

z2

2i

(y1 , y2 )

z1

(x1 , x2 )

i
p

|z2 z1 |2 < r

(y1 x1 )2 + (y2 x2 )2 < r

(a)

Figure 1.3 Boules ouvertes

d(x, 0) =

2
(b)

a) dans R2

b) dans C

q
p
(x1 0)2 + + (xn 0)2 = x21 + + x2n = k x k

La mtrique ou distance hermitienne associe la norme hermitienne


1.21 dans Cn est dfinie de faon analogue :
p
(x1 y1 ) (x1 y1 ) + + (xn yn ) (xn yn )
v
u n
uX
=t
|xi yi |2

d(x, y) =

(1.29)

i=1

Lorsque la mtrique est associe une norme, cette dernire suffit


rendre convenablement la notion de distance . Par exemple, la boule ouverte B(x, r) peut tre redfinie de faon quivalente :
B(x, r) = {y : k y x k < r, r > 0}

(1.30)

La Fig. 1.3 illustre le concept de boule ouverte dans les espaces R2 et


C o la mtrique utilise est respectivement euclidienne et hermitienne. La
gnralisation des espaces de dimension finie n ne pose aucun problme.
Ceci complte la rvision des notions dalgbre linaire sur les espaces
de dimension finie. Le lecteur dsireux dapprofondir les fondements mathmatiques de la mcanique quantique est invit poursuivre la lecture des

1.6

Les espaces de Hilbert de dimension infinie

25

prochaines sections, notes par un astrisque, qui traitent en dtail des aspects plus techniques de lespace de Hilbert.
Le lecteur plus press peut se donner bonne conscience en consultant
lencadr intitul "Sommaire excutif" pour un briefing clair avant de passer
directement la section 1.6.5 qui traite des bases hilbertiennes.
Sommaire excutif
Tous les espaces vectoriels de mme dimension finie sont isomorphes.
Toutes les normes dfinies sur un mme espace vectoriel de dimension finie sont quivalentes.
Les normes quivalentes engendrent toutes une mme topologie.
Tous les espaces pr-hilbertiens de dimension finie dots de la
topologie usuelle sont sparables.
Tous les espaces pr-hilbertiens de dimension finie sont complets.
Tous les espaces de Hilbert sparables de dimension infinie sont
isomorphes.
Lespace du qubit est C2 .
Aucune quation vue jusqu prsent nest plus importante que
celle du produit scalaire hermitien canonique :
h u | v i = u1 v1 + u2 v2 + + un vn

1.6

Les espaces de Hilbert de dimension infinie

Dans un espace de dimension infinie, les considrations algbriques ne


suffisent plus et nous devons obligatoirement faire appel lanalyse.

1.6.1

Topologie usuelle sur les espaces mtriques*

Note. Si les espaces mtriques peuvent acclrer lapprentissage des notions topologiques, il demeure que les rsultats obtenus ne sont pas toujours
valides pour des espaces plus gnraux. Dun point de vue pdagogique, il
est prfrable dintroduire ces notions en vitant sciemment de faire appel
une mtrique quelconque. Cest ce que nous avons fait lannexe 1.C o lon
retrouvera toutes les dfinitions de base. Veuillez prendre note que nous ferons frquemment rfrence aux rsultats gnraux de lannexe tout au long

26

Lespace de Hilbert

de cette section.
En nous servant de Rn comme exemple, nous entendons maintenant dfinir une topologie standard sur tout espace mtrique. Il sagit de la
topologie usuelle, soit celle qui sera gnralement sous-entendue lorsque lon
travaillera dornavant avec tout espace mtrique.
Tous les ouverts de cette topologie proviennent de lunion de boules ouvertes dont nous reprenons ici la dfinition :
B(x, r) = {y | d(x, y) < r, r > 0}
Nous affirmons que lensemble de toutes les boules ouvertes B(x, r), o
x Rn et r > 0 constitue une base topologique de lespace Rn .
Remarquez que, puisque r est strictement plus grand que zro, la topologie
usuelle nadmet aucun point isol 14 ; toute boule ouverte contient une infinit
(non dnombrable) de points.
Nous allons dmontrer, dans un premier temps, que pour tout point appartenant une boule ouverte, il existe une autre boule ouverte contenant
ce point, elle-mme contenue dans la premire. Soit un point quelconque
y B(x, r). Alors, par dfinition, d(x, y) < r. Posons
r0 = r d(x, y) > 0
et dmontrons que B(y, r0 ) B(x, r).
Supposons que z B(y, r0 ). Alors d(y, z) < r0 = r d(x, y), de sorte
que :
d(x, y) + d(y, z) < r
Il en dcoule, par 1.25d, que d(x, z) < r, ou encore que z B(x, r) et
par consquent, que B(y, r0 ) B(x, r) (voir Fig. 1.4).
Avec ce rsultat, nous avons fait dune pierre deux coups. Nous avons dmontr que le choix de la boule ouverte en tant quouvert pour la topologie
usuelle est logiquement consistant puisque par la proposition 1C.1, une boule
ouverte est bien un voisinage de chacun de ses points. Dautre part, le thorme 1C.5 confirme que lensemble de toutes les boules ouvertes constitue
bien une base topologique de Rn .
Pour se donner bonne conscience, nous allons prouver que lensemble
de toutes les boules ouvertes respecte bien les axiomes qui dfinissent une
topologie. Par le thorme 1C.6, Rn et appartiennent bien la topologie
usuelle puisque lunion de tous les lments de la base est un recouvrement
14. Un point x est un point isol si le singleton {x} est un ouvert.

1.6.1

Topologie usuelle sur les espaces mtriques*

27

B(x, r)
r
z
B(y, r0 )

r0 y

Figure 1.4 Toute boule ouverte B(x, r) est un voisinage de chacun de ses
points.
ouvert de lespace et lintersection de deux boules disjointes donne lensemble
vide.
Dmontrer que lunion de deux boules ouvertes (ou mme une union
quelconque de boules ouvertes) donne aussi un ouvert ne prsente aucune
difficult.
Nous poursuivons en dmontrant que lintersection de deux boules ouvertes donne bien un ouvert. Soient deux boules ouvertes B(a, r1 ) et B(b, r2 ).
Supposons que les deux deux boules ne soient pas disjointes et soit x, un point
quelconque de B(a, r1 ) B(b, r2 ). Alors x B(a, r1 ) et par ce qui prcde, il
existe une boule ouverte B(x, r10 ) telle que B(x, r10 ) B(a, r1 ). Dune faon
toute similaire, nous avons aussi que B(x, r20 ) B(b, r2 ). De deux choses
lune : ou bien nous avons r10 6 r20 ou bien r20 6 r10 . Supposons, sans perte de
gnralit, que r10 6 r20 . Alors, B(x, r10 ) B(x, r20 ) B(b, r2 ).
Puisque B(x, r10 ) B(a, r1 ) et B(x, r10 ) B(b, r2 ), il en dcoule que
B(x, r10 ) B(a, r1 ) B(b, r2 ). En posant r10 = r, nous venous de dmontrer
que tout point x appartenant lintersection de deux boules ouvertes appartient aussi une boule ouverte elle-mme entirement contenue dans ladite
intersection (voir Fig. 1.5) :
x B(x, r) B(a, r1 ) B(b, r2 )
Puisque x est quelconque, lintersection de deux boules ouvertes est un voisinage de chacun de ses points, donc un ouvert.
Ce rsultat peut tre tendu toute intersection finie de boules ouvertes.
Remarquez que lintersection quelconque de boules ouvertes ne donne pas

28

Lespace de Hilbert

B(a, r1 )

B(b, r2 )

B(x, r)
x
b

Figure 1.5 Si le point x est tel que x B(a, r1 ) et x B(b, r2 ), alors il


existe une boule ouverte B(x, r) telle que B(x, r) B(a, r1 ) B(b, r2 ).
ncessairement un ouvert. Par exemple, lintersection des boules ouvertes
appartenant la famille {B(x, n1 ) | n N} donne le singleton {x} qui nest
pas un ouvert 15 .
La base constitue de lensemble de toutes les boules ouvertes engendre
une topologie unique que nous dsignerons par Td pour souligner le fait que
les ouverts de la base sont tributaires dune mtrique 16 . Notons que le choix
de la mtrique dtermine aussi la forme gomtrique des ouverts de cette
base (voir Fig. 1.6). Mais indpendamment de lallure de la boule ouverte
unitaire, nous entenderons toujours par (X, Td ) un espace mtrique dot de
la topologie usuelle.
1

(a)

(b)

(c)

Figure 1.6 En (a), la mtrique est d1 (x, y) = p


|x1 x2 | + |y1 y2 |. En
(b) la mtrique est euclidienne, soit d2 (x, y) =
(x1 x2 )2 + (y1 y2 )2 .
En (c), on a d (x, y) = sup{|x1 x2 |, |y1 y2 |}. La boule ouverte unitaire
B( (0, 0), 1) dans R2 est trace pour chacun des cas.
15. En fait, on peut dmontrer que le singleton {x} est un ferm de la topologie usuelle.
16. On dit alors que Td est la topologie engendre par la mtrique d.

1.6.1

Topologie usuelle sur les espaces mtriques*

29

Notons en particulier que pour la droite des rels R, la base de la topologie


usuelle consiste de lensemble de tous les intervalles ouverts de type (a, b) o
a < b et, pour le plan R2 , de lensemble de tous les cercles ouverts.
Nous allons maintenant reprendre certaines notions de topologie gnrale
pour en tirer des caractrisations spcifiques aux espaces mtriques munis de
la topologie usuelle, en commencant par la notion de continuit locale. En se
rfrant la remarque qui suit la dfinition 1C.9, lexpression lapplication
F est continue en a ssi la primage de tout voisinage de F (a) est un voisinage
de a se traduit dans le langage des espaces mtriques par la primage de
toute boule ouverte BY (F (a), r2 ) contient une boule ouverte BX (a, r1 ) . En
analyse, il est courant de poser r1 = et r2 = , de sorte que la dfinition de
la continuit en un point dune application prend la formulation delta-epsilon
bien connue :
Dfinition 1.18 Soient deux espaces mtriques (X, Td1 ) et (Y, Td2 ) et
soit F : X Y , une application quelconque.
Nous dirons que F est continue en a X ssi :
,

tel que

d1 (x, a) < = d2 (F (x), F (a)) < 

Lapplication F est continue partout sur X si elle est continue en tout point
a X.
Pour le lecteur qui a tudi les fonctions relles de la variable relle, nous
faisons remarquer que la distance euclidienne sur R se rduit la valeur
absolue. Dans ce contexte, la continuit en un point a dune fonction f
prend lallure familire suivante :
,

tel que

|x a| < = |f (x) f (a)| < 

Nous verrons un peu plus loin quil est possible de faire encore mieux
et de donner une caractrisation squentielle de la continuit locale pour les
espaces mtriques 17 .
Dans un espace mtrique, nous avons aussi le loisir de caractriser la
notion de convergence laide de la mtrique. Le fait que toute boule ouverte
B(x, ) doit contenir tous les lments de la suite (xn )nN sauf, au maximum,
un nombre fini, se traduit par :
17. Ceci est possible d au fait que les espaces mtriques vrifient automatiquement le
premier axiome de dnombrabilit.

30

Lespace de Hilbert

Dfinition 1.19 Soit (X, Td ), un espace mtrique. Nous dirons que la


suite (xn )nN converge vers le point x X ssi :
 > 0, N N

tel que

d(x, xn ) < 

n > N

Remarque. De faon gnrale, plus petite est la valeur de , plus grande


est la valeur correspondante de N et il est coutumier de reconnatre cette
dpendance en crivant explicitement N ().
Pour terminer, voici un exemple instructif de deux espaces mtriques qui
sont topologiquement quivalents.
Exemple 1.8. Soit lespace topologique (R, Td ) dot de la topologie
usuelle. Soit maintenant le sous-espace topologique qui consiste de lintervalle
ouvert (0, 1) sur lequel la topologie usuelle est induite. Nous allons dmontrer
que ces deux espaces sont isomorphes.
En effet, la fonction f : R (0, 1) et sa rciproque f 1 : (0, 1) R
dfinies par :
1
1
arctan x +

2
1
f 1 (y) = tan (y )
2
f (x) =

sont toutes deux des bijections continues. f est donc un isomorphisme et,
par consquent, (R, Td )
= ((0, 1), Td (0, 1)).

1.6.2

Les espaces complets*

Dans un espace mtrique, on peut aussi reformuler la dfinition dune


partie dense laide de la mtrique.
Dfinition 1.20 Soit (X, Td ), un espace mtrique. Un sous-ensemble
A X est dense en X ssi :
x X,  > 0, a A tel que d(x, a) < 
Remarque. La dfinition 1.20 nous informe que toute boule ouverte
contient au moins un lment de A :
B(x, ) A 6=

1.6.2

31

Les espaces complets*

Exemple 1.9. Le sous-ensemble des nombres rationnels Q est une partie dense de (R, Td ) puisque tout intervalle ouvert centr sur nimporte quel
point x R contiendra toujours un nombre rationnel diffrent de x (une
infinit en fait). Lensemble des irrationnels R\Q est aussi une partie dense
de (R, Td ).
Lavantage majeur de travailler avec des espaces mtriques provient du
fait que ces espaces nous permettent de caractriser toutes les notions topologiques importantes en nutilisant que les limites de suites convergentes.
Cest ce que nous nous proposons de faire en commencant par la notion
dadhrence.
Thorme 1.7 Soit (X, Td ), un espace mtrique. Dans un tel espace,
un point x X est un point adhrent une partie non-vide A X ssi il
existe une suite (xn )nN entirement contenue dans A et qui converge vers
x. Dans un espace mtrique, ladhrence de A est dfinie par :
A = {x X | (xn )nN A

t.q.

lim xn = x}

Dmonstration. Il faut montrer que la dfinition gnrale 1C.18 de ladhrence se ramne la forme quivalente donne ci-haut dans le cas particulier
dun espace mtrique 18 .
=
Lespace mtrique (X, Td ) vrifie le premier axiome de dnombrabilit 19 . Pour tout x X, la famille B(x) = {Bn (x, n1 ) | x R, n N}
constitue une base locale douverts embots. Supposons que x A ; alors
tout ouvert G contenant x rencontre A. Ceci est vrai en particulier pour tout
lment de la base locale en x, c.--d. :
n N,

Bn (x, n1 ) A 6=

Choississons un point dans chacune de ces intersections :


x1 B1 (x, n1 ) A, x2 B2 (x, n1 ) A, . . . , xn Bn (x, n1 ) A, . . .
La suite x1 , x2 , . . . , xn , . . . est entirement contenue dans A. Et puisque tout
ouvert Bn (x, n1 ) de la base locale contient tous les lments de la suite, sauf
peut-tre les n 1 premiers, il sensuit que limn xn = x. En jetant un
coup doeil sur la dfinition 1C.20 dune base locale, nous constatons que :
G T t.q. x G, G A 6= = (xn )nN A t.q.
18. Prenez note que cette preuve utilise laxiome du choix.
19. Nous anticipons ici sur un des rsultats de la section 1.6.3.

lim xn = x

32

Lespace de Hilbert

= Sil existe une suite convergente (xn )nN entirement contenue


dans A telle que limn xn = x, alors daprs la dfinition 1.19 de mme
que la dfinition de la boule ouverte :
 > 0, N N tel que xn B(x, ) n > N
Ce que nous aimerions, bien entendu, cest davoir tous les xn Bn (x, n1 ).
Qu cela ne tienne, en choisissant N 0 tel que N 0 > N et N 0 > 1 , nous
obtenons :
 > 0, N 0 N tel que xn Bn (x, n1 ) n > N 0
Donc  > 0, aussi petit soit-il, il existe toujours un lment de la base locale
en x qui contient tous les lments de la suite convergente, sauf peut-tre un
nombre fini de ceux-ci. Puisque B(x) est une base locale, alors tout ouvert
G contenant x contient lui aussi un lment de cette base locale douverts
embots. Il sensuit que tout ouvert G contenant x contient aussi tous les
lments de la suite (xn )nN sauf peut-tre un nombre fini dentre eux. Mais
puisque tous les lments de cette suite appartiennent A, nous devons
conclure que :
(xn )nN A t.q.

lim xn = x = G T t.q. x G, G A 6=

Pour tout espace topologique, dire que A est dense en X revient dire
que A = X. Par ce qui prcde, dans un espace mtrique, A est dense en X
ssi tout point de lespace X est la limite dune suite convergente entirement
contenue dans A 20 .
Remarque. Il est bon de rappeler que ladhrence A ne peut contenir
que trois types de points :
(i) Les points isols appartenant A. Rappelons que les seules suites qui
convergent vers ces points isols sont de type a1 , . . . , ak , a, a, a, a, . . . .
(ii) Les points daccumulation de A qui appartiennent A.
(iii) Les points daccumulation de A qui nappartiennent pas A. Ces
points daccumulation doivent toutefois appartenir lespace X.
Encore devons-nous prendre conscience que la notion de convergence qui
nous a servi jusqu maintenant accuse une faiblesse notable : pour quelle
20. Notez que ceci est diffrent que daffirmer que toute suite convergente entirement
contenue dans A converge vers un point x de lespace X !

1.6.2

33

Les espaces complets*

soit pleinement fonctionnelle elle exige la connaissance a priori de la limite


x, ce qui nest pas toujours naturel et vident. Nous profiterions dun critre
nous permettant de prospecter des limites sans ressentir le besoin de
connatre au pralable leurs valeurs prcises. Cest ce nous offre le critre de
convergence de Cauchy.
Dfinition 1.21 Soit (X, Td ), un espace mtrique. Nous dirons que la
suite (xn )nN est une suite de Cauchy ssi :
 > 0, N N

tel que

d(xm , xn ) < 

m, n > N

Thorme 1.8 Toute suite convergente dans (X, Td ) est une suite de
Cauchy.
Dmonstration. Soit (xn )nN , une suite convergente dans (X, Td ) telle que
limn xn = x. Alors pour un 2 > 0, il existe un N tel que pour m, n > N ,
d(xm , x) <


2

et

d(xn , x) <


2

Le reste suit facilement.


d(xm , xn ) 6 d(xm , x) + d(xn , x) <



+ =
2 2

par 1.25d

linverse, il ne faudrait pas sempresser de clamer que toute suite de


Cauchy qui soit entirement contenue dans (X, Td ) est une suite convergente
dans (X, Td ). Le problme vient du fait que, si le critre de Cauchy nous
certifie la prsence dun point limite, il ne nous garantit pas que ce point
limite fasse partie de lespace topologique ! Cest dailleurs la raison qui nous
amne dfinir la notion de compltude.
Dfinition 1.22 Un espace mtrique (X, Td ) est dit complet si toute
suite de Cauchy converge vers un point limite contenu dans lespace.
Exemple 1.10. Lespace des nombres rationnels (Q, Td ) nest pas complet. Par exemple, considrons la suite des sommes partielles (sn )nN o :
sn =

n
X
(1)k
1 1 1
(1)n
= 1 + + +
2k + 1
3 5 7
2n + 1
k=0

Puisque pour tout m, n > 1


2 , nous avons d(sm , sn ) < , il sagit bien dune
suite de Cauchy. Or si tous les lments de la suite sont des rationnels, la
/ Q.
limite converge vers un nombre irrationnel puisque limn sn = 4

34

Lespace de Hilbert

Exemple 1.11. Lespace des nombres rels (R, Td ) est complet. Dans R,
toute suite de Cauchy converge vers un nombre rel. Lensemble des nombres
complexes C est lui aussi complet. Dans C, toute suite de Cauchy converge
vers un nombre complexe.
De faon image, on peut dire que le critre de Cauchy nous permet
dexaminer le tissu de lespace pour vrifier la prsence de trous . Les
espaces qui ne sont pas complets possdent leur lot dinconvnients quheureusement nous ne serons pas obligs de subir. Mais auparavant, une autre
petite dfinition est de mise.
Dfinition 1.23 Soient deux espaces mtriques (X, TdX ) et (Y, TdY ).
Nous appellerons toute bijection I : X Y qui prserve les distances, c.--d.
telle que x1 , x2 X :
dX (x1 , x2 ) = dY (I(x1 ), I(x2 ))
une isomtrie. Deux espaces (X, TdX ) et (Y, TdY ) sur lesquels on peut dfinir
une isomtrie sont dits isomtriquement isomorphes.
tre isomtriquement isomorphe est une relation dquivalence.
Remarque. Deux espaces isomtriquement isomorphes sont considrs
comme tant mathmatiquement identiques. Si lisomtrie ne peut tre tablie que sur une partie de Y , on parlera plutt de plongement isomtrique
de X dans Y . On considre alors X comme tant un sous-espace de Y .
Exemple 1.12. Les espaces mtriques (C, | |) et (R2 , k k) sont isomtriquement isomorphes puisque lapplication I : C R2 dfinie par
I(z) = (<(z), =(z)) est une isomtrie.
T ) est le complt dun esDfinition 1.24 Un espace mtrique (X,
d
pace mtrique (X, Td ) ssi :
o X
est une partie de X.

1) X est isomtriquement isomorphe X

2) X est dense dans X.


T ) est complet.
3) Lespace (X,
d
Thorme 1.9 Tout espace mtrique peut tre complt. Cette compltion est unique un isomorphisme isomtrique prs.
La dmonstration de ce thorme ne prsente pas de difficults majeures
mais elle est quand mme assez longue pour quil soit prfrable de la relguer

1.6.3

35

Les espaces sparables*

aux exercices de fin de chapitre. Le lecteur peut accepter dogmatiquement le


dans
fait quil soit toujours possible de trouver un espace mtrique complet X
lequel on puisse plonger X. Le fait que X soit isomtriquement isomorphe
implique que limage (par isomtrie) de toute suite convergente dans X
X
dont la limite est dans X.
Grossirement,
est une suite convergente dans X
cette procdure vise boucher les trous de lespace original.
Exemple 1.13. Lespace mtrique (R, Td ) est le complt de (Q, Td ).
Q est videmment dense en R. Ceci nest pas un accident puisque tout
nombre rel peut tre considr comme la limite dune suite de Cauchy de
nombres rationnels, une procdure visant justement boucher les trous de
lensemble Q.
Veuillez noter que la compltude nest pas une proprit topologique. En
effet, la suite :
1 1 1
1
(sn )nN = , , , . . . ,
,...
2 3 4
n+1
nest pas complte en (0, 1) puisque le point limite (zro) ne fait pas partie
de lintervalle ouvert. Par contre, cette suite est complte dans (R, Td ) et
puisque (R, Td )
= ((0, 1), Td (0, 1)) (voir lexemple 1.8), il est clair que la
compltude nest pas une proprit topologique.

1.6.3

Les espaces sparables*

Pour tout espace mtrique dot de la topologie usuelle, la condition


pour quil soit aussi un espace de Hausdorff sexprime ainsi : si x1 et x2
sont deux points de lespace, alors il est toujours possible de trouver deux
boules ouvertes B(a, r1 ) et B(b, r2 ) telles que x1 B(a, r1 ), x2 B(b, r2 )
et B(a, r1 ) B(b, r2 ) = . De fait, rien ne nous empche de choisir x1 et
x2 pour centre de chacune des boules ouvertes ; dans ce cas, nous navons
qu nous assurer que B(x1 , r1 ) B(x2 , r2 ) = . Il suffit alors de prendre
pour r1 et r2 toute valeur 0 < r 6 d(x12,x2 ) . En effet, posons  = d(x1 , x2 )
et r1 = r2 = 2 . Procdons par reductio ad absurdum et supposons que
B(x1 , 2 ) B(x2 , 2 ) 6= . Dans ce cas, il existe un x qui appartient la
fois B(x1 , 2 ) ainsi qu B(x2 , 2 ), ce qui revient dire que d(x1 , x) < 2 et
d(x2 , x) < 2 . Mais daprs lingalit de Minkowski,
d(x1 , x2 ) 6 d(x1 , x) + d(x, x2 ) <


2


2

=

ce qui contredit le fait que d(x1 , x2 ) = . Donc, B(x1 , 2 ) B(x2 , 2 ) = et


lespace est de Hausdorff. Par consquent :

36

Lespace de Hilbert

Tout espace mtrique (X, Td ) est un espace de Hausdorff.

x1 r1
B(a, r1 )

B(b, r2 )
r2

x2

Figure 1.7 Un espace mtrique (X, Td ) possde la proprit suivante :


pour toute paire de points x1 et x2 , on peut toujours trouver deux boules
ouvertes disjointes B(a, r1 ) et B(b, r2 ) telles que x1 B(a, r1 ), x2 B(b, r2 )
et B(a, r1 ) B(b, r2 ) = . Tout espace mtrique est un espace de Hausdorff.
Puisque selon le thorme 1C.12, toute suite convergente dans un espace
de Hausdorff converge vers une limite unique, le rsultat suivant simpose de
lui-mme.
Toute suite convergente dans un espace mtrique (X, Td ) nadmet
quune seule limite.
Les espaces mtriques dots de la topologie usuelle vrifient tous le premier axiome de dnombrabilit. Il suffit en effet de choisir, pour chaque point
x de lespace, la base locale B(x) = {Bn (x, n1 ) | x R, n N} constitue
dune suite dnombrable de boules ouvertes concentriques dont le rayon tend
ventuellement vers zro.
Tout espace mtrique (X, Td ) vrifie le premier axiome de
dnombrabilit.
Puisque les espaces mtriques vrifient le premier axiome de dnombrabilit, dans leurs cas, les notions de continuit et de continuit squentielle
sont strictement quivalentes.

1.6.3

37

Les espaces sparables*

Proposition 1.10 Soient deux espaces mtriques (X, TdX ) et (Y, TdY )
et soit F : X Y , une application quelconque.
Alors F est continue en x X ssi F est squentiellement continue en
x X et :
lim xn = x
lim F (xn ) = F (x)
n

Nous serions presque ports croire demble que tout espace mtrique
(X, Td ) vrifie le second axiome de dnombrabilit, mais ce nest pas toujours
le cas. Une condition additionnelle simpose :
Proposition 1.11 Tout espace mtrique (X, Td ) qui est sparable vrifie le second axiome de dnombrabilit.
Lespace mtrique (R, Td ) est minemment sparable puisquil contient
une partie dense dnombrable, soit Q, lensemble des rationnels. Et puisque
le produit cartsien de toute famille finie densembles dnombrables est dnombrable, tous les espaces de dimension finie Rn et Cn sont aussi sparables.
Les espaces Rn et Cn munis de la topologie usuelle vrifient le
second axiome de dnombrabilit.
Puisque, par dfinition, les espaces qui vrifient le second axiome de dnombrabilit possdent une base topologique dnombrable, il sensuit que :
Les espaces Rn et Cn munis de la topologie usuelle possdent une
base topologique dnombrable.
Quelles sont les bases dnombrables privilgies pour les espaces (Rn , Td )
et (Cn , Td ) ? Prenons R2 par exemple. Alors :
n 
o
1
B = Bn (q1 , q2 ),
| q1 , q2 Q, n N
n
est une base dnombrable 21 constitue de toutes les boules ouvertes dont
les coordonnes du centre et le rayon sont des nombres rationnels. Le mme
principe demeure valide pour les espaces de dimension suprieure.
Lnonc suivant nous renseigne sur le nombre maximum de points que
peut contenir un espace de Hilbert.
Tout espace mtrique base topologique dnombrable possde au
plus la puissance du continu.
21. Pour C, il suffit de prendre B = {Bn ((q1 + i q2 ), n1 ) | q1 , q2 Q, n N}.

38

Lespace de Hilbert

La cardinalit de tout espace de Hilbert de dimension infinie est donc 1


(aleph-un), soit la puissance du continu.

1.6.4

Les espaces vectoriels topologiques

Les espaces topologiques, et plus particulirement les espaces mtriques,


dont nous avons traits jusqu prsent ntaient pas ncessairement dots de
structures algbriques supplmentaires. partir de maintenant, nous nous
intresseront aux espaces topologiques qui sont la fois des espaces vectoriels.
Les espaces de Banach constituent une catgorie importante de tels espaces :
Un espace vectoriel norm complet pour la norme est un espace de
Banach.
Par lexpression complet pour la norme nous entendons bien sr
complet pour la mtrique associe la norme . Dans un espace de Banach, la notion de norme prend nettement la prsance sur la notion de mtrique et il est dusage de tout ramener cette premire. Ainsi, la topologie
engendre par la norme Tk k est en fait la topologie engendre par la mtrique
associe la norme et il sera toujours sous-entendu que d(x, y) = k x y k
et que Tk k quivaut la topologie usuelle Td .
Les notions de convergence 1.19 et de continuit 1.18 peuvent aussi tre
ramenes la norme. Ainsi, dans un espace vectoriel norm, nous dirons que
la suite (xn )nN converge vers le point x ssi :
 > 0, N N tel que k x xn k <  n > N

(1.31a)

et que lapplication F : (X1 , k k1 ) (X2 , k k2 ) est continue en a X1 ssi :


,

tel que

k x a k1 < = k F (x) F (a) k2 < 

(1.31b)

Un espace de Hilbert est une instance particulire dun espace de Banach


qui tire sa norme dun produit vectoriel.
Un espace pr-hilbertien sparable et complet pour la norme est
un espace de Hilbert.
Lespace de Banach est toutefois plus gnral puisque sa norme nest pas
ncessairement issue dun produit scalaire de sorte que la notion de vecteurs
orthogonaux ny est pas dfinie, contrairement lespace de Hilbert 22 . De
plus, un espace de Hilbert se doit dtre sparable, c.--d. de possder une
partie dnombrable dense.
22. On peut toutefois dfinir une notion dorthogonalit entre un espace de Banach et
son dual topologique.

1.6.4

Les espaces vectoriels topologiques

39

Convention. Un espace de Hilbert sera toujours dnot par H.


Nous pouvons nous prvaloir du fait que lespace de Hilbert est implicitement un espace mtrique, pour lequel la continuit et la continuit squentielle sont des notions quivalentes, et simplifier davantage les expressions
1.31a et 1.31b en laissant tomber la notation - pour celle de la limite dune
suite. partir de maintenant, nous conviendrons dcrire :
convergence :
critre de Cauchy :
continuit

lim k x xn k = 0

(1.32a)

lim k xm xn k = 0

(1.32b)

n
m
n

lim k x xn k1 = 0 = lim k F (x) F (xn ) k2 = 0

(1.32c)
Remarque. Nous utiliserons lexpression convergence en norme lorsque
nous sommes en prsence de la condition 1.32a.
Exercice 1.1. Dmontrez que si la suite (xn )nN converge en norme
vers x, alors lim k xn k = k x k.
n

Dmonstration. Par 1.17c et 1.17d, les ingalits suivantes sont toujours vrifies :
k x k 6 k x xn k + k xn k
k xn k 6 k x xn k + k x k
Par hypothse nous avons lim k x xn k = 0. Prenant la limite des deux
n
ingalits ci-dessus, nous obtenons :
k x k 6 lim k xn k
n

et

lim k xn k 6 k x k

Par consquent, lim k xn k = k x k.


n

Exercice 1.2. Dmontrez la bicontinuit du produit scalaire hermitien


dans un espace de Hilbert.
Dmonstration. Soient deux suites (xn )nN et (ym )mN qui convergent respectivement vers les points (vecteurs) x et y de lespace de Hilbert H dot
du produit scalaire h | i : H H C. Par 1.32a, nous avons :
lim k x xn kH = 0

et

lim k y ym kH = 0

40

Lespace de Hilbert

Par 1.17a et 1.17d, nous avons :


0 6 k h x | y i h xn | ym i kC
6 k h x | y i h xn | y i kC + k h xn | y i h xn | ym i kC
6 k h x xn | y i kC + k h xn | y ym i kC
Nous profitons ensuite du fait que la norme hermitienne
sur

 C est gale au

module dun nombre complexe soit k z kC = zz = |z| , ce qui nous offre


une excellente opportunit dutiliser lingalit de Cauchy-Schwartz 1.19 :
0 6 k h x | y i h xn | ym i kC 6 | h x xn | y i | + | h xn | y ym i |
6 k x xn kH k y kH + k xn kH k y ym kH
Il ne nous reste plus qu passer la limite, ce qui donne :
06

lim k h x | y i h xn | ym i kC 6 0 k y kH + k x kH 0 = 0

m,n

o nous avons utilis le rsultat de lexercice prcdent. Nous avons ainsi


prouv que :

lim k x xn kH = 0
n
= lim k h x | y i h xn | ym i kC = 0
m,n
lim k y ym kH = 0
m

ce qui dmontre la bicontinuit du produit scalaire.


Remarque. La bicontinuit du produit scalaire permet de faire passer
lopration de prise de limite lintrieur du produit scalaire sans autre
forme de procs :
lim h xn | ym i = h lim xn |

m,n

= hx|

lim ym i

lim ym i = h x | y i

Il en va de mme pour la norme associe :


lim k xn k = k lim xn k = k x k

1.6.4.1

Lespace dual topologique

La continuit tant un des concepts centraux de la topologie, il convient


de dfinir le dual topologique dun espace de dimension infinie comme tant

1.6.5

41

Les bases hilbertiennes

lensemble de toutes les formes linaires continues sur V, soit Lc (V, K). Nous
utiliserons la notation V0 pour indiquer le dual topologique de V.
Le fait Lc (V, K) L(V, K), ou que V0 soit un sous-ensemble strict de
ne pose pas de problmes en dimension infinie, puisque les ensembles
infinis ont tous la proprit dtre quipotents certaines de leurs parties 23 .
V0 et V ont donc tous deux la mme cardinalit (soit la puissance du continu
si V est un espace de Hilbert de dimension infinie).
V

La bicontinuit du produit scalaire obligeant, le thorme 1.6 demeure


valide en dimension infinie, la condition de remplacer le dual algbrique par
le dual topologique V0 . Ainsi, tout vecteur u V correspond une unique
forme linaire continue fu = h u | i V0 , et inversement.

1.6.5

Les bases hilbertiennes

Avant daborder le vif du sujet de cette section, nous allons tout dabord
tablir un certain nombre de rsultats dans des espaces de dimension finie.
De tous les espaces de dimension infinie, lespace de Hilbert est certes celui
qui saccommode le mieux de lextrapolation nave des rsultats algbriques
obtenus sur des espaces de dimension finie.
Nous allons maintenant porter notre attention sur les familles de vecteurs
non-nuls, deux deux orthogonaux {ui }iI , h ui | uj i = 0, i 6= j, qui constituent une famille orthogonale. Dans un premier temps, nous ne considrerons
que des familles orthogonales finies.

Proposition 1.12 Soit une famille orthogonale finie {u1 , . . . , uN } de


vecteurs dun espace vectoriel norm. Alors :

N
X

ui


i=1

2
N

X

=
k ui k2

(1.33)

i=1

De plus, les vecteurs {u1 , . . . , uN } sont linairement indpendants.

23. Par exemple, lapplication n 7 2n entre lensemble des entiers naturels N et lensemble des entiers naturels pairs tablit une bijection entre les deux ensembles ; ils possdent donc tous deux la mme cardinalit mme si lun est strictement inclus dans lautre.

42

Lespace de Hilbert

Dmonstration.

N
X

ui


i=1

2 *
N

X

ui
=

i=1


+
N
N X
N
X
X

uj =
h ui | uj i


j=1

i=1 j=1

N
X

N
X

i=1

i=1

h ui | ui i =

k ui k2

Prenons maintenant une combinaison


linaire quelconque de cette famille
PN
orthogonale et galons-l zro, i=1 i ui = 0. Alors :
N
X

0=
i ui

i=1

2
N
N

X
X

2
=
k

u
k
=
|i |2 k ui k2

i i

i=1

i=1

Cette dernire galit nest possible que si tous les termes (positifs) de la
somme sont nuls, c.--d. si chaque |i |2 k ui k2 = 0. Mais puisquaucun des
vecteurs nest nul, tous les scalaires i se doivent de ltre. Par consquent,
les vecteurs sont linairement indpendants.
Remarque. Lquation 1.33 propose une version N -dimensionnelle du
thorme de Pythagore.
Une famille orthonormale (ou famille orthonorme) est une famille orthogonale o en plus tous les vecteurs sont unitaires.
Convention. Nous utiliserons souvent les symboles e ou ei pour identifier des vecteurs unitaires et {ei }iI , avec h ei | ej i = ij pour reprsenter
une famille orthonormale.
Passer dune famille orthogonale une famille orthonormale est un jeu
denfant ; il suffit en effet de diviser chaque vecteur de la famille orthogonale
par sa norme :
ui
ei =
k ui k
En pratique, il arrive souvent quon ait notre disposition une famille
de vecteurs qui soient linairement indpendants sans tre ncessairement
orthogonaux. Nous verrons un peu plus loin quil est toujours possible den
extraire une famille orthonormale grce lalgorithme de Gram-Schmidt.
Soit {e1 , . . . , eN }, une base orthonorme dun espace de Hilbert de dimension finie N . Puisque tout vecteur x dun espace vectoriel fini peut tre

1.6.5

43

Les bases hilbertiennes

dcompos selon les vecteurs de base, nous pouvons toujours crire :


x=

N
X

i ei

(1.34)

i=1

Le produit scalaire nous permet de trouver une expression pour chaque i :


* N
+
X

h ei | x i = ei
j ej

j=1

N
X

j h ei | ej i =

j=1

N
X

j ij

j=1

= i
Ainsi, les coordonnes du vecteur x dans cette base orthonorme sont
donns par :
i = h ei | x i
(1.35)
et tout vecteur de lespace se dcompose selon :
x=

N
X
h ei | x i ei

(1.36)

i=1

Si on prend la norme des deux cts de lquation 1.34, quon llve au


carr et quon applique ensuite le rsultat 1.33, on obtient immdiatement :
k x k2 =

N
X

|i |2

(1.37)

i=1

Une dernire relation trs utile est lidentit de Parseval :


hx|yi =

N
X

h x | ei ih ei | y i

i=1

Dmonstration. La dcomposition 1.36 nous permet de poser :


+
*N

X

hx|yi =
h ei | x iei y

=

i=1
N
X

N
X

i=1

i=1

h ei | x i h ei | y i =

h x | ei ih ei | y i

(1.38)

44

Lespace de Hilbert

Notons que lquation 1.37 nest quun cas particulier de lidentit de


Parseval 1.38 obtenue en posant y = x.
Nous consacrerons le restant de cette section dmontrer que, dans un
espace de Hilbert de dimension infinie, les quations 1.36, 1.37 et 1.38 demeurent valides si lon remplace N par . Mais dabord, nous allons
exaP
miner la signification dexpressions telle que {ei }iI ou encore
iI i ei .
Dans le cas le plus gnral, lensemble dindices I peut tre fini, dnombrable ou non dnombrable, mais nous allons anticiper ici sur la proposition
1.18 et restreindre notre champ dinvestigation aux familles orthonormes
dnombrables. Lorsque la famille orthonorme est dnombrable, nous pouvons toujours identifier I N, comme nous en avons lhabitude lorsquil sagit
dune suite.
P
P
Mais substituer {ei }iN pour {ei }iI ou
iI i ei ne
i=1 i ei pour
fait que dplacer le problme puisque le concept algbrique de combinaison
linaire ne sapplique, par dfinition, qu un nombre fini de vecteurs. En
effet, si B = {ei }iN est une famille orthonorme dnombrable, alors lespace
vectoriel engendr par B est lensemble des combinaisons linaires finies des
lments de B :

X

N


Vect(B) =
i ei N < , i K
(1.39)
i=1

Une premire tape consiste donc complter Vect(B). Mais encore


faut-il dabord prciser la notion de convergence dans un espace vectoriel de
dimension infinie.
Nous allons commencer par dvelopper sparment le concept dune srie
de vecteurs. Supposons que nous sommes en prsence dune famille dnombrable de vecteurs {i ei }iN dans un espace pr-hilbertien de dimension
infinie. Quelle signification doit-on donner lexpression suivante ?

i ei

i=1

Intuitivement, il serait tout naturel de ramener la convergence dune


srie de
Pnvecteurs la convergence en norme de la suite des sommes partielles
sn = i=1 i ei :

n


X
X


(1.40)
i ei = lim sn = v
lim v
i ei = 0
n
n

i=1

i=1

mais encore faut-il composer avec un dtail technique supplmentaire : la


srie doit converger quel que soit lordre dans lesquels les termes sont pris

1.6.5

45

Les bases hilbertiennes

et la somme de la srie ne doit pas non plus dpendre de lordre des termes.
Ceci est consistant avec le fait que si lon veut quun vecteur reprsente une
quantit physique, il ne doit pas dpendre de la base que lon choisit pour le
dcrire. Nous imposons donc la condition supplmentaire :

i ei = v

: N N,

i=1

(i) e(i) = v

i=1

o est une permutation quelconque, c.--d. une bijection de N dans luimme. En langage clair, nous dirons alors que la srie de vecteurs se doit de
converger commutativement. Heureusement pour nous, le thorme suivant
vient notre rescousse.
Thorme 1.13 Soit {ei }iN , une famille
Porthonorme dnombrable
dans un espace de Hilbert.
La srie de vecteurs i=1 i ei converge en norme
P
2
k
dans H ssi la srie
i=1 i ei k converge absolument dans R :

i ei = v H

i=1

k i ei k2 <

i=1

Une srie qui converge dans R et dont tous les termes sont non-ngatifs
converge absolument et la convergence ne dpend alors pas de lordre dans
lequel les termes ont t pris ; autrement dit, une srie qui converge absolument, converge aussi commutativement.
Ayant dispos de ce lger dtail technique, nous pouvons utiliser le thorme 1.9 pour complter Vect(B) et ainsi obtenir notre espace de Hilbert H.
Un des effets secondaires de la compltion est que Vect(B) est maintenant
dense dans le complt, ce qui sexprime mathmatiquement par :

x H,  > 0,

N
X
i=1

i ei Vect(B)

t.q.


N

X

i ei
x

i=1




<

Cette condition satisfait le critre intuitif de convergence de la suite des


sommes partielles nonc en 1.40.
Toutes ces considrations nous amnent la dfinition suivante dune
base hilbertienne 24 :
24. Une base hilbertienne est une base vectorielle de lespace de Hilbert, essentiellement
une famille de points, ne jamais confondre avec la base topologique du mme espace qui,
elle, est une famille douverts.

46

Lespace de Hilbert

Dfinition 1.25 Une famille B = {ei }iI est une base hilbertienne
dun espace de Hilbert H ssi :
1) la famille B est orthonorme.
2) Vect(B) est dense dans H.
Remarque. Dire que Vect(B) est dense dans H quivaut dire que
ladhrence de lespace vectoriel engendr par B est lespace H lui-mme :
Vect(B) = H.

(1.41)

Cette dfinition dune base hilbertienne, soit une famille orthonorme


dont lensemble des combinaisons linaires est dense dans son complt demeure un peu abstraite. Nous demandons au lecteur de faire preuve dun
peu de patience car nous nous acheminons srement vers le thorme 1.19
qui affirme justement que nous sommes en prsence dune base hilbertienne
que si et seulement si nous pouvons remplacer N par dans les quations
1.36, 1.37 et 1.38 ! Mais auparavant, nous devons encore tablir certaines
dfinitions et rsultats intermdiaires importants.
Proposition 1.14 (Ingalit de Bessel) Soit une famille orthonormale
{ei }iI au plus dnombrable dans un espace de Hilbert H. Alors x H :
X
|h ei | x i|2 6 k x k2
(1.42)
iI

Dmonstration. Dmontrons dabord lingalit pour le cas o I est fini.


Pour allger lcriture, nous utiliserons lgalit 1.35, soit i = h ei | x i.

2 *

+
N
N
N



X
X
X



h ej | x i ej
06 x
h ei | x i ei = x
h ei | x i ei x



i=1
j=1
i=1
+ *N
N
+
* N
+ *N

X
X
X
X



i ei
j ej
j ej
i ei x +
6 hx|xi x



j=1

6 hx|xi

N
X

j h x | ej i

j=1

6 k x k2

N
X
j=1

j j

i=1

i=1

N
X

i h ei | x i +

i=1
N
X
i=1

i i +

N X
N
X
i=1 j=1

N
X
j=1

j j

j=1

i j h ei | ej i

1.6.5

Les bases hilbertiennes

47

ce qui dmontre lingalit de Bessel pour tout N < .


N
X

|i |2 6 k x k2

(1.43a)

i=1

Supposons maintenant que I soit dnombrable. Puisquune srie positive


converge ssi la suite des sommes partielles est borne, nous pouvons directement passer la limite en 1.43a et crire :

|i |2 6 k x k2

(1.43b)

i=1

Dici la fin de cette section, il sera beaucoup question de sous-espaces


ferms dun espace de Hilbert.
Dfinition 1.26 Une partie W dun espace de Hilbert H est un sousespace ferm ssi :
1. W est un sous-espace vectoriel de H.
2. W contient tous ses points dadhrence.
Remarque. La condition que W contienne tous ses points dadhrence
revient dire que W se confond avec son adhrence, soit W = W. Par (i)
de lexercice 1C.1, W est donc un ferm.
Dans un espace de Hilbert, ferm et complet sont des concepts interchangeables, ce qui nest gnralement pas le cas puisque le premier est un
concept extrinsque alors que le second est un concept intrinsque.
En effet, ladhrence dune partie A est toujours contenue dans lespace
initial, A X, mme si X nest pas complet puisque ladhrence ne vise que
les suites dont les limites appartiennent X. Les suites de Cauchy qui ne
et dans cet espace,
convergent pas dans X convergeront dans le complt X,
leurs points limites feront partie de ladhrence de A. Dans un tel cas, le
; le concept de
ferm A dans X nest pas le mme que le ferm A dans X
ferm est un concept relatif et extrinsque.
Dun autre ct, toute partie A qui est complte se suffit elle-mme et ne
dpend pas, pour fins de compltude, dun quelconque sur-espace dans lequel
elle serait ventuellement plonge. Dans ce sens, le concept de compltude
est un concept absolu et intrinsque.
Ce quil faut retenir ici, cest que tout sous-espace ferm de Hilbert est
automatiquement complet.

48

Lespace de Hilbert

Il serait opportun ici de dfinir le complment orthogonal (ou simplement


lorthogonal) dun ensemble.
Dfinition 1.27 Soit une partie A H. Le complment orthogonal de
A, dnot A , est constitu de lensemble des vecteurs orthogonaux tous
les lments de A, soit :
A = {v H | h v | w i = 0,

w A}

Exercice 1.3. Soit H, un espace de Hilbert. Dmontrez que pour toutes


parties A, B H :
1) A est un sous-espace ferm.
2) A B = B A .
.
3) A = (A)

4) A (A ) .
Dmonstration.
1) Nous devons dabord dmontrer que A est un sous-espace vectoriel,
c.--d. stable par combinaison linaire. Soient u et v, deux vecteurs
quelconques de A . Alors, pour tous scalaires , C et tout w A :
h u + v | w i = h u | w i + h v | w i = 0 + 0 = 0
Ainsi, u + v A et A est donc un sous-espace vectoriel.
Dmontrons maintenant que A contient tous ses points dadhrence.
Considrons une suite de Cauchy (vn )nN quelconque et entirement
contenue dans A . Par la compltude de lespace de Hilbert, cette suite
converge vers un point v H. Nous utilisons la continuit du produit
scalaire pour dmontrer que v appartient aussi A :
h v | w i = h lim vn | w i = lim h vn | w i = 0
n

Donc, v A et puisque A contient tous ses points dadhrence, il


sagit bien dun ferm. A est bien un sous-espace ferm.
2) Soit x B , nous allons dmontrer que x A .
x B revient dire que h x | y i = 0, y B. Mais z A, on a
que z B. Donc, z A on a aussi que h x | z i = 0. Par consquent,
x A .

1.6.5

49

Les bases hilbertiennes

A . Il nous
3) Puisque A A par 1C-3, il dcoule par 2) que (A)

. Le thorme 1.7, adapt aux espaces


reste dmontrer que A (A)
de Hilbert, donne :
A = {x H | (xn )nN A

t.q.

lim xn = x}

Soient x A et y A . Puisque la suite (xn )nN est entirement


comprise dans A, nous avons
n N,

h y | xn i = 0

Par la continuit du produit scalaire, il sensuit que h y | x i = 0 et donc


, on a A (A)
.
. Puisque y A = y (A)
que y (A)
, c.--d. quune partie quelconque
Nous en concluons que A = (A)
gnre donc le mme complment orthogonal que son adhrence.
4) x A et y A , on a h y | x i = 0. Par symtrie, h x | y i = 0, et
x A, x (A ) . Do, A (A ) .
Si les rsultats de lexercice 1.3 sont valides pour toutes parties quelconques A, B de H, parties qui ne sont ni ncessairement des sous-espaces
vectoriels ni mme des ferms, il demeure que ce sont les sous-espaces ferms de H qui mriteront exclusivement notre attention. La raison en est
simple : en effet, il nest pas trop difficile de dmontrer que tout sous-espace
dun espace mtrique sparable est lui-mme sparable (voir problme 1.28)
et on sait que tout sous-espace ferm dun espace de Hilbert est complet.
Par consquent, tout sous-espace ferm dun espace de Hilbert constitue en
lui-mme un espace de Hilbert de plein droit.
Par la suite, lorsque nous parlerons dun sous-espace dun espace de Hilbert, il sera toujours sous-entendu quil sagit dun sous-espace ferm.
Thorme 1.15 Soit B, un sous-espace ferm de H. Alors pour tout
x H, il existe un point unique y B tel que :
k x y k = inf{ k x z k | z B}
Remarque. Linfimum de { k x z k | z B} tablit la distance du
point x au sous-espace B. Remarquez que cette distance est non-nulle que
ssi x 6 B.
Convention. Pour le reste de cette section, nous ferons grand usage des
notations suivantes. Si B = {ei }iI est une famille orthonormale au plus
dnombrable dun espace de Hilbert H, et x un point quelconque de H,
alors :

50

Lespace de Hilbert

df.

B =
=
= Vect(B)
X
df.
xB =
=
=
h ei | x i ei

(1.44a)
(1.44b)

iI

Rappelons que selon le thorme 1.1, Vect(B) est un sous-espace vectoriel de H. Si lensemble B est fini, alors Vect(B) = Vect(B) = B, puisque
tout espace vectoriel de dimension finie est complet. Par la proposition 1.12,
les vecteurs de la famille B sont linairement indpendants, et puisquils engendrent B, ils en constituent une base. Notons quen dimension finie, la
notion de base hilbertienne se confond avec celle de base orthonorme.
Si B est dnombrable, alors Vect(B) est dfini suivant 1.39. Daprs la
dfinition 1.25, B est alors une base hilbertienne de B.
Notons
enfin que xB est bien dfini. En
P
P effet, le thorme 1.13 nous dit
que iI h ei | x i ei converge dans H ssi iI k h ei | x i ei k2 converge dans
R. Or cest toujours le cas puisque par lingalit de Bessel 1.42 :
X
X
k h ei | x i ei k2 =
|h ei | x i|2 6 k x k2 <
iI

iI

Exercice 1.4. Soit B = {ei }iI , une famille orthonormale au plus dnombrable dun espace de Hilbert H. Soit x, un point quelconque de H.
Dmontrez :
1) B = B .
2) xB B.
3) x xB B .
4) k x xB k 6 k x z k, pour tout z B.
5) k xB k2 6 k x k2 .
Dmonstration.
1) Puisque B B, on a que B B par 2) de lexercice 1.3.
Soit x B ; alors i I, h x | ei i = 0. Soit maintenant y Vect(B) ;
alorsP
il existe une combinaison linaire finie des vecteurs de B telle que
y= N
i=1 i ei . Mais dans ce cas,
hx|yi = hx|

N
X
i=1

i ei i =

N
X

i h x | ei i = 0

i=1

et x Vect(B) . Mais Vect(B) = Vect(B) par 3) de lexercice


1.3. Do, B B . Par consquent, B = B .

1.6.5

51

Les bases hilbertiennes

2) Si I est fini, alors xB est une combinaison linaire finie des vecteurs
de B. Donc xB Vect(B) et xB B puisque tout espace vectoriel de
dimension finie est complet.
Si I est dnombrable, alors chaque lment de la suite des sommes
partielles
n
X
sn =
h ei | x iei
i=1

est dans Vect(B). Puisque par 1C-3, Vect(B) Vect(B),


P chaque sn
est aussi dans B. Et puisque B est complet, la limite
i=1 h ei | x iei
appartient aussi B. Donc dans tous les cas, xB B.
3) Il suffit de noter que j, h xB | ej i = h x | ej i. En effet,
+
*

X
X

h ei | x i ei ej =
h xB | ej i =
h ei | x i h ei | ej i

iI
iI
X
=
h x | ei i ij = h x | ej i
iI

Il en dcoule directement que j, h x xB | ej i = 0.


Puisque x xB est orthogonal chacun des vecteurs de B, il sensuit
que xxB B . Mais B = B par 1). Par consquent, xxB B .
4) Puisque xB B par 2), il demeure vrai que z B, xB z B. Par
le rsultat prcdent, x xB B . Donc, z B et x H :
k x z k2 = k x xB + xB z k2 = k x xB k2 + k xB z k2 par 1.33
Il sensuit naturellement que :
0 6 k x xB k 2 6 k x z k 2
ou encore, en extrayant la racine carre :
k x xB k 6 k x z k

d(x, xB ) 6 d(x, z)

en faisant appel la mtrique associe. Puisque lgalit nest possible


que si k xB z k = 0, c.--d. que si z = xB , nous retenons que quels
que soient les points x H et z B, xB est lunique point de B qui
minimise la distance au point x.
5) Puisque x = (x xB ) + xB , il sensuit que :
k x k2 = k x xB k2 + k xB k2

par 1.33

52

Lespace de Hilbert
Le rsultat dsir dcoule immdiatement. Prenez note que lexpression
k xB k2 6 k x k2 nest videmment quune formulation alternative de
lingalit de Bessel 1.42.

Si lon conjugue le thorme 1.15 avec le rsultat 4) de lexercice 1.4,


il est clair que xB = inf{ k x z k | z B}. Ceci justifie la dfinition de
lapplication PB : H B, dite de projection orthogonale (voir Fig. 1.8) :
X
PB (x) = xB =
h ei | x i ei
(1.45)
iI

Nous dirons de faon quivalente que xB est la meilleure approximation de


x dans B, c.--d. :
X
X
kx
h ei | x iei k 6 k x
i ei k, i K
iI

iI

lgalit nayant lieu que si i = h ei | x i, i I.


Il est facile de vrifier que PB est une application linaire continue. Nous
aurons encore beaucoup dire propos des projecteurs orthogonaux dans
le chapitre sur les oprateurs de lespace de Hilbert.

xB

xB

Figure 1.8 Projection orthogonale du point x sur le sous-espace ferm B,


PB (x) = xB . De tous les points de B, seul xB minimise la distance du point
x au sous-espace B. Le vecteur x xB rside dans B , avec H = B B .
Exercice 1.5. Soit un sous-espace ferm B dun espace de Hilbert H.
Dmontrez :

1.6.5
1)
2)
3)
4)

53

Les bases hilbertiennes


B B = {0}.
H = B B .
B = (B ) .
H = {0} et

{0} = H.

Dmonstration.
1) Pour tout x B B , on doit avoir h x | x i = 0. Par 1.13e, ceci
implique que x = 0. Donc, B B = {0}.
2) Pour tout x H, on a x = PB (x) + (x PB (x)) o PB (x) B et
(x PB (x)) B . Donc H = B + B . Combinant ce rsultat avec 1),
on obtient H = B B .
Tout vecteur x H peut donc tre dcompos de manire unique en
une partie contenue dans B et en une partie perpendiculaire B.
3) Nous avons dj dmontr que B (B ) par 4) de lexercice 1.3.
Nous allons maintenant dmontrer que (B ) B.
Soit x (B ) . On a toujours x = PB (x) + (x PB (x)). Notons que
le terme (x PB (x)) (B ) puisquil est une combinaison linaire
de x (B ) (par hypothse) et de PB (x) B (B ) . Mais on a
aussi que (x PB (x)) B par 3) de lexercice 1.4.
Donc, (x PB (x)) B (B ) . Par 1) de cet exercice, cela implique
que (x PB (x)) {0} et donc que x = PB (x) B. Do, (B ) B
et il sensuit que B = (B ) .
4) x H, on a x = x + 0 o x H et 0 {0}. Donc H = H + {0}.
Dun autre ct, on a que H {0} = {0}. Par la proposition 1.3, il
dcoule que H = H {0}. En posant B = H dans 2), on obtient
directement que H = {0}
De plus, {0} = (H ) = H par 3).
Nous proposons maintenant de dmontrer lalgorithme de Gram-Schmidt.
Soit une famille de vecteurs linairement indpendants {vi }iI . Puisque cette
famille ne peut contenir le vecteur 0, nous pouvons toujours poser :
e1 =

e2 =
e3 =

v1
k v1 k

v2 h e1 | v2 i e1
k v2 h e1 | v2 i e1 k

v3 h e2 | v3 i e2 h e1 | v3 i e1
k v3 h e2 | v3 i e2 h e1 | v3 i e1 k

54

Lespace de Hilbert
et, de faon gnrale :
vn

n1
P

h ei | vn i ei
i=1

en =
n1

P
vn
h ei | vn i ei

i=1

(1.46)

Il va sans dire que e1 est une combinaison linaire de v1 , et inversement.


Nous laissons au lecteur le soin de vrifier que e2 est une combinaison linaire
de v1 et v2 ( linverse, v2 est une combinaison linaire de e1 et e2 ) et par
consquent que lexpression v2 h e1 | v2 i e1 6= 0 (Pourquoi ?). Il sensuit
que e2 est bien dfini et unitaire. On vrifiera aussi que h e1 | e2 i = 0.
Supposons maintenant que pour k {1, 2, . . . , n 1} chaque ek est une
combinaison linaire des v1 , v2 , . . . , vk et que la famille {e1 , e2 , . . . , en1 }
est une famille orthonormale. Nous dmontrons alors par rcurrence que en ,
tel que donn par lexpression 1.46 , est lui aussi un vecteur unitaire qui est
orthogonal tout membre de la famille {e1 , e2 , . . . , en1 }, soit h en | ek i = 0.
En effet, puisque lesP
vecteurs v1 , v2 , . . . , vn sont linairement indpendants, lexpression vn n1
i=1 h ei | vn i ei 6= 0 et par consquent, en est bien
dfini et unitaire. De plus, pour tout i, k {1, 2, . . . , n 1} :
*

h en | ek i =
n1

vn P h ei | vn i ei

i=1

i=1

1
=
n1

P
vn
h ei | vn i ei

i=1

i=1

"

=
n1

vn P h ei | vn i ei

vn

+


h ei | vn i ei ek

n1
X

h vn | ek i

i=1

n1
X

h ei | vn i h ei | ek i
| {z }
= ik


h vn | ek i h vn | ek i = 0

ce qui dmontre bien la validit de lalgorithme de Gram-Schmidt. Puisquon


peut encore une fois exprimer le vecteur unitaire en en tant que combinaison
linaire des v1 , v2 , . . . , vn , il sensuit que pour toute valeur finie de n, on a :
Vect(e1 , . . . , en ) = Vect(v1 , . . . , vn )
et la famille orthonormale engendre le mme espace vectoriel que la famille
originale, par la proposition 1.2.

1.6.5

55

Les bases hilbertiennes

Pour apprcier lalgorithme de Gram-Schmidt, il suffit de constater qu


chaque tape de litration 1.46, on soustrait du vecteur vn sa projection
orthogonale PBn1 sur le sous-espace Bn1 = Vect(e1 , . . . , en1 ) ; le vecteur
rsultant vn PBn1 est alors orthogonal tout vecteur de Bn1 . Il ne
reste plus qu le normaliser et le rajouter aux autres pour obtenir une base
orthonorme de lespace Bn , et ainsi de suite.
Il est grand temps de rendre plus conviviale la dfinition de base hilbertienne, ce que nous entreprenons de faire laide des critres de densit
suivants.
Thorme 1.16 Soit B = {ei }iI , une famille orthonormale dun espace de Hilbert H. Alors les noncs suivants sont quivalents :
1)

B est une base hilbertienne

2)

B = {0}

3)

ei B, h x | ei i = 0 = x = 0

4)

Vect(B) = H

Dmonstration.
1) = 2)

Puisque B est une base hilbertienne de H, par dfinition

Vect(B) = H. Alors Vect(B) = H = {0}. Donc B = {0}, et


utilisant le rsultat 1) de lexercice 1.4, on obtient B = {0}.
2) = 3) Par dfinition, B = {x H | h x | ei i = 0, ei B}.
Puisque B = {0}, alors forcment x B implique que x = 0.
3) = 4) Inversement, si x H on a que x B = x = 0,
alors forcment B = {0}. Puisque B = B , alors (B ) = {0}
ou encore B = H. Mais par convention B = Vect(B), et il sensuit
que Vect(B) = H et que B est dense dans H.
4) = 1) Le fait que B soit une famille orthonormale dense dans H
en fait une base hilbertienne par dfinition.
Thorme 1.17 Tout espace de Hilbert sparable possde une base hilbertienne dnombrable.
Proposition 1.18 Toute base hilbertienne dun espace de Hilbert est au
plus dnombrable.
Avec le thorme suivant, la notion de base hilbertienne perd son caractre abstrait et prend toute sa signification.

56

Lespace de Hilbert

Thorme 1.19 Soit B = {ei }iI , une famille orthonormale dun espace de Hilbert H et x, un point quelconque de lespace. Alors les noncs
suivants sont quivalents :
1)

B est une base hilbertienne


X
x=
h ei | x i ei

2)

iI

hx|yi =

3)

h x | ei ih ei | y i

iI

k x k2 =

4)

|h ei | x i|2

iI

Dmonstration.
1)

= 2) Si B est une base hilbertienne, alors B = {0} par


2) du thorme 1.16. Par 1) de lexercice 1.4, on a que B = B o
B = Vect(B). Puisque xPB (x) B , il sensuit que xPB (x) = 0,
ou encore que :
X
x = PB (x) =
h ei | x i ei
iI

2) = 3)

Du rsultat prcdent, on tire que :




h x | y i = h PB (x) | y i =
h ei | x i ei y
iI
X
X

=
h ei | x i h ei | y i =
h x | ei ih ei | y i
X

iI

3) = 4)

iI

Posant y = x dans le rsultat prcdent, on obtient :


h x | x i = k x k2 =

|h ei | x i|2

iI

4) = 1) Supposons que x B . Alors h x | ei i = 0, ei B. Par


le rsultat prcdent, cela signifie que k x k = 0 et donc que x = 0 par
1.17b. Donc, x B = x = 0 revient dire que B = {0} et,
par le thorme 1.16, que B est une base hilbertienne.

1.7

Quelques reprsentations de H

57

FORMULES RETENIR
Si B = {ei }iN est une base hilbertienne de H, alors pour tous
vecteurs x, y H :
x=
k x k2 =
hx|yi =

X
i=1

X
i=1

h ei | x i ei

(1.47)

|h ei | x i|2

(1.48)

h x | ei ih ei | y i

(1.49)

i=1

Lespace de Hilbert permet lextrapolation simple des rsultats algbriques obtenus dans des espaces de dimensions finies. tel point que, pour
le profane, le passage la dimension infinie se rsume un simple changement de borne suprieure, de N , dans les quations 1.36, 1.37 et 1.38,
sans autre forme de procs et sans encourir de pnalits.

1.7
1.7.1

Quelques reprsentations de H
Lespace l2 *

Lespace l2 , dit petit-el-deux , est lespace de toutes les suites infinies


de nombres rels (xi )iN dont la somme des carrs des termes converge :

x2i <

(1.50)

i=1

On en fait un espace vectoriel norm en identifiant les lments de la


suite aux composantes dun vecteur considr comme un -uplet :
x = (x1 , x2 , . . . , xi , . . . )
Laddition vectorielle et la multiplication scalaire sont naturellement dfinies

58

Lespace de Hilbert

par :
x + y = (x1 , x2 , . . . , xi , . . . ) + (y1 , y2 , . . . , yi , . . . )
= (x1 + y1 , x2 + y2 , . . . , xi + yi , . . . )
x = (x1 , x2 , . . . , xi , . . . )
l2 utilise la norme euclidienne, gnralise aux -uplets :
v
u
uX
kxk = t
x2i
i=1

On vrifiera que la condition de convergence 1.50 nous assure que tout vecteur
de lespace l2 est de norme finie, puisque k x k2 < .
Initialement conu comme un espace sur le corps des rels, l2 peut aussi
tre considr comme lespace de toutes les suites infinies de nombres complexes (zi )iN dont la somme des carrs des modules converge :

|zi |2 <

(1.51)

i=1

Les lments de la suite sont identifis aux composantes dun vecteur z :


z = (z1 , z2 , . . . , zi , . . . )
On utilise alors la norme hermitienne, gnralise aux -uplets :
v
u
uX
|zi |2
kzk = t
i=1

Lespace l2 est bien un espace vectoriel car il est stable par combination
linaire, c.--d. que pour tout scalaires et et tout vecteurs u et v, u+v
respecte 1.51. En effet :

X
i=1

|ui + vi |2 6

2

X
|ui | + |vi |
i=1



X
6
||2 |ui |2 + ||2 |vi |2 + 2|||ui ||||vi |
i=1

1.7.2

Lespace fonctionnel L2 *

59

Puisque pour tout rels a et b, lingalit 2ab 6 a2 +b2 est toujours valide,
nous obtenons en posant a = |||ui | et b = |||vi | que :

X
i=1

|ui + vi |2 6 2 ||2

|ui |2 + 2 ||2

i=1

|vi |2 <

i=1

Ce rsultat stend videmment toute combinaison linaire finie de vecteurs de l2 .


Il nest pas trop difficile de dmontrer que l2 est un espace complet (Voir
le Prob. 1.5).
La base hilbertienne la plus couramment utilise sur l2 est bien entendu :
e1 = (1, 0, 0, 0, 0, 0, . . . )
e2 = (0, 1, 0, 0, 0, 0, . . . )
e3 = (0, 0, 1, 0, 0, 0, . . . )
..................
Le produit scalaire sur l2 est la gnralisation du produit scalaire hermitien :

X
hx|yi =
xi yi
i=1

Lingalit de Cauchy-Schwartz nous assure que le produit scalaire est


toujours bien dfini :
|h x | y i|2 6 k x k2 k y k2 <
Lespace l2 fut propos pour la premire fois par David Hilbert vers 1909,
dans le cadre de ses tudes sur les quations intgrales. La premire formulation de la mcanique quantique, par Werner Heisenberg en 1925, la mcanique matricielle [7], modlise les tats physiques et les observables laide
de vecteurs et de matrices infinies oprant sur lespace l2 . Aujourdhui, linformatique quantique rcupre cette mcanique matricielle dans des espaces
de dimension finie.
Cest John von Neumann qui, dans un ouvrage sur laxiomatisation de
la thorie de la mcanique quantique, formalisa lappellation espace de
Hilbert en 1929.

1.7.2

Lespace fonctionnel L2 *

Plusieurs des quations intressantes en physique mathmatique se prsentent sous la forme dquations diffrentielles aux valeurs propres, dont la

60

Lespace de Hilbert

forme prototypique est :


A(x) = (x)

(1.52)

o A est un oprateur 25 diffrentiel linaire et et (x) sont les valeurs


propres et les fonctions propres dterminer. Ce type de problme se cadre
bien dans un espace de Hilbert transform pour loccasion en un espace fonctionnel, ou espace de fonctions, o chaque point de lespace est une fonction
(par exemple, du type : R 7 C) 26 .
Notre point de dpart est lensemble des fonctions continues sur un intervalle ferm, C 0 ([a, b]). On peut dmontrer que cet espace est complet si
on le munit de la norme uniforme :
k k = sup |(x)|
x[a,b]

mais, tel que nous lavons mentionn la section 1.4, cette norme ne drive
daucun produit scalaire. Nous sommes donc en prsence dun espace de
Banach, et non dun espace de Hilbert.
Qu cela ne tienne puisque nous nous proposons dintroduire le produit
scalaire suivant sur notre espace fonctionnel.
b

Z
h|i =

(x) (x) dx

(1.53)

La norme hermitienne associe est donne par :


b

Z

k k2 =

1
2

|(x)| dx

(1.54a)

et cette norme induit la mtrique :


Z
d(, ) = k k2 =

b
2

|(x) (x)| dx

1

(1.54b)

Cest ici que les difficults commencent. En effet, si dans les espaces de dimension finie toutes les normes sont quivalentes, ce nest plus le cas pour les
espaces de dimension infinie. En particulier, si lespace C 0 ([a, b]) est complet
pour la norme uniforme k k , il ne lest pas pour la norme k k2 .
25. La notion doprateur est examine en dtail au chapitre 2.
26. Pour simplifier, nous considrons ici les fonctions complexes dune seule variable
relle. Si lextension aux fonctions plusieurs variables ne pose conceptuellement pas de
problmes, en pratique elle ncessite cependant davoir recours des intgrales multiples.

1.7.2

Lespace fonctionnel L2 *

61

On peut le vrifier facilement. Prenons par exemple la suite de fonctions


(n )nN dans C 0 ([1, 1]) dfinie par :

1 si 1 6 x 6 n
n (x) = nx si n1 < x < n1

1
1 si
n 6x61
Cette suite est de Cauchy 27 . Pour que la suite converge vers une fonction
(x) il faut que :
Z

|(x) n (x)| dx

lim

1

=0

la limite, on tend vers la fonction


(
1 si 1 6 x < 0
(x) =
1 si
0<x61
qui contient une discontinuit en x = 0. tant discontinue, (x) ne peut
appartenir C 0 ([1, 1]).
Constatant quaucune des fonctions n nest lisse, nous serions peut-tre
tents de prendre comme espace de dpart C 1 ([a, b]), lensemble des fonctions
drives continues sur lintervalle [a, b] ou encore C ([a, b]), lensemble des
fonctions infiniment diffrentiables mais ce serait peine perdue. Force nous
est de constater que le complt de C 0 ([a, b]) pour la norme k k2 contient des
fonctions qui sont continues par morceaux. Ce complt est bien un espace
de Hilbert, dnot L2 ([a, b]), dit grand-el-deux .
Lespace L2 ([a, b]) comporte son lot de particularits.
1) Le traitement rigoureux de lespace L2 ([a, b]) ncessite une introduction la thorie de la mesure, une branche des mathmatiques dont la
plupart des phycisiens nont eu ni le loisir ni linclinaison de se familiariser.
2) Le produit scalaire 1.53 doit tre intgrable au sens de Lebesgue plutt
quau sens de Riemann. Que le lecteur se rassure, les quelques intgrales
que nous rencontrerons dans le cadre de cet ouvrage seront toujours
intgrables au sens de Riemann.
3) La norme associe 1.54a cache maintenant une petite technicalit.
Cest quelle rencontre toutes les conditions dune norme, sauf 1.17b,
27. On peut dmontrer en effet que, pour 1 6 m < n, on a k m n k2 <

2
.
m

62

Lespace de Hilbert
car :

s
Z
k k2 =

|(x)|2 dx = 0

=
Y

(x) = 0

o (x) est la fonction continue identiquement nulle sur tout lintervalle [a, b]. En effet, il savert que (x) peut tre diffrente de zro en
un sous-ensemble dnombrable de points sans que la valeur de lintgrale en soit affecte : autrement dit, llment neutre de lespace nest
pas unique. On contourne cet obstacle technique en prenant pour vecteurs de L2 ([a, b]) non plus les fonctions individuelles, mais les classes
dquivalence de fonctions qui sont gales presque partout 28 .
4) Jusqu prsent, le critre de convergence utilis pour les suites de
Cauchy en a toujours t un de convergence simple ou ponctuelle. Mais
dans lespace fonctionnel L2 ([a, b]), tout point de lespace est en
ralit une classe dquivalence de fonctions dfinies sur [a, b]. Ainsi,
deux fonctions, 1 et 2 , qui sont gales presque partout sont considres quivalentes
1
= 2
et sont donc reprsentes par un seul et mme point de lespace. Toute
suite de Cauchy de L2 ([a, b]) qui converge vers 1 converge aussi vers
2 . Pour assurer la compltude de lespace L2 , un critre moins restrictif de convergence presque partout suffit. Nous dirons quune suite
de Cauchy (n )nN dans un espace fonctionnel converge presque partout vers une fonction si elle converge simplement vers sauf sur
un ensemble de mesure nulle. On dmontre que si :
Z b
2
lim k m n k = lim
|m (x) n (x)|2 dx = 0
m,n

m,n a

alors il existe une fonction , intgrable au sens de Lebesgue, vers


laquelle la suite converge en moyenne quadratique :
Z b
2
lim k n k = lim
|(x) n (x)|2 dx = 0
(1.55)
n

n a

Si la suite de fonctions (n )nN converge en moyenne quadratique vers


, il est toujours possible den extraire une suite partielle qui converge
presque partout. Bref, pour lespace fonctionnel L2 ([a, b]), le critre
moins restrictif de convergence en moyenne quadratique 1.55 est suffisant pour assurer la compltude de lespace.
28. En thorie de la mesure, on dit que les fonctions ne diffrent entre elles que sur un
ensemble de mesure nulle.

1.7.2

Lespace fonctionnel L2 *

63

5) Puisque la convergence en moyenne quadratique nimplique pas la


convergence simple en tout point du domaine [a, b], il conviendrait
.
dutiliser un symbole diffrent, disons = , pour indiquer que la
compltude de lespace repose sur un critre de convergence presque
partout :

. X
=
h i | i i
(1.56)
i=1

quitte prserver le symbole = pour les cas o la srie converge


ponctuellement vers en tout point du domaine. Bien que justifie,
cette distinction est rarement renforce.
Un des avantages de choisir C 0 ([a, b]) comme point de dpart de notre
espace fonctionnel tient au fait que toutes les fonctions continues qui sont
dfinies sur un domaine compact sont ncessairement bornes (voir section
1.C.13), ce qui se traduit par :
Z b
|(x)| dx <
a

Cette condition nous assure immdiatement que tout vecteur de C 0 ([a, b])
est de norme finie, c.--d. :
Z
k k2 =

b
2

|(x)| dx

1
2

<

Mais la mcanique quantique ne saurait se limiter quaux domaines compacts et, du moins en thorie, il est ncessaire de lever toutes restrictions
quant aux bornes et de considrer lespace tendu quest L2 (R) 29 . Une fonction peut trs bien tre continue sur lintervalle non compact (, ) sans
pour autant tre borne (par exemple, la fonction exponentielle) de sorte
quil devient impratif dimposer la condition suivante si lon veut obtenir
lassurance que tout vecteur de lespace est bien de norme finie.
Z
|(x)|2 dx <
(1.57)

On se sert souvent de cette dernire condition pour dfinir L2 (R), ou


tout simplement L2 , en tant quespace des fonctions de carr sommable.
29. Le fait que le domaine sous-tendu par les fonctions de L2 soit compact ou non a
un impact majeur sur le spectre - lensemble des valeurs propres - que peut prendre un
oprateur. Dans le premier cas, le spectre est discret, ou quantifi, alors que dans le second
il est continu.

64

Lespace de Hilbert

Sous rserve de 1.57, les fonctions de lespace L2 peuvent tre linaires


ou non-linaires, continues ou discontinues (elles vont jusqu admettre une
infinit dnombrable de points de discontinuit).
Dans L2 , lingalit de Cauchy-Schwartz prend la forme :
Z


sZ

(x) (x) dx 6

|(x)|2 dx

sZ

|(x)|2 dx

Le lecteur vrifiera que, tout comme l2 , lespace L2 est stable par combinaison linaire et que la condition 1.57 ainsi que lingalit de CauchySchwartz garantissent que le produit scalaire est toujours bien dfini.
Il existe plusieurs familles de fonctions pouvant servir de bases hilbertiennes sur lespace de Hilbert 30 . Une base populaire sur L2 ([, ]) fait
appel aux fonctions trigonomtriques {1, cos nx, sin nx}nN . On utilise cette
base 31 pour obtenir une dcomposition dune fonction en sries de Fourier,
les scalaires i = h i | i tant alors appels les coefficients de Fourier 32 .
Malgr tous les efforts dploys par les mathmaticiens pour concrtiser
lespace fonctionnel L2 , ce dernier na pas vraiment la cote chez les physiciens. Dune part, certains auteurs sont davis que lespace L2 est trop
grand dun point de vue physique et prfrent sen tenir lespace des
fonctions suffisamment rgulires , un sous-ensemble de fonctions infiniment diffrentiables, rapidement dcroissantes, sans points de singularit
[3], et de lautre, il savert que les triplets de Gelfand constituent un cadre
mathmatique mieux appropri pour la mcanique quantique que lespace
fonctionnel L2 proprement dit.

1.7.3

Lespace dtat

Dans sa recherche de lexplication de leffet photo-lectrique, Albert Einstein proposa pour la premire fois, en 1905, le concept de particule de
lumire pour dcrire ce que lon connat aujourdhui sous lappellation moderne de photon. Dans une exprience clbre en 1922, lamricain Arthur
Compton dmontra que les rayons X manifestent bien laspect corpusculaire
30. En particulier, toutes les fonctions spciales qui sont solutions dun problme
de Sturm-Liouville peuvent fournir une base orthogonale de fonctions pour lespace de
Hilbert.
31. Notez que cette base est orthogonale plutt quorthonormale.
32. Indpendamment de la base hilbertienne utilise, il est dusage dappeler les coefficients h i | i de lexpansion 1.56 les coefficients gnraliss de Fourier, en hommage
lhomme et son oeuvre.

1.7.3

Lespace dtat

65

prdit par Einstein. En 1924, le franais Louis de Broglie 33 proposa de gnraliser cette dualit onde-corpuscule lensemble des particules massives,
une ide si audacieuse et si saugrenue pour lpoque quelle naurait probablement pas t prise au srieux sans la chaude approbation dEinstein. En
1926, lautrichien Erwin Schrdinger jeta les bases de la mcanique ondulatoire en publiant une quation fondamentale, lquation de Schrdinger[14],
qui dcrit lvolution temporelle de la fonction donde associe toute
particule. Dans louvrage daxiomatisation de la mcanique quantique publi en 1932 par John von Neumann[12], toute fonction donde de carr
sommable se voit reprsente par un vecteur de lespace L2 .
La publication de lquation ponyme de Schrdinger provoqua une certaine rivalit scientifique entre les tenants de la mcanique matricielle et ceux
de la mcanique ondulatoire. Ce dbat fut toutefois de courte dure car, ds
1926, Schrdinger rconcilia les deux coles de pense en dmontrant lquivalence des deux formalismes[15]. Lessence de largument de Schrdinger se
rsume ainsi : chaque fonction donde de L2 correspond le -uplet de l2
dont les composantes sont les coefficients h i | i de la dcomposition 1.56 :
7 (h 1 | i, h 2 | i, , h i | i, )
Lingalit de Bessel garantit alors le respect de la condition 1.51.
Le thorme suivant propose un rsultat encore plus fort :
Thorme 1.20 (Riesz-Fisher) Tous les espaces de Hilbert sparables
de dimension infinies sont isomorphes l2 .
Autrement dit, un isomorphisme prs, il nexiste quun seul espace de
Hilbert de dimension infinie ! Ainsi, tous les espaces de Hilbert concrets,
tels que l2 et L2 , ne sont que des ralisations diffrentes dun mme espace
abstrait. Dans le cadre de la mcanique quantique, les physiciens dsignent
cet espace sous lappellation despace dtat. Dans un mme ordre dides,
les vecteurs de lespace dtat sont appels vecteurs dtat.
Entre 1939 et 1947, Paul Dirac proposa un formalisme gnral pour la
thorie quantique qui devint rapidement trs populaire auprs de la communaut des physiciens[4]. Ce formalisme saccompagne dune notation trs
pratique pour les calculs symboliques dans lespace dtat.
33. La prononciation correcte est de Breuille .

66

Lespace de Hilbert

1.8

La notation de Dirac : bra et ket

Les vecteurs de lespace de Hilbert ont t jusqu prsent dnots laide


de caractres gras, par exemple v ou encore . Nous proposons dornavant
dadopter la notation suivante, de au clbre physicien Pierre Dirac, pour
reprsenter cesdits vecteurs :
v

notation de Dirac

|vi

notation de Dirac

|i

On inscrit simplement le symbole reprsentant le vecteur lintrieur dun


petit enclos orient vers la droite, appel ket, sans recourir aux caractres
gras 34 .
Nous avons dj tabli qu chaque vecteur | i de H correspond un
unique covecteur de lespace dual H . En notation de Dirac, ce covecteur est
dnot par h |.
| i H h | H
Le petit enclos orient vers la gauche est appel un bra.
La juxtaposition dun bra et dun ket prend alors un air familier :
h || i
De fait, si lon fusionne les barres verticales, on obtient le symbole du produit
scalaire des vecteurs | i et | i :
h|i
de mme que lexplication de lorigine des termes, puisque bra-ket se prononce bracket , ce qui signifie crochet en anglais.
Si v est un vecteur de H, alors il en est de mme pour tout vecteur v.
Selon la notation de Dirac, il est lgitime dcrire ce vecteur | v i, bien que
nous encourageons dans ce livre la pratique consistant extraire les scalaires
des kets 35 :
| v i = | v i
34. On permet cependant une exception dans le cas du vecteur nul de lespace, pour
lequel le recours au caractre gras est justifi, c.--d. | 0 i = 0H . Ceci permet de distinguer
le vecteur nul du vecteur | 0 i, un vecteur de la base calculatoire qui lui nest jamais nul !
On peut aussi liminer toute ncessit de recourir des caractres gras en adoptant le
symbole | null i pour dsigner 0H .
35. En mcanique quantique, on utilise parfois lalphabet grec pour dsigner la fois
et les scalaires et les vecteurs dtats. Nanmoins, il est possible de faire grand usage
dexpressions telles que | i + | i sans crer de confusion.

1.9

Les triplets de Gelfand*

67

Mais attention : au vecteur | i correspond le covecteur h | et non


le covecteur h | :
|i h|
| i h | = h |
cette correspondance tant toute fait cohrente avec la semi-linarit par
rapport la premire variable du produit scalaire :
h | i = h | i

(1.58)

titre dexemple, voici comment la formule 1.47 scrit dans la notation


de Dirac :

X
|xi =
h ei | x i | ei i
i=1

premire vue, ce changement peut sembler mineur, mais nous serons


mieux en mesure dapprcier au chapitre 2 toute lutilit de la notation de
Dirac lorsque nous dvelopperons lalgbre des oprateurs linaires sur H.
Puisque lenclos du ket suffit lui seul pour souligner le caractre vectoriel
dune variable, le choix du symbole quil contient est laiss notre bonne
convenance. De fait, la littrature physique foisonne dexpressions de toutes
sortes telles que :
| i, | i i, | j i, | 1 i, | 2 i, | + i, | i, | 001 i, | DEAD i, | ALIVE i, | i, | i, . . .
pour dsigner des vecteurs de lespace dtat. Les covecteurs correspondants
sont alors donns par :
h |, h i |, h j |, h 1 |, h 2 |, h + |, h |, h 001 |, h DEAD |, h ALIVE |, h |, h |, . . .

1.9

Les triplets de Gelfand*

De son propre aveu, Hilbert a dvelopp la thorie de lespace l2 partir


de considrations purement mathmatiques, sans aucune arrire-pense pour
dventuelles applications physiques. Concidence ou synchronicit, toujours
est-il que la thorie tait l, disponible, juste au moment o les physiciens en
ressentirent fortement le besoin. La mcanique quantique hritait ainsi dun
cadre mathmatique dans lequel elle pouvait se dvelopper de faon formelle,
sous loeil bienveillant des mathmaticiens.
En ralit, les choses ne se sont pas tout fait passes ainsi. Le manque
de rigueur des physiciens eut tt fait de provoquer lire des mathmaticiens.
Les principaux reproches adresss aux physiciens visaient :

68

Lespace de Hilbert

lutilisation de la fonction de Dirac 36 . Dans lespace L2 , nous serions tents dinclure cette fonction dans la classe dquivalence de la
fonction nulle puisquelle est identiquement gale zro sauf en un seul
point. Le hic, cest que la fonction nest pas dfinie en ce point 37 ! En
fait, la fonction de Dirac ne prend sa signification que lorsquelle
apparat sous un signe dintgrale.
linsistance des physiciens utiliser des bases non dnombrables de
lespace de Hilbert, malgr le fait que les vecteurs de ces bases nappartiennent ni lespace de Hilbert ni ne correspondent des tats
physiques du systme sous tude.
lapplication systmatique du formalisme de Dirac par les physiciens
qui favorise linsouciance mathmatique et conduit des contradictions
parfois trs tonnantes[6].
Bien que reconnaissant la simplicit et lutilit du formalisme de Dirac,
von Neumann ne pouvait se rsoudre entriner lusage de telles fictions
mathmatiques . Pour sa part, le mathmaticien franais Jean Dieudonn
qualifiait cette invraisemblable accumulation de non-sens de bouillie pour
les chats .
leur dfense, les physiciens invoquaient :
que lespace de Hilbert est trop englobant. En particulier, lespace L2
admet quantit de fonctions discontinues. Or les tats physiques sont
modliss laide de fonctions lisses de classe C , dfinies partout et
infiniment diffrentiables. Les physiciens se contenteraient dun sousensemble strict de L2 qui ne retiendrait que les fonctions continues.
que lespace de Hilbert nest pas assez inclusif. La physique ncessite
que le spectre de certains oprateurs, notamment loprateur dimpulsion P, soit continu. Or les vecteurs propres correspondant ces
oprateurs nappartiennent pas lespace de Hilbert puisquils sont
de norme infinie. Il en va de mme pour les vecteurs propres qui sont
solutions de lquation de Schrdinger pour une particule libre.
que le calcul symbolique rendu possible par le formalisme de Dirac est
trop intuitif et bien trop pratique pour quon envisage de sen dpartir.
Disons qu leur honneur, les mathmaticiens ont travaill trs fort pour
finalement tablir un terrain dentente entre eux et les physiciens. La premire perce fut effectue la fin des annes quarante par le mathmaticien
franais Laurent Schwartz[16] qui tablit une fondation mathmatique so36. Nous verrons plus en dtail la fonction de Dirac au chapitre 4.
37. Un point que lon fait ressortir parfois avec labus de notation suivant : (0) = .

1.9

Les triplets de Gelfand*

69

lide pour la fonction de Dirac en dveloppant la thorie des distributions 38 .


Cette fonction impropre aux proprits auto-contradictoires obtenait enfin
ses lettres de noblesse ! Vers la fin des annes cinquante, le mathmaticien
japonais Mikio Sato labora une thorie profondment originale qui fusionne
la fois les notions de fonctions et de distributions dans celle des hyperfonctions.
Enfin, dans les annes soixante, le mathmaticien russe Isral Gelfand[5]
complta le travail en introduisant le triplet de Gelfand, appellation qui
dsigne lensemble ordonn despaces {, H, } en relation dinclusion
stricte :
H
(1.59)
o en plus, est dense dans H et H est dense dans . Plus pertinent peuttre est le Rigged Hilbert Space 39 , abbrvi RHS, qui dsigne simplement
le couple ordonn {, }. On conoit alors le RHS comme un largissement
de lespace de Hilbert qui permet daccommoder la thorie des distributions.
Cest le cadre mathmatique indiqu en mcanique quantique lorsquon est
en prsence doprateurs non-borns ou dobservables spectre continu[9].
De faon gnrale, les oprateurs non-borns ne sont pas dfinis sur la
totalit de lespace H. Il convient alors de choisir pour un domaine de
dfinition qui est laiss invariant par loprateur. Ce domaine constitue un
sous-espace dense de L2 . Lespace anti-dual 40 de , dnot , vient complter le RHS. On obtient ainsi le meilleur de deux mondes : rassemble
les fonctions lisses dcroissance rapide si prises par les physiciens et
contient les kets gnraliss , dont la fameuse fonction de Dirac.
Le RHS est le cadre prvilgi en physique des particules pour tudier
les phnomnes de diffusion et de rsonance[8]. Utilis avec discernement, le
formalisme de Dirac convient tout aussi bien un espace de Hilbert sparable
qu un RHS.

38. Pour lensemble de ses travaux sur la thorie des distributions, Schwartz se vit
accorder le plus prestigieux prix en mathmatiques, la mdaille Fields. Cette rcompense
est considre comme lquivalent du Prix Nobel, sauf quelle nest dcerne quune fois
tous les quatre ans et que le rcipiendaire se doit davoir moins de 40 ans.
39. Ce terme anglophone emprunte la connotation nautique de gr telle quutilise
dans lexpression fully rigged plutt que celle plus ngative de truque, dans rigged
elections par exemple.
40. Une forme linaire sur un C-espace vectoriel est une fonction f : C qui
respecte la condition f (u + v) = f (u) + f (v). Une forme antilinaire respecte plutt
la condition f (u + v) = f (u) + f (v). Lespace anti-dual correspond ainsi
lensemble des formes antilinaires continues sur .

70

Lespace de Hilbert

1.10

Problmes du Chapitre 1
Problmes

Problme 1.1. Nombres complexes. Trouvez le rsultat de lexpression ii .


Problme 1.2. Espace dual. Dmontrez le thorme 1.5.
Problme 1.3. Cauchy-Schwartz. Montrez que la dfinition 1.11
du produit scalaire hermitien implique lingalit de Cauchy-Schwartz.
Problme 1.4. Identits. Dmontrez lidentit du paralllogramme
1.23 et lidentit de polarisation 1.24.
Problme 1.5. Compltude. Dmontrez que lespace l2 est complet.

Problmes supplmentaires
Problme 1.6. Topologies. Soit lensemble X = {a, b, c}. numrez
toutes les topologies sur X o seuls et X sont la fois des ouverts et des
ferms.
Problme 1.7. Voisinages. Dmontrez la proposition 1C.1.
Problme 1.8. Intersection de topologies. Dmontrez le thorme 1C.2.
Problme 1.9. Base quivalente. Dmontrez la proposition 1C.4.
Problme 1.10. Base topologique. Dmontrez le thorme 1C.5.
Problme 1.11. Base dune topologie dicrte. Dmontrez que
toute base dune topologie discrte doit ncessairement contenir tous les
singletons de lespace.
Problme 1.12. Critre pour base topologique. Dmontrez le
thorme 1C.6.
Problme 1.13. Prbase. Soit lensemble X = {a, b, c, d, e} et
A = {{a, b, c}, {a, d, e}, {b, c, d}, {c, d, e}}
une prbase. Trouvez la topologie TA gnre par la prbase A. Outre et
X, existe-t-il dautres lments de TA qui soient la fois des ouverts et des
ferms ?

1.10

Problmes du Chapitre 1

71

Problme 1.14. Topologie induite. Dmontrez que T (S), tel que


dfini au thorme 1C.7, constitue bien une topologie sur S.
Problme 1.15. Continuit. Dmontrez que lapplication
F : (X, TX ) (X, TY )
est continue ssi la primage de tout ferm de TY est un ferm de TX .
Problme 1.16. Continuit. Dmontrez le thorme 1C.8.
Problme 1.17. Application continue. Dmontrez que lapplication identit
F : (X, T ) (X, T 0 )
o x X, F (x) = x nest continue que ssi T 0 est moins fine que T .
Problme 1.18. Espaces de Hausdorff. Dmontrez la proposition
1C.10.
Problme 1.19. Singletons dans un espace de Hausdorff. Dmontrez la proposition 1C.11.
Problme 1.20. Premier axiome de dnombrabilit. Dmontrez
la proposition 1C.14.
Problme 1.21. Deuxime axiome de dnombrabilit. Dmontrez la proposition 1.11.
Problme 1.22. Adhrence. Dmontrez la proposition 1C.9.
Problme 1.23. Compltion dun espace mtrique. Dmontrez
le thorme 1.9.
Problme 1.24. Continuit squentielle. Dmontrez la proposition 1.10.
Problme 1.25. Convergence. Dmontrez le thorme 1.13.
Problme 1.26. Base hilbertienne. Dmontrez le thorme 1.17.
Problme 1.27. Base hilbertienne. Dmontrez la proposition 1.18.
Problme 1.28. Sous-espaces ferms. Dmontrez que tout sousespace dun espace mtrique sparable est lui-mme sparable et que tout
sous-espace ferm dun espace mtrique complet est lui-mme complet.

72

Lespace de Hilbert

Problme 1.29. Ensembles compacts. Dmontrez la proposition


1C.19.
Problme 1.30. Ensembles compacts. Dmontrez la proposition
1C.20.
Problme 1.31. Ensembles totalement borns. Dmontrez que
tout ensemble totalement born est born.

Annexes
du
Chapitre 1

1.A

Les structures algbriques

Annexe 1.A

75

Les structures algbriques

Un bref rappel sans prtention dans lequel on prcise certaines conventions pour la notation.

1.A.1

Le produit cartsien

Dfinition 1A.1 Soient A et B, deux ensembles non-vides. Le produit


cartsien de A par B, dnot :
AB
est lensemble constitu de tous les couples ordonns (a, b) o la premire
composante appartient lensemble A et la seconde composante appartient
lensemble B.
A B = {(a, b) | a A, b B}
Exemple 1A.1. Le plan cartsien est le produit cartsien de lensemble
des rels R par lui-mme. On utilise R2 pour dsigner le plan cartsien :
R2 = R R
On peut tendre la notion de produit cartsien binaire celle de produit
cartsien fini. Par exemple, lespace tri-dimensionnel est le produit cartsien
de lensemble des rels pris trois fois par lui-mme, R3 = R R R. Les
lments de R3 sont des triplets (x1 , x2 , x3 ) plutt que des couples.
Par extension, Rn est le produit cartsien de R pris n fois par lui-mme :
Rn = |R R
{z R}
n fois

Les lments de Rn sont des multiplets, ou encore des n-uplets, soit une
squence finie ordonne de n nombres rels (x1 , x2 , . . . , xn ).

1.A.2

Loi de composition interne

Dfinition 1A.2 Soit A un ensemble non-vide. Une loi de composition


interne est toute application () qui associe tout couple dlments (a, b)
de A A un unique lment de A. Nous dnoterons cet lment unique par
ab :
:AAA
(a, b) 7 a b
Lensemble A est automatiquement stable pour la loi de composition interne.

76

Annexe 1A

Note. Le symbole de composition est gnrique et on lui substitue


la plupart du temps un symbole plus spcifique, par exemple un +
lorsquon est en prsence dune loi additive 41 .

1.A.3

Loi de composition externe

Dfinition 1A.3 Soient A et B, deux ensembles non-vides. Une loi


de composition externe est toute application () qui associe tout couple
dlments (a, b) de A B un unique lment de B. Nous dnoterons cet
lment unique par a  b :
:AB B
(a, b) 7 a  b

1.A.4

La structure algbrique de corps

Concrtement, un corps est un ensemble dans lequel les oprations daddition, de soustraction, de multiplication et de division sont dfinies. Nous travaillerons principalement avec le corps des nombres rels et celui des nombres
complexes.
Dfinition 1A.4 Un ensemble non-vide K, muni dune loi de composition interne (+) dite additive, ainsi que dune seconde loi de composition
interne () dite multiplicative possde la structure algbrique de corps si les
axiomes suivants sont vrifis :

, K
, , K

+ =+

(1A-1a)

( + ) + = + ( + )

(1A-1b)

0K K, K

+ 0K =

(1A-1c)

K, - K

+ (-) = 0K

(1A-1d)

, K
, , K
1K K, 1K 6= 0K , K
-1

K, 6= 0K , K

(1A-1e)

( ) = ( )

(1A-1f)

1K =

(1A-1g)

-1

(1A-1h)

= 1K

, , K

( + ) = +

(1A-1i)

, , K

( + ) = +

(1A-1j)

41. Lusage courant veut aussi quon laisse carrment tomber le symbole de composition
lorsque la loi est de nature multiplicative, en crivant tout simplement ab au lieu de a b.

1.A.5

77

La structure despace vectoriel

Ces axiomes stipulent, dune part, la commutativit, lassociativit et


lexistence dun lment neutre pour chacune des deux lois de composition
interne. Ces deux lments neutres sont obligatoirement distincts. De plus,
tous les lments du corps possdent un lment inverse additif. Il en va
de mme pour la loi de composition multiplicative si lon fait exception de
llment 0K qui lui nest pas inversible. La distributivit droite et gauche
de la multiplication par rapport laddition viennent complter la liste des
axiomes.
Il est trivial de dmontrer lunicit de llment neutre et de llment
inverse, tant pour laddition que pour la multiplication. Dans le cas des rels
et des complexes, ces lments neutres sont respectivement 0 et 1.
Mentionnons, des fins de compltude, que la stabilit des lois de composition interne dans K sexprime formellement par :
, K

+ K

, K

a K

Remarque. Notons que (K, +, 0K ) possde la structure de groupe additif


et (K\{0K }, , 1K ), celle de groupe multiplicatif.
Convention. La spcification complte dun corps ncessiterait lcriture
encombrante (K, +, , 0K , 1K ). Puisque la plupart des thormes en algbre
vectoriel sont valides pour un corps quelconque, nous conviendrons dallger
lcriture en identifiant tout simplement ce corps par K. Lorsquil sera spcifiquement question de lensemble des rels ou de celui des complexes, nous
utiliserons la notation standard R et C 42 .
Veuillez prendre note que nous rserverons les caractres grecs minuscules
pour dsigner les lments dun corps quelconque K.

1.A.5

La structure despace vectoriel

Nous prsumons de la part du lecteur une certaine familiarit avec le


concept de vecteur gomtrique, soit une grandeur dirige qui ne peut
tre compltement spcifie par la donne dune seule quantit scalaire. Ainsi,
il ne suffit pas de dire quun corps physique se dplace de tant de mtres
la seconde, encore faut-il lui prciser une direction et un sens pour que sa
vitesse soit entirement dfinie.
La gnralisation du concept de vecteur gomtrique conduit la notion
despace vectoriel. Concrtement, un espace vectoriel est un ensemble dans
42. Puisque R C, toutes les propositions dmontres pour le corps des complexes C
seront automatiquement vrifies pour le corps des rels R.

78

Annexe 1A

lequel on a dfini une opration daddition vectorielle laide dune loi de


composition interne ainsi quune opration de multiplication scalaire par un
lment dun corps K laide dune loi de composition externe.
Convention. Nous utiliserons les caractres romains majuscules gras
pour illustrer quun ensemble possde la structure despace vectoriel. Par
exemple, si lensemble V possde bien la structure despace vectoriel, nous
le dsignerons par V. Les lments de V seront appels vecteurs et seront
dsigns par des caractres romains minuscules gras, par exemple, u et v.
Les lments de K seront appels scalaires et continueront dtre dsigns
par des caractres grecs minuscules.
Facultativement, nous utiliserons lexpression K-espace vectoriel lorsquil
conviendra de prciser le corps de rfrence.
Procdons maintenant la dfinition axiomatique dun espace vectoriel
sur un corps quelconque K.
Dfinition 1A.5 Un espace vectoriel V ou espace linaire sur un corps
K consiste en un ensemble non-vide V muni dune loi de composition interne
(+) dite d addition vectorielle :
+:V V V
ainsi que dune loi de composition externe (  ) dite de multiplication scalaire :
 :KV V
vrifiant les axiomes suivants :
v, w V
u, v, w V

v+w =w+v

(1A-2a)

(u + v) + w = u + (v + w)

(1A-2b)

0V V, v V

v + 0V = v

(1A-2c)

v V, -v V

v + (-v) = 0V

(1A-2d)

, K, v V

( + )  v =  v +  v

(1A-2e)

K, v, w V

 (v + w) =  v +  w

(1A-2f)

, K, v V

( )  v =  (  v)

(1A-2g)

v V

1K  v = v

(1A-2h)

Note. Veuillez noter quun mme symbole (+) est utilis pour indiquer
aussi bien une addition scalaire dans le corps K (membre de gauche de

1.A.5

La structure despace vectoriel

79

lquation 1A-2e) quune addition vectorielle (membre de droite de la mme


quation). Cette utilisation double ne devrait normalement pas entraner de
confusion. De plus, nous limiterons lutilisation explicite de loprateur de
multiplication scalaire () de rares cas dexception ; la notation simplifie
suivante sera prfre :
v  v
Aussi, nous avons dfini la multiplication scalaire par  : K V V
alors que certains auteurs utilisent plutt  : V K V . Bref, lordre
nest pas significatif, ce qui impute une commutativit intrinsque la
multiplication scalaire :
v v
Dans cet ouvrage, lusage voudra que les vecteurs soient toujours prcds
des scalaires.
Convention. Dornavant, nous dsignerons llment neutre additif de
V simplement par 0 plutt que par 0V . Aucune confusion nest possible avec
0, llment neutre additif du corps K.
titre dexemple, voici la reformulation usuelle des quations 1A-2c et
1A-2f :
v+0=v
(v + w) = v + w
Lexistence dun lment inverse additif nous permet par ailleurs de dfinir une nouvelle opration, soit la soustraction vectorielle :
df.

uv =
=
= u + (-v)
Les espaces vectoriels admettent par ailleurs certains propositions supplmentaires facilement dmontrables ; nous nous contenterons simplement
ici de les numrer.
-

llment neutre 0 de V est unique.


llment inverse -v de v est unique.
pour tout v, (1)v = -v.
pour tout v, 0v = 0.
pour tout , 0 = 0.
si v = 0, alors ou bien = 0 ou bien v = 0 (ou encore les deux).

Remarque. La distinction essentielle entre un espace vectoriel et un


corps est que ce dernier possde deux lois de composition interne alors quun
espace vectoriel possde une loi de composition interne et une loi de composition externe. Cette distinction sestompe compltement lorsquon choisit

80

Annexe 1A

le corps en tant quensemble de dpart de notre espace vectoriel. Non seulement on ne diffrencie plus entre loi de composition interne et loi de composition externe, mais encore les vecteurs se confondent avec les scalaires.
Par exemple, les ensembles R et C deviennent des espaces vectoriels bona
fide lorsque dfinis sur leurs propres corps, la multiplication par un scalaire
se rduisant une multiplication ordinaire dans les deux cas. Fidles nos
conventions, nous dnoterons ces espaces vectoriels par R et C.

1.A.6

Les algbres

Nous allons maintenant introduire la notion dalgbre sur un corps K


ou K-algbre. Dans cet ouvrage, nous favoriserons les algbres dfinis sur le
corps des complexes, soit les C-algbres.
Concrtement, un espace vectoriel est promu la structure complte
dalgbre lorsquil est complment par une deuxime loi de composition
interne dfinissant un produit vectoriel .
Dfinition 1A.6 Soit V, un K-espace vectoriel. Nous dirons que V
possde la structure de K-algbre sil est muni dune seconde loi de composition interne (), dfinissant un produit de vecteurs :
:VV V
qui vrifie les axiomes suivants :
u, v, w V

u (v + w) = u v + u w

(1A-3a)

u, v, w V

(u + v) w = u w + v w

(1A-3b)

, K, u, v V

(u) (v) = ()(u v)

(1A-3c)

Les axiomes stipulent que la loi de composition () est distributive


gauche et droite par rapport laddition vectorielle.
Si la loi de composition () est associative :
u, v, w V

(u v) w = u (v w)

(1A-4)

nous dirons que le K-algbre est un algbre associatif. De plus, si la loi de


composition () est commutative :
u, v V

uv =vu

nous dirons que le K-algbre est un algbre commutatif.

(1A-5)

1.A.6

81

Les algbres

Note. Il se peut que la loi de composition () admette un lment neutre


1V :
v V, 1V V

v 1V = 1V v = v

et nous dirons alors que le K-algbre est un algbre unitaire. Sil existe,
llment neutre du produit vectoriel 1V est un vecteur, contrairement
llment neutre de la multiplication scalaire 1K qui, lui, est un scalaire.
Exemple 1A.2. Pour fixer les ides, voici quelques exemples dalgbres
parmi les plus courants :
Les espaces vectoriels issus dun corps, tels R et C, forment des algbres associatifs et commutatifs. Ici, le produit vectoriel se confond
avec la multiplication scalaire et son lment neutre multiplicatif est
le vecteur 1.
Lespace euclidien R3 , muni du produit vectoriel standard (exprim ici
en coordonnes cartsiennes) :
u v = (uy vz uz vy ) i + (uz vx ux vz ) j + (ux vy uy vx ) k
est un algbre non associatif et non commutatif puisque :
(u v) w 6= u (v w)
u v 6= v u
Ce produit vectoriel nadmet pas dlment neutre.
Lespace L(V) des applications linaires de V dans lui-mme, muni
de la loi interne de composition dapplications, constitue un algbre
associatif mais non commutatif. Llment neutre de la composition
est lapplication identit.
Lespace Mn,n des matrices carres dfinies sur un corps quelconque,
auquel on rajoute la multiplication matricielle, constitue aussi un algbre associatif mais non commutatif. Ici, llment neutre de la multiplication matricielle est la matrice identit.
Lorsque V est un K-espace vectoriel de dimension n, alors le K-algbre
L(V) est isomorphe au K-algbre Mn,n . Ainsi, toutes les oprations sur
L(V) peuvent seffectuer laide de matrices. Nous reviendrons sur ce point
au Chapitre 2.

82

Annexe 1B

Annexe 1.B

Les nombres complexes

Nous allons maintenant procder une brve revue des principales proprits des nombres complexes.

1.B.1

Les oprations arithmtiques sur les nombres complexes

De la mme faon quil nous est possible de reprsenter tout nombre


rationnel laide dun couple dentiers, nous pouvons reprsenter tout nombre
complexe z laide dun couple (a, b) de nombres rels, assujetti certaines
rgles :
z = (a, b)
a, b R
o a et b sont appels respectivement la partie relle et la partie imaginaire
du nombre complexe z, ce que lon dnote par :
a = <(z)

b = =(z)

Lgalit entre deux nombres complexes z1 = (a1 , b1 ) et z2 = (a2 , b2 )


nest vrifie que si et seulement si a1 = a2 et b1 = b2 .
Lorsque la partie imaginaire de z est nulle, nous sommes effectivement
en prsence dun nombre rel :
x R,

x = (x, 0)

Par consquent, R C.
Si (x, 0) est un nombre purement rel, le nombre complexe (0, x), o
x 6= 0, est par ailleurs un nombre imaginaire pur. Le nombre complexe (0, 1)
est tellement particulier quil mrite son propre symbole, soit i :
df.

i =
=
= (0, 1)
Cette reprsentation sous forme de couple savre pratique pour dfinir
les oprations usuelles daddition, de multiplication, de soustraction et de
division sur les nombres complexes. Ainsi, laddition de deux nombres complexes est dfinie par :
z1 + z2 = (a1 , b1 ) + (a2 , b2 ) = (a1 + a2 , b1 + b2 )

(1B-1)

et la multiplication par :
z1 z2 = (a1 , b1 ) (a2 , b2 ) = (a1 a2 b1 b2 , a1 b2 + a2 b1 )

(1B-2)

1.B.1

Les oprations arithmtiques sur les nombres complexes


83

Si lon multiplie le nombre complexe i par lui-mme, on obtient :


i2 = i i = (0, 1) (0, 1) = (1, 0) = 1

ce qui justifie presque labus dcriture suivant : i = 1 43 .


Llment neutre additif et llment neutre multiplicatif pour le corps
des complexes C sont respectivement (0, 0) et (1, 0), ce qui correspond aux
mmes valeurs que pour le corps des rels R.
Linverse additif z dun nombre complexe z quelconque est dfini par
la rgle :
z + (z) = (z) + z = (0, 0) = 0
Il sensuit que, si z = (a, b), alors z = (a, b). Lexistence dun lment
inverse additif nous permet par ailleurs de dfinir la soustraction de deux
nombres complexes :
df.

z1 z2 =
=
= z1 + (z2 )
Linverse multiplicatif z 1 dun nombre complexe non-nul z est dfini
par la rgle :
z z 1 = z 1 z = (1, 0) = 1
Si z = (a, b), alors :
z


=

a
b
, 2
2
2
a + b a + b2

Ceci nous permet de dfinir la division du nombre complexe z1 par le nombre


complexe non-nul z2 comme le produit de z1 par linverse multiplicatif de
z2 :
z1 df.
=
=
= z1 z21
z2
ou, plus explicitement, en utilisant 1B-2 :


z1
a1 a2 + b1 b2 a2 b1 a1 b2
,
=
z2
a22 + b22
a22 + b22

(1B-3)

Dans le cas particulier o z1 = (a1 , 0) et z2 = (a2 , 0), on note que les


oprations arithmtiques sur les nombres complexes se confondent avec les
oprations arithmtiques correspondantes sur les nombres rels.

43. Lusage inconsidr r


de labus dcriture i = 1 peut conduire des absurdits.

1
1
1
i2
Par exemple : i = 1 =
=
= =
= i.
1
i
i
1

84

1.B.2

Annexe 1B

La conjugaison complexe

La conjugaison complexe est la fois une des plus simples et une des plus
importantes oprations que lon puisse effectuer sur un nombre complexe.
Le conjugu complexe dun nombre complexe z = (a, b) est dfini comme
le nombre complexe z = (a, b) qui possde la mme partie relle que z,
mais dont la partie imaginaire est de signe oppos.
Les identits suivantes sont facilement vrifies.
(z1 + z2 ) = z1 + z2

(1B-4a)

(1B-4b)

z1 z2
z1 z2

(1B-4c)

(z) = z
(z1 z2 ) =

(z1 z2 ) =

(1B-4d)

(z ) = z

z1 z1
= ,
z2
z2
1
<(z) = (z + z )
2
1
=(z) = (z z )
2i

(1B-4e)
z2 6= 0

(1B-4f)
(1B-4g)
(1B-4h)

On vrifie laide de 1B-2 que le produit dun nombre complexe avec son
conjugu donne toujours un nombre rel non-ngatif.
zz = (a, b) (a, b) = a2 + b2 > 0

(1B-5)

Cette proprit facilite la divison de deux nombres complexes quelconques


car on peut rationaliser le dnominateur de la faon suivante :
z1
z1 z2
z1 z2
=
=
z2
z2 z2
a22 + b22

1.B.3

La forme algbrique des nombres complexes

Si la reprsentation par un couple de nombre rels rend triviales les oprations daddition et de soustraction sur les nombres complexes, il nen va
pas autant pour la multiplication et la division. Les formules 1B-2 et 1B-3
sont lourdes et se prtent mieux la programmation qu la mmorisation.
Heureusement, nous navons nul besoin de les retenir car nous pouvons aisment passer une reprsentation algbrique des nombres complexes en

1.B.4

La forme trigonomtrique des nombres complexes

85

utilisant le fait que tout nombre imaginaire pur (0, b) puisse tre rcrit sous
forme du produit :
(0, b) = (0, 1) (b, 0) = ib
Ainsi, tout nombre complexe z = (a, b) peut tre reprsent sous la forme
algbrique z = a + ib, puisque :
z = (a, b) = (a, 0) + (0, b) = (a, 0) + (0, 1) (b, 0) = a + ib
La forme z = a + ib combine lidentit i2 = 1 permet de traiter algbriquement les nombres complexes comme sil sagissait de nombres rels. Par
exemple, la multiplication algbrique des nombres complexes seffectue
comme suit :
z1 z2 = (a1 + ib1 )(a2 + ib2 ) = a1 a2 + ia1 b2 + ia2 b1 + i2 b1 b2
= (a1 a2 b1 b2 ) + i(a1 b2 + a2 b1 ) = (a1 a2 b1 b2 , a1 b2 + a2 b1 )
Nous retrouvons exactement le mme rsultat quen 1B-2 sans avoir besoin den mmoriser la formule. partir de maintenant, nous dlaisserons la
reprsentation des nombres complexes sous la forme de couple au profit de
la reprsentation algbrique.
Le lieu gomtrique des nombres complexes est le plan dArgand, ou plan
complexe, qui ressemble sy mprendre au plan cartsien (voir Fig. 1.9).
Notons dabord le changement de nomenclature des axes de coordonnes :
labcisse et lordonne du plan cartsien sont rebaptiss axe rel et axe imaginaire dans le plan dArgand. La diffrence majeure est que lchelle de laxe
imaginaire est maintenant gradue en multiples du nombre imaginaire pur i.
Il est clair que lon peut dfinir une bijection 44 F : R2 C entre les
deux plans, par exemple :
(a, b) 7 a + ib
mais un point du plan cartsien se distingue toujours du point correspondant
dans le plan dArgand en ce sens que le premier est un 2-uplet alors que le
second est un tre mathmatique complet en soi (1-uplet).

1.B.4

La forme trigonomtrique des nombres complexes

Lquation 1B-5 nous permet de dfinir le module dun nombre complexe


z = a + ib, que lon dnote par |z|, comme tant la racine carre positive du
produit de z et de son conjugu complexe z .
p
df.
|z| =
=
= zz = a2 + b2
(1B-6)
44. Les applications bijectives ou bijections sont dfinies la section 1.2.4.

86

Annexe 1B
axe imaginaire

ordonne

RR

4
b
3

4i
ib
3i

(a, b)

2
1

z = a + ib

2i

abcisse
0

2 a 3

axe rel
0

(a)

2 a 3

(b)

Figure 1.9 (a) Plan cartsien (b) Plan dArgand


Le module dun nombre complexe est bien videmment un nombre rel
non-nul, |z| > 0. Le carr du module est tout simplement :
|z|2 = zz = a2 + b2
Note. Il est important de prciser que |z|2 6= z 2 , puisque :
z 2 = (a + ib)2 = (a2 b2 ) + i(2ab)
et donc, gnralement, z 2 est un nombre complexe alors que |z|2 est toujours
rel.
Les identits suivantes sont facilement vrifies.
|z| = |z |

(1B-7a)

|z1 z2 | = |z1 ||z2 |

(1B-7b)

Puisquil nous est toujours permis de rcrire un nombre complexe diffrent de zro sous la forme :


p
a
b
2
2

z = a + ib = a + b
+ i
a2 + b2
a2 + b2
et que :
a
b
1 6
6 1,
1 6
61
a2 + b2
a2 + b2
nous pouvons toujours trouver un [0, 2) pour lequel cos = a2a+b2 et

sin = a2b+b2 45 . Et puisque |z| = a2 + b2 , nous obtenons alors la forme


trigonomtrique des nombres complexes :
z = |z|(cos + i sin )
45. Notons que cos2 + sin2 = 1, comme il se doit.

(1B-8)

1.B.5

Les fonctions de la variable complexe

87

Note. Lquation 1B-8 reste valide mme lorsque z est nul puisque, dans
ce cas, |z| = 0 (cest le seul cas o demeure indtermin).

1.B.5

Les fonctions de la variable complexe

Lanalyse complexe est une des branches les plus russies des mathmatiques qui, bien des gards, est beaucoup plus complte que celle de
lanalyse relle. La principale raison tient au fait que la dfinition de la drive en un point dune fonction de la variable complexe est beaucoup plus
restrictive quelle ne lest pour une fonction de la variable relle. Dans ce
dernier cas, le point est situ sur la droite des rels et le processus de limite
ne nous permet de tendre vers ce point que selon deux directions, soit par
la gauche ou soit par la droite. La fonction est dite drivable en ce point
ssi la drive gauche est gale la drive droite . Dans le cas
dune fonction de la variable complexe, le point est situ dans le plan
dArgand et il existe une infinit de faons diffrentes de sen approcher.
Une fonction de la variable complexe nest drivable en ce point que si le
processus de limite est indpendant du chemin choisi 46 . Il sagit en ralit
dune contrainte heureuse car cest cette isotropie de la drive au sens
complexe qui permet la thorie de prendre tout son envol.
Nous serons principalement concerns dans ce texte par les fonctions
uniformes du type :
f :CC
plus particulirement celles qui sont drivables en tout point dun ouvert 47
du plan complexe. Ces fonctions sont appeles fonctions holomorphes et elles
possdent la proprit remarquable dtre localement analytiques, c.--d.
quelles admettent un dveloppement en srie entire en chaque point de
louvert. Une fonction uniforme qui est dfinie et holomorphe sur lensemble
du plan complexe est appele fonction entire.
Le prototype de la fonction entire est la fonction exponentielle complexe
ez . Tout comme lexponentielle relle admet un dveloppement en srie sur
lensemble de son domaine :

X
xn
x
x R,
e =
n!
n=0

46. La condition ncessaire et suffisante pour quune fonction de la variable complexe


soit diffrentiable en un point est que la fonction vrifie les quations de Cauchy-Riemann
en ce point.
47. La notion topologique douvert est dfinie formellement la section 1.C.1. Pour fins
de la discussion prsente, on peut considrer un ouvert comme tant lintrieur dun cercle
dans le plan dArgand.

88

Annexe 1B

lexponentielle complexe admet aussi un dveloppement en srie sur lensemble du plan complexe :
ez =

z C,

X
zn
n=0

(1B-9)

n!

Outre la fonction ez , lautre fonction qui retiendra notre attention, dans


une moindre mesure, est la fonction logarithme complexe ln z. Une complication rsulte du fait que ln z est multiforme. Nous verrons un peu plus
loin quil est possible de la transformer en fonction uniforme en limitant
son domaine de dfinition. Une fois ceci accompli, ln z devient une fonction
holomorphe sur lensemble du plan complexe, lexception du point z = 0.
Ces quelques lignes ne rendent pas justice la thorie de lanalyse complexe. Le lecteur intress en connatre davantage est invit consulter le
texte classique dAhlfors[1] ou celui, plus rcent, de Needham[11] qui propose
une approche plus gomtrique.

1.B.6

La forme exponentielle des nombres complexes

Substituant la reprsentation algbrique de z dans la fonction ez , nous


obtenons :
ez = ea+ib = ea eib
(1B-10)
Ainsi, lexponentiation dun nombre complexe quelconque quivaut au
produit dune exponentiation relle et de lexponentiation dun nombre imaginaire pur. Concentrons-nous sur ce deuxime facteur. Pour loccasion, nous
substituons le symbole en lieu de b (nous insistons sur le fait que est une
valeur relle). Par 1B-9 :

ei =

X
(i)n
n=0

n!
2

i2
i3
i4
i5
i6
i7
= 1 + i +
+
+
+
+
+
+
2!
3!
4!
5!
6!
7!




2 4 6
3 5 7
= 1
+

+ + i
+

+
2!
4!
6!
3!
5!
7!
= cos + i sin
puisque les quantits apparaissant dans les crochets sont respectivement les
dveloppements en srie de Taylor des fonctions relles cos et sin .

1.B.6

La forme exponentielle des nombres complexes

89

Nous obtenons ainsi une des plus belles formules des mathmatiques, due
Leonhard Euler :
ei = cos + i sin
(1B-11a)
Il est trivial de vrifier que :
ei = cos i sin

(1B-11b)

Puisque (ei )n = ein , nous obtenons directement la formule de De


Moivre :
(cos i sin )n = cos n i sin n
(1B-12)
On vrifie trivialement que le conjugu complexe de ei est ei et que,
quelle que soit la valeur de , ei est de module 1 :
|ei | = 1
De fait, tout nombre complexe ei est un lment de U (1), le groupe
unitaire de degr 1 :
U (1) = {z C : |z| = 1}
i

ei

i
(a)

(b)

Figure 1.10 (a) Le nombre complexe ei est toujours situ sur le cercle
unit du plan dArgand (b) Dmonstration gomtrique de lidentit dEuler
Ainsi, lorsque varie continuellement de 0 2, le point ei se dplace
continuellement le long de la circonfrence du cercle unit, dans le sens antihoraire. Si lon permet de varier sur lensemble des rels, alors la fonction
f : R C dfinie par f () = ei est priodique de priode imaginaire 2i
puisque :
ei = ei(+2)
et e2i = 1. On peut donc parcourir ce trajet circulaire autant de fois que
lon veut, dans un sens comme dans lautre.

90

Annexe 1B

Remarque. Lorsque = , on obtient la fameuse identit dEuler qui


combine cinq des constantes les plus fondamentales des mathmatiques :
ei + 1 = 0

(1B-13)

En combinant les quations 1B-8 et 1B-11a, nous obtenons la reprsentation exponentielle des nombres complexes :
z = |z| ei

(1B-14)

On appelle largument de z, que lon dnote aussi par Arg z. Dans


certains ouvrages, on retrouve parfois lcriture z = |z| eiArg z . On pourra
vrifier queffectivement cos = a2a+b2 et sin = a2b+b2 et que largument
de z est donn par :
b
(1B-15)
= tan1
a
lorsque z nest pas un nombre imaginaire pur (a 6= 0). Le conjugu complexe
est donn par :
z = |z| ei
Si lon pose r = |z|, on fait ressortir le lien vident entre la reprsentation
exponentielle dun nombre complexe et les coordonnes polaires (r, ) du
point correspondant dans le plan cartsien :
z = rei

(1B-16)

plan dArgand
z

ib

(4)

z = a + ib; z = a ib

|z| = |z | = a2 + b2
 
b
= arctan
a
a = <(z) = |z| cos

(5)

b = =(z) = |z| sin

(6)

z = |z|ei ; z = |z|ei

(7)

zz = |z|2

(1)
(2)

|z|

(3)
0

|z |
ib

Figure 1.11 Reprsentation gomtrique des nombres complexes dans le


plan dArgand

1.B.7

91

Apprciation des nombres complexes

De toutes les reprsentations des nombres complexes vues jusqu prsent, la reprsentation exponentielle est de loin celle qui nous sera la plus
utile. La reprsentation exponentielle nest pas idale pour les oprations
daddition et de soustraction mais se rvle trs approprie pour les oprations de multiplication et de division :
z1 z2 = |z1 | ei1 |z2 | ei2 = |z1 z2 | ei(1 +2 )
z1
|z1 | ei1
|z1 | i(1 2 )
=
=
e
z2
|z2 |
|z2 | ei2

(1B-17a)
(1B-17b)

Nous pouvons nous servir de lquation 1B-16 pour dfinir le logarithme


complexe :
ln z = ln(rei ) = ln r + i
(1B-18)
avec ln z = lorsque z = 0. Cette dfinition respecte bien la proprit
principale des logarithmes qui est de transformer des multiplications en additions :
ln z1 z2 = ln(r1 ei1 r2 ei2 ) = ln r1 + i1 + ln r2 + i2 = ln z1 + ln z2
On remarquera lquation 1B-18 que la partie imaginaire de ln z nest
autre que largument de z. Contrairement lexponentielle complexe, le logarithme complexe nest pas une fonction priodique de priode imaginaire
2i. On peut concevoir ln z comme une fonction multiforme une infinit
de branches uniformes. En restreignant largument lintervalle [0, 2), ez
et ln z redeviennent des fonctions rciproques. Tout comme dans le cas de la
variable relle, les identits suivantes sappliquent alors :
z = ln ez = eln z

1.B.7

(1B-19)

Apprciation des nombres complexes

Dcouvre-t-on ou invente-t-on les mathmatiques ? Le cas des nombres


complexes semble faire rsolument pencher la balance en faveur de la premire hypothse. Dcouverts durant la Renaissance italienne, une poque
o mme les nombres ngatifs taient suspects, leur acceptation sest faite
reculons au cours des sicles qui suivirent.
lpoque, la mthode de rsolution des quations du second degr tait
bien connue. La traduction latine de louvrage du grand mathmaticien perse
al-Khwarizmi, Kitb al-jabr wal-muqbala, publi originalement en 825, tait

92

Annexe 1B

disponible en Europe depuis le XIIme sicle. Dans cet ouvrage, le pre de


lalgbre ( qui lon doit aussi notre systme dcimal de numrotation), propose un traitement systmatique des quations quadratiques.
De nos jours, tout tudiant du secondaire connat la solution algbraque
de lquation ax2 + bx + c = 0 :

b b2 4ac
x1 , x2 =
(1B-20)
2a
mais il est instructif daborder le problme selon une approche gomtrique.
Pour cela, il est avantageux de rcrire ax2 + bx + c = 0 sous la forme :
x2 = px + q

(1B-21)

o p = b/a et q = c/a.
Gomtriquement, les racines de lquation 1B-21 sont les points dintersection dune parabole (membre de gauche) avec une droite quelconque
(membre de droite). Lorsque la pente de la droite est nulle (p = 0), nous
obtenons deux points dintersection lorsque q > 0, un point dintersection
lorsque q = 0 (labcisse est alors tangente la parabole) et aucun point dintersection lorsque q < 0. Le mme scnario se produit lorsque la pente est
non-nulle.
y

y
2

y = x2

y=x

y = px + q
y=q
q

(a)

(b)

Figure 1.12 (a) cas o p = 0 (b) cas o p < 0 (les mmes conclusions
sappliquent lorsque p > 0)
Supposons maintenant que la pente soit ngative, comme cest le cas
la Fig. 1.12b. Le nombre de points dintersection dpend de la valeur du
discrminant b2 4ac de lquation 1B-20. Lorsque ce dernier est positif, nul
ou ngatif, on a respectivement deux, un ou aucun points dintersection. Par

1.B.7

93

Apprciation des nombres complexes

symtrie, on obtient des rsultats similaires lorsque la pente est positive. La


projection verticale de ces points dintersection sur labcisse dtermine les
racines de lquation quadratique.
Jusquau milieu du XVIme sicle, les mathmaticiens nprouvrent aucune motivation dfinir la racine carre dun nombre ngatif. Lorsque le
discrminant tait ngatif, on disait simplement que lquation quadratique
nadmettait pas de solutions relles. Cest la recherche dune mthode systmatique de rsolution des quations du troisime degr, dont la forme
gnrale est donne par ax3 + bx2 + cx + d = 0, qui fit basculer cet tat de
choses.
Cette fois, il est avantageux de rduire lquation ax3 + bx2 + cx + d = 0,
en effectuant le changement de variable suivant : x x b/3a, de faon
faire disparatre le terme quadratique et ainsi obtenir 48 :
x3 = px + q

(1B-22)

(nous avons conserv le mme symbole x pour dsigner la variable transforme). Gomtriquement cette fois, les racines de lquation cubique sont les
points dintersection de la courbe plane du troisime degr x3 avec une droite
quelconque. On remarquera que lorsque la pente de la droite est ngative, il
nexiste quun et un seul point dintersection.
y

y
y = x3

y = x3

y = px + q
y = px + q

x1

x1

x2

x3

(a)

(b)

Figure 1.13 (a) cas tudi par Tartaglia (p 6 0) (b) casus irreducibilis
constat par Cardano
48. On verifiera que p =

b2
3a2

c
a

2b
et q = 27a
3 +

bc
3a2

ad .

94

Annexe 1B

En 1535, il devint vident que le professeur de mathmatiques Niccolo


Fontana, dit "Tartaglia", tait en possession dune mthode de rsolution
gnrale pour une classe particulire dquations du troisime degr, correspondant au cas o la pente de la droite est ngative 49 (voir Fig. 1.13a). En
1539, Gerolamo Cardano, alors confrencier en mathmatiques la fondation Piatti de Milan, supplia Tartaglia de lui faire part de sa mthode. Ce
dernier acquiesca en soutirant toutefois Cardano la promesse de ne jamais
la dvoiler quiconque 50 . Par la suite, Cardano gnralisa la mthode pour
inclure le cas o la pente est positive (voir Fig. 1.13b). Il obtint alors la
formule gnrale suivante :
v
v
s 
s 
u
 3 u
 3
2
u
u
3 q
3 q
p
p
q
q 2
t
t
+

2
2
3
2
2
3
Cette formule ne pose aucun problme lorsque p 6 0 ou mme lorsque
p > 0 et que (q/2)2 > (p/3)3 . Mais le cas o p > 0 et (q/2)2 < (p/3)3 provoquait chez Cardano une vritable dissonance cognitive car cest prcisment
le cas o la droite intersecte la courbe y = x3 en trois endroits distincts !
Pour obtenir une solution quil savait bien relle, il tait forc de prendre
la racine carre dun nombre ngatif. Par exemple, la mthode de Cardano
donne pour lquation :
x3 = 15x + 4
des solutions exprimes sous la forme :
q
q

3
3
2 + 121 + 2 121

(1B-23)

ce qui, premire vue, ne semble pas favoriser une solution relle, par
exemple x = 4 51 . Ne sachant comment oprer sur des nombres complexes
pour obtenir des solutions relles, il qualifia ce cas particulier de casus irreducibilis. Cardano croyait avoir dcouvert une moisissure dans le tissu parfait
des mathmatiques. Mais contrairement Alexander Fleming, il lui manqua
louverture desprit ncessaire pour transformer cette moisissure en dcouverte scientifique majeure.
49. Puisqu lpoque on vitait autant que possible lutilisation des nombres ngatifs,
cette classe de problmes aurait plutt t formule ainsi : x3 + px = q, avec p > 0.
50. Tartaglia supplmentait ses revenus en participant des dfis publics lancs par
dautres mathmaticiens. Il cherchait ainsi conserver un avantage comptitif en gardant
ses mthodes secrtes.

51. Cest pourtant exact ! Les valeurs relles 4,2 + 3 et 2 3 sont bien les valeurs
rduites de lexpression 1B-23.

1.B.7

Apprciation des nombres complexes

95

En 1545, Cardano publia sa mthode 52 dans son livre Ars Magna et


rvla au monde entier la louche ralit des racines carres de nombres
ngatifs.
Cest le dbut de la longue saga des nombres complexes qui schelonne
sur plusieurs sicles. Dj en 1569, dans son livre LAlgebra, litalien Raffaele
Bombelli contribue la comprhension des nombres imaginaires en introduisant les symboles i et i. En 1593, le franais Franois Vite offre une
premire solution du casus irreducibilis en utilisant des arguments trigonomtriques. En 1629, le franais Albert Girard postule quune quation algbrique possde autant de racines que son degr, mme sil doit se trouver que
ces racines ne soient pas toutes relles. Au sicle suivant, le suisse Leonard
Euler rendit plus palpable le concept dun nombre complexe en identifiant
les trois racines cubiques de lunit et en lguant lhumanit une de ses
plus belles formules mathmatiques. Dans sa dissertation doctorale de 1799,
lallemand Carl Friedrich Gauss dmontra rigoureusement le thorme fondamental de lalgbre intuitionn par Girard. En 1806, le suisse Jean-Robert
Argand, fournit une interprtation gomtrique des nombres complexes en
tant que points dans un plan. Dans la premire moiti du XIXme sicle, le
franais Augustin-Louis Cauchy tablit tous les fondements de lanalyse complexe. En 1843, lirlandais William Rowan Hamilton gnralisa les nombres
complexes un espace quatre dimensions, inventant ainsi les nombres hypercomplexes appels quaternions.
Mais, ironiquement, lultime dmarche qui fit passer le statut des nombres
complexes de simple artifice de calcul celui dobjet mathmatique lgitime nen fut pas une qui cherchait les dmarquer davantage des nombres
rels mais plutt une qui visait fondre les deux concepts dans le creuset
dune seule et mme abstraction. labore par le dernier lve de Gauss,
Richard Dedekind, et formalise en 1895 par son ami Heinrich Weber dans
son livre Lehrbuch der Algebra, le concept de corps 53 vient enrichir la thorie
algbrique des nombres. Dsormais, il est dusage de considrer les nombres
rels et complexes comme deux reprsentations spcifiques dune structure
algbrique abstraite dont ils hritent leurs proprits. Vus sous cet angle, les
rels ne sont pas moins imaginaires que les complexes !
52. En 1543, lors dune visite Bologne, Cardano obtint la confirmation que Scipione
del Ferro, un professeur de mathmatiques lUniversit qui tait dcd en 1526, avait
t le premier dcouvrir la mthode de rsolution de lquation cubique sans toutefois
la publier. Se sentant libr de sa promesse faite Tartaglia, Cardano dcida de publier
ses propres rsultats. Il sensuivit une violente querelle entre les deux hommes qui se
poursuivit jusqu la mort de Tartaglia en 1557.
53. Krper, en allemand, dont on retiendra le symbole K pour dsigner un corps quelconque.

96

Annexe 1B

Que retient-on aujourdhui de la nature propre des nombres, quils soient


rels ou complexes ? Je ne crois pas me tromper en disant que, pour le mathmaticien moderne, les nombres complexes ne suscitent plus la mfiance mais
bien ladmiration. Le clbre mathmaticien Roger Penrose[13] va mme jusqu les qualifier de nombres magiques . Le sentiment actuel sen trouve
bien rsum par la citation suivante, attribue au mathmaticien francais
Jacques Hadamard 54 :
Le plus court chemin entre deux vrits dans le domaine rel
passe par le domaine complexe.
Les ingnieurs, qui sont des gens pratiques, utilisent couramment la notation complexe pour dcrire des quantits physiques pourtant bien relles. Par
exemple, lintensit du champ lectrique dune onde plane monochromatique
varie selon :
E = E0 cos(k r t)
Les ingnieurs prfrent toutefois travailler avec lexpression complexe suivante :
E0 ei(krt)
quitte traner dans leurs calculs une partie imaginaire, sans aucune contrepartie physique, quils laisseront ultrieurement tomber pour ne retenir que
la partie relle de lexpression finale, selon :

E = < E0 ei(krt)
Mais, de tous les scientifiques, ce sont assurment les physiciens qui apprcient le plus les nombres complexes pour leur qualit intrinsque. Quon
se le dise : la plus petite chelle, les lois qui rgissent notre univers sont
fondamentalement tributaires des nombres complexes. De tous les systmes
de nombres que nous ayons dcouverts ou invents, cest encore celui qui
dcrit le plus adquatement la ralit des phnomnes naturels.

54. Une certaine controverse existe toujours quant lorigine prcise de cette citation
dont la formulation concise est souvent prfre le citation antrieure de au mathmaticien et lhomme politique franais Paul Painlev, sur laquelle il ne plane aucune
quivoque : Il apparut que, entre deux vrits du domaine rel, le chemin le plus facile et
le plus court passe souvent par le domaine complexe.

1.C

97

Topologie gnrale

Annexe 1.C

Topologie gnrale

La topologie gnrale puise ses racines dans la thorie des ensembles. Elle
formalise la notion intuitive de proximit entre les lments, mme lorsque
lespace en question nest quun ensemble de points dnu de norme, de
mtrique ou de toute structure additionnelle. Elle permet ltude de concepts
fondamentaux tels que la convergence dune suite de points et la continuit
des applications dfinies sur de tels espaces.
Cet annexe se veut une introduction lmentaire la topologie gnrale.
La thorie sapplique des ensembles quelconques X qui ne sont ni ncessairement des espaces vectoriels, ni ncessairement des espaces mtriques.

1.C.1

Les espaces topologiques

Convention. Lensemble des parties de lensemble X sera dsign par


P(X).
Dfinition 1C.1 Soit X un ensemble non vide. Une famille T P(X)
est une topologie sur X si les trois axiomes suivants sont vrifis :
Lensemble vide de mme que X appartiennent T :
, X T

(1C-1a)

Lunion quelconque dlments de T appartient T :


[
Gi T , i I a =
Gi T

(1C-1b)

iI

Lintersection finie dlments de T appartient T :


\
Gi T , i {1, . . . , n} =
Gi T

(1C-1c)

i{1,...,n}

Le couple (X, T ) forme alors un espace topologique b .


a. Lensemble des indices I peut tre fini, dnombrable ou non dnombrable.
b. Pour soulager lcriture, il suffira de parler simplement de lespace topologique X
plutt que de lespace topologique (X, T ) sans que cela prte confusion.

Les lments dune topologie T sont appels des ouverts 55 . Les compl55. Les lois de Morgan nous offrent une faon quivalente de dfinir une topologie en
choisissant plutt le ferm comme unit fondamentale. Nous poursuivrons ici lusage gnral qui privilgie louvert.

98

Annexe 1C

mentaires des ouverts dans X sont appels des ferms. Il est important de
bien comprendre quen topologie les notions douverts et de ferms ne sont
pas mutuellement exclusives. Dailleurs le premier axiome nous garantit que
toute topologie contient des lments qui sont la fois des ouverts et des
ferms. En effet, les ouverts X et sont mutuellement complmentaires
puisque X\ = X et que X\X = ; par consquent, X et sont la fois
des ouverts et des ferms.
Notons quil est toujours possible de dfinir une topologie sur tout ensemble non-vide. Les deux exemples suivants sont incontournables.
Exemple 1C.1. Soit X un ensemble quelconque non vide. La topologie
T = {, X} dont les seuls ouverts sont lensemble vide et lensemble X est
appele la topologie grossire.
Exemple 1C.2. Soit X un ensemble quelconque non vide. La topologie
T = P(X) o toutes les parties de X sont des ouverts est appele la topologie
discrte.
Remarque. La topologie grossire et la topologie discrte sont deux
exemples de topologies triviales. Ces deux exemples sont deux cas extrmes
o tous les lments de T sont la fois des ouverts et des ferms. Nous
verrons que les topologies les plus dsirables sont les topologies non triviales
o les seuls lments qui possdent cette proprit sont et X.
Le nombre de topologies diffrentes que lon peut dfinir sur un ensemble
croit trs rapidement avec la cardinalit de lensemble. Ainsi, si lon ne peut
dfinir quune seule topologie sur un ensemble ne contenant quun lment
(la topologie grossire), on peut en dfinir quatre sur un ensemble contenant
deux lments et dj vingt-neuf sur un ensemble ne contenant que trois
lments.
Exemple 1C.3. Soit lensemble X = {a, b, c, d}. Alors,
T1 = {, {b}, {a, b}, {b, c}, {b, d}, {a, b, c}, {a, b, d}, {b, c, d}, X}
et T2 = {, {b}, {d}, {a, b}, {b, c}, {b, d}, {a, b, c}, {a, b, d}, {b, c, d}, X}
sont deux topologies diffrentes sur X. Notez que les seuls lments de T1
qui soient la fois des ouverts et des ferms sont et X, ce qui nest pas
le cas pour T2 , car {d} et {a, b, c} ont aussi cette proprit. Remarquez que
{a, b, c} est ouvert dans T1 alors quil est la fois ouvert et ferm dans T2 . Il
est trs important de comprendre que la notion d ouvert et de ferm
est une notion relative qui dpend du choix de la topologie.

1.C.2

1.C.2

99

Voisinage dun point

Voisinage dun point

Dans un espace topologique, les lments de lensemble X sont des points.


Remarquez que pour quun point x X soit un ouvert, il faut que le singleton
{x} T .
Dfinition 1C.2 Soit (X, T ), un espace topologique. Une partie V de
X est un voisinage dun point x X ssi V contient un ouvert G T qui lui
mme contient x.
V X est un voisinage de x

G T : x G V

X
V
G
x

Figure 1.14 La partie V de X est un voisinage du point x puisquelle


contient un ouvert G tel que x G V .
Remarque. Pour la dfinition dun voisinage, nous nexigeons pas que la
partie V soit elle-mme un ouvert. En fait, il peut sagir dun ouvert, dun
ferm ou encore dun sous-ensemble qui ne soit ni un ouvert, ni un ferm.
Exemple 1C.4. La partie {a, c, d} de lensemble X dcrit lexemple
1C.3 nest un voisinage daucun des points de lespace topologique (X, T1 )
mais est un voisinage du point d de lespace topologique (X, T2 ) (et seulement
du point d).
Proposition 1C.1 Soit (X, T ), un espace topologique. Une partie V de
X est un ouvert ssi V est un voisinage de chacun de ses points.
Exemple 1C.5. Il est clair que la partie {a, c, d} de lexemple 1C.3 nest
pas un ouvert de lespace topologique (X, T2 ) puisquelle nest un voisinage
ni de a ni de c. Dans ce cas prcis, on vrifie quil sagit effectivement dun
ferm puisque {a, c, d} = X\{b} o {b} est un ouvert de T2 .

100

Annexe 1C
Convention. Lensemble des voisinages de x est dnot par V(x), soit :
V(x) = {V P(X) | G T , x G V }
Exemple 1C.6. Soit lensemble X = {a, b, c, d, e} dot de la topologie :
T = {, {b}, {c}, {a, b}, {b, c}, {c, d}, {a, b, c}, {b, c, d}, {a, b, c, d}, X}

Lensemble des voisinages de d est :


V(d) = {{c, d}, {a, c, d}, {b, c, d}, {c, d, e}, {a, b, c, d}, {a, c, d, e}, {b, c, d, e}, X}
Rappelons que si tout voisinage de d contient un ouvert, il nest pas ncessairement un ouvert pour autant. Dans lexemple, {a, c} est un voisinage de
c, mais nest ni un ouvert, ni un ferm.

1.C.3

Prbase dun espace topologique

Dfinition 1C.3 Soit (X, T ), un espace topologique et A un ouvert


quelconque. Une famille {Gi }iI douverts de T est un recouvrement ouvert
de A ssi :
[
A=
Gi
(1C-2a)
iI

Remarque. Le concept de recouvrement ouvert est utile mme lorsque A


est une partie quelconque de X, pas ncessairement un ouvert. Dans ce cas
il faut remplacer lgalit dans lquation 1C-2a par le symbole dinclusion,
soit :
[
A
Gi
(1C-2b)
iI

La relation dordre partiel dinclusion, applique aux diffrentes topologies comparables, conduit la dfinition suivante :
Dfinition 1C.4 Soient deux topologies T1 et T2 dfinies sur un mme
ensemble X. Si :
T1 T2
alors la topologie T1 est dite moins fine que la topologie T2 et la topologie T2
est dite plus fine que la topologie T1 .
Exemple 1C.7. lexemple 1C.3, la topologie T2 est plus fine que la
topologie T1 puisque T1 T2 .

1.C.3

Prbase dun espace topologique

101

Remarque. Il est vident que la topologie grossire est la moins fine et


la topologie discrte est la plus fine de toutes les topologies que lon puisse
dfinir sur un ensemble quelconque X.
Thorme 1C.2 Soit {Ti }iI , une famille quelconque de topologies dfinies sur un mme ensemble X. Alors lintersection :
\
Ti
iI

de toutes ces topologies est aussi une topologie sur X.


Exemple 1C.8. Soit lensemble X = {a, b, c, d, e} ainsi que les topologies T1 et T2 dfinies sur X :
T1 = {, {b}, {c}, {a, b}, {b, c}, {c, d}, {a, b, c}, {b, c, d}, {a, b, c, d}, X}
T2 = {, {c}, {e}, {a, e}, {c, d}, {c, e}, {a, c, e}, {c, d, e}, {a, c, d, e}, X}
Alors T1 T2 = {, {c}, {c, d}, X} qui est aussi une topologie sur X.
Il existe plusieurs faons de dfinir une topologie sur un ensemble. Toute
famille de parties de X peut en effet servir engendrer une topologie unique.
Dfinition 1C.5 Soit X un ensemble non-vide et soit A P(X) une
famille quelconque de parties de X. La topologie TA engendre par la famille
A de parties de X est lintersection de toutes les topologies TiI dfinies sur
X qui contiennent A :
\
TA =
Ti
i I, A Ti
iI

Nous dirons que A est la prbase de la topologie TA .


Note. Une dfinition alternative de la prbase exige que les lments de
la famille quelconque de parties recouvrent lespace X. Ce nest pas le cas
pour la dfinition 1C.5.
Remarque. Par construction, la topologie TA est la moins fine des topologies contenant la prbase A. Notez que TA existe toujours ; dans le plus
extrme des cas, il sagit de P(X).

102

1.C.4

Annexe 1C

Base dun espace topologique

La dfinition 1C.5 nous dit bien que toute prbase A engendre une topologie unique TA mais la construction dune telle topologie peut rapidement
savrer fastidieuse si lon sen tient la mthode dcrite. Heureusement, il
existe une procdure beaucoup plus pratique que nous verrons la fin de
cette section.
Dfinition 1C.6 Soit (X, T ) un espace topologique. Une famille douverts B = {Bi }iI T est une base de la topologie T ssi pour chaque ouvert
de T , il existe un recouvrement ouvert dlments de B :
[
G T ,
G=
Bj ,
Bj B
jJ

Remarque. Il ne faut en aucun cas confondre base dun espace vectoriel et base dun espace topologique. Les lments dune base dun espace
vectoriel sont des vecteurs. Dune part, un espace topologique ne possde
pas ncessairement la structure despace vectoriel et de lautre, les lments
dune base dun espace topologique sont des ouverts.
Nous sommes donc maintenant en mesure, tant donn une topologie T
et une base suppose B, de vrifier que B est bien une base de T . De plus,
il est facile de concevoir que, si nous sommes en possession dune base B,
nous pouvons toujours reconstruire la topologie T en prenant lensemble de
toutes les unions possibles des lments de B. Mais est-ce que cette procdure
dtermine T de faon unique ? Le thorme suivant rpond cette question.
Thorme 1C.3 Soit (X, T ) un espace topologique et B une base de
T . Alors B dtermine T de faon unique.
Dmonstration. Procdons par reductio ad absurdum. Supposons que B soit
une mme base pour deux topologies diffrentes, T et T 0 . Alors il existe
au moins un lment G P(X) qui appartient lune des topologies sans
appartenir lautre. Sans perte de gnralit nous pouvons supposer que
G T mais que G 6 T 0 . Puisque B est une base de T nous avons que :
[
G=
Bi
Bi B
iI

Mais puisque B est aussi une base de T 0 , alors toute union dlments quelconques de B doit ncessairement appartenir T 0 . En particulier, G T 0 , ce
qui contradit notre hypothse de dpart et confirme le fait que la topologie
engendre par la base B est bien unique.

1.C.4

Base dun espace topologique

103

Ici, un petit caveat simpose. Sil est vrai quune base dtermine une
topologie de faon unique, la mme topologie peut tre engendre par deux
bases diffrentes.
Dfinition 1C.7 Soit (X, T ) un espace topologique et deux bases
B1 , B2 T . Ces deux bases sont dites quivalentes si elles engendrent une
mme topologie, c.--d. si :
TB1 = TB2
Proposition 1C.4 Soit (X, T ) un espace topologique et B une base de
T . Alors toute famille B 0 telle que :
B B0 T
est une base quivalente de T .
Exemple 1C.9. Les bases B = {, {b}, {c}, {a, b}, {b, c}, {c, d}, X} et
= {, {b}, {c}, {a, b}, {b, c}, {c, d}, {a, b, c, d}, X} engendrent toutes deux
la topologie T1 de lexemple 1C.8.

B0

Les deux thormes suivants proposent chacuns une dfinition quivalente


de la base dune topologie.
Thorme 1C.5 Soit (X, T ) un espace topologique. Une famille B T
est une base de T ssi G T et x G, il existe un Bi B tel que :
x Bi G

Bi
x

Figure 1.15 Si pour tout point x dun ouvert quelconque G il existe un


Bi B tel que x Bi G, alors B est une base de T .

104

Annexe 1C

Thorme 1C.6 Soit X un ensemble non-vide.


Une famille douverts B P(X) est la base dune topologie unique TB o
TB = {A X | A est lunion dlments de B} ssi :
1. X est lunion dlments de B.
2. Lintersection dune paire quelconque dlments de B est aussi lunion
dlments de B.
Nous sommes maintenant en mesure de construire une topologie unique
partir dune prbase quelconque. Dans un premier temps, nous construisons
lensemble de toutes les intersections finies des lments de la prbase. Sils
ne sont pas dj prsents, nous rajoutons les lments et X et, de cette
faon, nous obtenons une base. En prenant lensemble des unions possibles
des lments de la base, nous obtenons la topologie dsire.
Exemple 1C.10. Soit lensemble X = {a, b, c, d, e} et
A = {{a, e}, {c, d}, {c, e}}
une prbase. Remarquez que lunion des lments de la prbase ne couvre
pas lensemble X. Lensemble des intersections finies de A rajout de et
de X constitue la base {, {c}, {e}, {a, e}, {c, d}, {c, e}, X} de la topologie
TA qui est identique la topologie T2 de lexemple 1C.8.

1.C.5

Topologie induite

Nous avons beaucoup discouru sur les topologies engendres par des bases
et des prbases. Nous allons maintenant prciser la notion de topologie induite sur une partie de X.
Thorme 1C.7 Soit (X, T ) un espace topologique et soit S X,
une partie de X. La topologie induite de (X, T ) sur S est la topologie T (S)
rsultant de lintersection des ouverts de T avec S :
T (S) = {S G | G T }
Remarque. Un sous-espace S muni de la topologie induite T (S) constitue un sous-espace topologique (S, T (S)) de lespace (X, T ).

1.C.6

1.C.6

105

Continuit

Continuit

La topologie permet de dfinir la notion de continuit sans faire appel


une mtrique quelconque.
Dfinition 1C.8 Soient (X, TX ) et (Y, TY ), deux espaces topologiques.
Une application F : X Y est dite continue ssi limage rciproque (la
primage) de tout ouvert de TY est un ouvert de TX , c.--d. ssi :
GY TY ,

(X, TX )

F 1 [GY ] TX

(Y, TY )

F 1
GY

GX

Figure 1.16 Lapplication F est continue ssi la primage de tout ouvert


de TY est un ouvert de TX .
Remarque. Lexpression F 1 utilise la dfinition 1C.8 de mme qu
la Fig. 1.16 doit tre interprte comme la correspondance rciproque au sens
de la thorie des ensembles, c.--d. :
F 1 [A] = {x X | A Y et F (x) A}
ce qui nimplique pas que lapplication F soit inversible. Autrement dit, lutilisation de lexpression F 1 nimplique pas dans ce contexte que F soit une
bijection. Le lecteur devrait se convaincre que si la topologie TX est la topologie discrte P(X) ou que si la topologie TY est la topologie grossire {, Y },
alors lapplication F sera toujours continue, quel que soit la faon dont elle
est dfinie (Pourquoi ?).
Remarque. La dfinition de la continuit nimplique pas que limage
dun ouvert soit aussi un ouvert.

106

Annexe 1C

Remarque. On peut aussi caractriser la continuit laide de ferms.


Ainsi, lapplication F est continue ssi la primage de tout ferm de TY est
un ferm de TX (Voir le Prob. 1.15).
Remarque. Une application continue peut cesser de ltre (tout comme
une application non continue peut le devenir) par un remplacement appropri
dune des topologies. Ainsi, nous pourrions tre ports croire que lapplication identit F (x) = x est trivialement continue, mais mme dans ce cas, le
choix des topologies demeure le facteur discrminant (Voir le Prob. 1.17).
Exemple 1C.11. Soient (X, TX ) et (Y, TY ) deux espaces topologiques
o X = {a, b, c, d, e}, Y = {m, n, o, p, q} et :
TX = {, {a}, {b}, {a, b}, {b, c, d}, {a, b, c, d}, X}
TY = {, {n}, {o}, {m, n}, {n, o}, {o, p}, {m, n, o}, {n, o, p}, {m, n, o, p}, Y }
Soit lapplication F : X Y dfinie ainsi (voir Fig. 1.17) :
F (a) = m; F (b) = n; F (c) = n; F (d) = n; F (e) = q

X
a

Y
F

Figure 1.17 Lapplication F est continue pour les topologies TX et TY de


lexemple 1C.11.
Alors F est continue pour les topologies TX et TY puisque la primage
de chaque ouvert de TY est un ouvert de TX :

1.C.6

107

Continuit

F 1 [] = ;
F 1 [ Y ] = X;
F 1 [{n}] = {b, c, d};
F 1 [{o}] = ;
F 1 [{m, n}] = {a, b, c, d};
F 1 [{n, o}] = {b, c, d};
F 1 [{o, p}] = ;
F 1 [{m, n, o}] = {a, b, c, d};
F 1 [{n, o, p}] = {b, c, d};
F 1 [{m, n, o, p}] = {a, b, c, d};
Remarquez que F nest pas inversible puisquil ne sagit pas dune bijection
et que limage dun ouvert de TX nest pas ncessairement un ouvert de TY
(par exemple : F [{a}] = {m}). De plus, si lon substitue TX la topologie :
TX0 = {, {a}, {b}, {a, b}, {a, b, c, d}, X}
lon vrifiera que F cesse dtre continue.
Selon la dfinition donne en 1C.8, la continuit est un attribut global
dune application. Il est tout aussi utile de dfinir une notion locale de la
continuit, valide en un point prcis de lespace.
Dfinition 1C.9 Soient (X, TX ) et (Y, TY ), deux espaces topologiques.
Une application F : X Y est dite continue en un point a X ssi la
primage de tout ouvert GY de TY contenant F (a) est un sur-ensemble dun
ouvert GX de TX contenant a, c.--.d. ssi :
GY TY , F (a) GY ,

GX TX , a GX tel que GX F 1 [GY ]

ou de faon quivalente :
GY TY , F (a) GY ,

GX TX , a GX tel que F [GX ] GY

Remarque. Pour dmontrer quune application F nest pas continue en


un point a, il suffit de trouver un seul ouvert GY contenant F (a) dont la
primage ne contient pas un ouvert contenant a.

108

Annexe 1C

Remarque. On peut donner une dfinition quivalente de la continuit


en un point en termes de voisinages. Une application F : X Y est continue
en un point a ssi la primage de tout voisinage de F (a) est un voisinage de
a, autrement dit ssi :
F 1 [VY ] VX (a)

VY VY (F (a)),

F 1

GY
GX

F (a)

Figure 1.18 Lapplication F est continue au point a ssi la primage de


tout voisinage de F (a) est un voisinage de a. Ici, nous avons choisi un ouvert
GY en tant que voisinage de F (a).
Exemple 1C.12. Soit (X, T ) un espace topologique o :
X = {a, b, c, d, e} et T = {, {a}, {b}, {a, b}, {b, c, d}, {a, b, c, d}, X}
Soit lapplication F : X X dfinie ainsi (voir Fig. 1.19) :
F (a) = b; F (b) = a; F (c) = e; F (d) = c; F (e) = d
Lapplication F nest pas continue en d car {b, c, d} est un ouvert contenant F (d) = c dont la primage {a, d, e} nest pas un voisinage de d. De
mme, F nest pas continue en e puisque {b, c, d} est un ouvert contenant
F (e) = d dont la primage {a, d, e} nest pas un voisinage de e. Enfin, la
continuit du point c est assure car le seul ouvert contenant F (c) = e est
X, qui est un voisinage de e par dfaut.
Remarquez que le fait que lapplication F soit une bijection est sans
consquence pour les questions de continuit.
Thorme 1C.8 Soient (X, TX ) et (Y, TY ), deux espaces topologiques.
Une application F : X Y est continue ssi F est continue en tout point de
X.

1.C.7

109

quivalence topologique
X
a

X
F

Figure 1.19 Lapplication F de lexemple 1C.12 est continue pour les


points a, b et c mais non pour les points d et e.

1.C.7

quivalence topologique

La continuit permet dtablir la notion dquivalence topologique entre


deux espaces.
Dfinition 1C.10 Soient (X, TX ) et (Y, TY ), deux espaces topologiques.
Une application F : X Y est un homomorphisme ssi F est une bijection
continue et si lapplication rciproque F 1 est aussi une bijection continue.
Remarque. Sil nest pas ncessaire que lapplication F soit une bijection
pour quelle soit continue, il est cependant essentiel que F soit une bijection pour quelle soit un homomorphisme. Le fait que F soit une bijection
entrane automatiquement lexistence de la bijection rciproque F 1 . Par
contre le fait que F soit une bijection continue nentrane pas ncessairement
la continuit de F 1 .
Dfinition 1C.11 Deux espaces topologiques (X, TX ) et (Y, TY ) sont
dits homomorphes, ou topologiquement quivalents, sil existe une application F : X Y qui soit un homomorphisme.
Convention. Nous utiliserons le symbole
= pour reprsenter le fait que
deux espaces topologiques sont homomorphes, en crivant :
(X, TX )
= (Y, TY )
tre homomorphe est aussi une relation dquivalence.

110

Annexe 1C

Dfinition 1C.12 Une proprit qui est partage par tous les espaces
topologiquement quivalents est une proprit topologique.
Remarque. La topologie est souvent dfinie comme tant ltude des
proprits qui demeurent invariantes sous laction de transformations continues.

1.C.8

Convergence

Jusqu prsent, les espaces qui nous ont servi dexemples taient des espaces simples, ne contenant quun nombre fini de points. Les espaces qui nous
intressent sont gnralement constitus dune infinit 56 de points. Nous
poursuivons ltude de tels espaces, en commencant par la notion de convergence dune suite de points dans un espace topologique X.
Rappellons quune suite est une application 57 N X qui associe
chaque n N un point xn X :
n 7 xn
Convention. Nous crirons symboliquement (xn )nN pour dsigner une
suite infinie :
(xn )nN x1 , x2 , . . . , xn , . . .
Dfinition 1C.13 Soit (X, T ), un espace topologique. Nous dirons que
la suite (xn )nN de points de lespace X converge vers le point x X, ou
encore quelle admet x comme limite, ssi pour tout ouvert G T qui contient
le point x, il existe un entier positif nG N tel que :
n > nG = xn G
Autrement dit, tous les termes de la suite, lexemption possible dun
nombre fini, sont contenus dans G.
Si tel est le cas, alors la suite (xn )nN est une suite convergente vers x,
ce que nous dnoterons par :
lim xn = x

Remarque. Le point limite x doit absolument appartenir X pour que


lon puisse parler de convergence.
56. Cette infinit peut tre dnombrable ou non dnombrable.
57. On peut utiliser indiffremment N = {0, 1, 2, 3, . . .} ou N\{0} selon le besoin spcifique.

1.C.9

111

Adhrence

Les proprits des suites convergentes dpendent du choix de la topologie


tel quen tmoigne abondamment lexemple suivant.
Exemple 1C.13. Soit (R, {, X}) lensemble des rels muni de la topologie grossire. Le seul ouvert qui contient des points de X est X lui-mme
et il les contient tous. De plus, toute suite de rels (xn )nN est entirement
contenue dans X. Daprs la dfinition 1C.13, il sensuit que, pour un tel
espace topologique, toute suite converge vers tous les points de lespace.
Nous terminons cette section en tablissant un lien intressant entre la
notion de convergence dune suite et celle de continuit en un point.
Dfinition 1C.14 Soient deux espaces topologiques (X, TX ) et (Y, TY )
et soit F : X Y , une application quelconque.
Nous dirons que F est squentiellement continue en un point x X si
pour toute suite (xn )nN qui converge vers x, la suite (F (xn ))nN converge
elle aussi vers F (x) dans Y . Symboliquement :
lim xn = x

lim F (xn ) = F (x)

Remarque. Il est facile de dmontrer que toute application qui est continue en un point est ncessairement squentiellement continue en ce mme
point. Par contre linverse nest pas vrai en gnral, car il faut pour cela
que les espaces vrifient le premier axiome de dnombrabilit (voir section
1.C.11).

1.C.9

Adhrence

Nous abordons cette section en introduisant encore dautres concepts


gnraux, valides pour tous les espace topologiques.
Dfinition 1C.15 Soit (X, T ), un espace topologique. Une partie A
est dite dense en X ssi tout ouvert non-vide G T contient au moins un
lment de A, soit :
A est dense en X

G 6= T ,

G A 6=

Dfinition 1C.16 Soit (X, T ) un espace topologique. Un point x X


est un point adhrent une partie non-vide A X ssi tout ouvert contenant
x rencontre A, c.--d. :
x est un point adhrent A

G T t.q. x G,

G A 6=

112

Annexe 1C

Remarque. On dit quun point x est un point isol si le singleton {x} est
un ouvert. Si x est un point isol, la condition ncessaire pour quil soit aussi
un point adhrent A est quil doit dj tre contenu dans A (Pourquoi ?).
Une notion trs voisine du point adhrent est celle du point daccumulation.
Dfinition 1C.17 Soit (X, T ) un espace topologique. Un point x X
est un point daccumulation dune partie non-vide A X ssi tout ouvert
contenant x rencontre A en un point autre que x, c.--d. :
x est un pt. daccumulation de A G T t.q. x G, G\{x} A 6=
Remarque. Un point isol ne peut jamais tre un point daccumulation.
Le lecteur devrait se convaincre que si un point daccumulation de A est
toujours un point adhrent A, linverse, un point adhrent est soit un
point daccumulation, soit un point isol appartenant A.
Dfinition 1C.18 Soit (X, T ) un espace topologique. L adhrence
est constitue de lensemble des
dune partie non-vide A X, dnote A,
points adhrents A. Autrement dit :
A = {x X | G T t.q. x G, G A 6= }
Remarque. Il est clair de par la dfinition 1C.18 que tout point x A
fait ncessairement partie de ladhrence de A. Par consquent, il est toujours
vrai que :
A A
(1C-3)
Remarque. La notion dadhrence nous offre une faon alternative dexprimer le fait quune partie A soit dense en X. En effet, la dfinition 1C.15
nous dit quune partie A est dense en X ssi tout ouvert non-vide G T
contient au moins un lment de A. Ceci quivaut dire quune partie A est
dense en X ssi tout point x X fait partie de ladhrence de A :
A est dense en X

A = X

(1C-4)

La notion dadhrence est si importante quelle mrite bien une formulation alternative.
Proposition 1C.9 Soit (X, T ) un espace topologique. L adhrence
dune partie non-vide A X est lintersection de tous les ferms contenant
A:
A = {F X | F est un ferm et A F }

1.C.10

113

Espaces de Hausdorff

Exercice 1C.1. Dmontrez les trois affirmations suivantes :


(i) A est un ferm.
(ii) A est le plus petit ferm contenant A.

(iii) Une partie A est un ferm ssi A = A.


Dmonstration.
(i) Il faut montrer que X\A est un ouvert. Il est prfrable de faire usage de la notation complmentaire suivante :
df.

Sc =
=
= X\S
T
Puisque A =
Fi o A Fi , nous obtenons, en appliquant la loi de
iI

Morgan :
Ac =

\
iI

c
Fi

Fic

iI

Mais tous les Fi sont des ferms et par consquent tous les Fic sont
des ouverts. Le terme de droite tant une union quelconque douverts
est donc un ouvert. En conclusion, Ac est un ouvert et A est bien un
ferm.
(ii) Puisque A = Fi , il sensuit que tout ferm F contenant A est un
iI
sur-ensemble de A :
A A F
(iii) Puisque par hypothse on a que A est un ferm contenant A, on tire
de (ii) que A A. Comme nous avons toujours A A et que nous
avons dmontr en (i) que A est un ferm, nous devons conclure que

A est un ferm ssi A = A.

Remarque. Tout espace topologique X est dense en lui-mme, ce qui


= X selon 1C-4. Par (i) de lexercice 1C.1, cela revient
sexprime par X
dire que lespace X pris en lui-mme, est un ferm. Cela vient confirmer que
tout espace topologique X est la fois un ouvert et un ferm.

1.C.10

Espaces de Hausdorff

lexemple 1C.13, nous avons vu quil est possible pour une suite de
converger vers plusieurs points la fois. Or, il existe une proprit topologique qui assure lunicit de la limite dune suite convergente.

114

Annexe 1C

Dfinition 1C.19 Un espace topologique (X, T ) est un espace de Hausdorff sil satisfait la condition suivante : si x1 et x2 sont deux points
distincts de lespace, alors il est toujours possible de trouver deux ouverts
disjoints G1 et G2 tels que :
x1 G1 , x2 G2

et

G 1 G2 =

Remarque. On dit souvent dun espace de Hausdorff que cest un espace


spar 58 . Nous prouvons une certaine rticence face cette appellation populaire car elle risque dtre confondue avec la notion diffrente despace
sparable 59 . Nous nous en tiendrons donc lappellation despace de Hausdorff.
tre un espace de Hausdorff est une proprit topologique.
Proposition 1C.10 Soient (X, TX )
= (Y, TY ), deux espaces homomorphes. Alors si lun des espaces est un espace de Hausdorff, lautre lest
aussi.
Proposition 1C.11 Soit (X, TX ) un espace de Hausdorff. Alors tout
singleton est un ferm.
Thorme 1C.12 Toute suite convergente (xn )nN dans un espace de
Hausdorff converge vers une limite unique x. Il conviendra alors dcrire :
lim xn = x

Dmonstration. Procdons par reductio ad absurdum. Soit une suite convergente (xn )nN dans un espace de Hausdorff et supposons que limn xn = a
et limn xn = b avec a 6= b. Puisque lespace est de Hausdorff, il existe
des ouverts G1 et G2 tels que a G1 , b G2 et G1 G2 = . Puisque
limn xn = a, par la dfinition 1C.13, il existe un entier positif NG1 N
tel que n1 > NG1 = xn1 G1 . De faon similaire, il existe un entier
positif NG2 N tel que n2 > NG2 = xn2 G2 . Soit N = max(NG1 , NG2 ).
Alors n > N , xn G1 et xn G2 , c.--d. xn G1 G2 . Mais ceci contredit
le fait que G1 et G2 sont disjoints. Lunicit de la limite est donc dmontre.
58. Plus techniquement, un espace de Hausdorff vrifie laxiome de sparation T2 . Les
axiomes de sparation ne sont pas couverts dans cet ouvrage.
59. Un espace sparable contient une partie dnombrable et dense. Un espace topologique peut tre spar mais non sparable ou encore sparable mais non spar.

1.C.11

Axiomes de dnombrabilit

115

Nous sommes en mesure de nous demander si la rciproque du thorme


1C.12 est vraie, c.--d. si le fait que toute suite convergente nadmet quune
seule limite implique que lespace est de Hausdorff. La rponse courte est :
pas ncessairement. La rponse longue nous demande dintroduire le premier
axiome de dnombrabilit.

1.C.11

Axiomes de dnombrabilit

Nous commencons par tablir la notion de base locale.


Dfinition 1C.20 Soit (X, T ) un espace topologique et x un point quelconque de X. Une famille douverts B(x) T , chacun contenant x, est une
base locale en x ssi pour tout ouvert G contenant x on peut trouver un
lment Bi B(x) lui-mme entirement contenu dans G. Autrement dit :
G T t.q. x G, Bi B(x) t.q. x Bi G
Remarque. Si B est une base de la topologie T , alors lensemble des
lments de B qui contiennent x forme une base locale B(x) en x.
Dfinition 1C.21 Un espace topologique (X, T ) vrifie le premier
axiome de dnombrabilit ssi pour tout point quelconque x X il existe
une base locale B(x) qui soit dnombrable.
Remarque. Toute base locale dnombrable B(x) = {B1 , B2 , . . . , Bn , . . .}
peut tre ordonne en une suite dcroissante douverts embots, c.--d. une
suite telle que :
B10 B20 Bn0 . . .
En effet, il suffit pour cela de prendre B10 = B1 , B20 = B10 B2 , B30 = B20 B3 ,
0
et en gnral, Bn0 = Bn1
Bn pour obtenir une suite dcroissante douverts non-vides embots. Chaque Bn0 est lui-mme un ouvert contenant x
puisquil rsulte de lintersection finie douverts contenant x. Par construction, nous avons que Bn0 Bn . Et puisque B(x) est une base locale, pour
tout ouvert G contenant x, il existe un Bi tel que Bi0 Bi G. Donc,
B 0 (x) = {B10 , B20 , . . . , Bn0 , . . .} est aussi une base locale de x. moins dindication contraire, nous prsumerons que toute base locale est ordonne ainsi.
Thorme 1C.13 Soit (X, T ) un espace topologique vrifiant le premier axiome de dnombrabilit. Si toute suite convergente nadmet quune
seule limite, alors lespace (X, T ) est de Hausdorff.

116

Annexe 1C

Dmonstration. Procdons par reductio ad absurdum 60 . Supposons que lespace (X, T ) nest pas un espace de Hausdorff. Alors il existe deux points
distincts x1 , x2 X, x1 6= x2 pour lesquels lintersection de tout ouvert
contenant x1 et de tout ouvert contenant x2 est non-nulle. Puisque lespace respecte le premier axiome de dnombrabilit, il existe aussi deux bases
locales dnombrables douverts embots B(x1 ) = {A1 , A2 , . . . , An , . . .} et
B(x2 ) = {B1 , B2 , . . . , Bn , . . .} telles que Ai Bj 6= pour tout i, j. Si lon
prend un un les lments de chacune des deux bases locales, on peut vrifier aisment que leurs intersections forment aussi une suite dcroissante
douverts embots :
A1 B 1 A2 B 2 An B n . . .
Choississons un point dans chacune de ces intersections :
a1 A1 B1 , a2 A2 B2 , . . . , an An Bn , . . .
et construisons la suite (an )nN . Par dfinition, pour tout ouvert G contenant
x1 , il existe un lment Ai de la base locale B(x1 ) tel que Ai G. Mais
puisque les Ai sont embots, G contient tous les lment de la suite (an )nN
sauf possiblement les i 1 premiers. Par consquent :
lim an = x1

Dun autre ct, puisque pour tout ouvert G contenant x2 , il existe un lment Bj de la base locale B(x2 ) tel que Bj G, un raisonnement identique
nous amne la conclusion que :
lim an = x2

Mais ceci contredit lhypothse de dpart qui veut que toute suite convergente
nadmette quune seule limite. Lespace (X, T ) est donc bel et bien un espace
de Hausdorff.
Vrifier le premier axiome de dnombrabilit est aussi une proprit
topologique.
Proposition 1C.14 Soient (X, TX )
= (Y, TY ), deux espaces homomorphes. Alors si lun des espaces vrifie le premier axiome de dnombrabilit, lautre le vrifie aussi.
60. Prenez note que cette preuve utilise laxiome du choix.

1.C.11

Axiomes de dnombrabilit

117

On peut se demander sil ne serait pas avantageux de privilgier en tout


temps la topologie discrte. Aprs tout, il sagit de la topologie la plus fine
que lon puisse dfinir sur un ensemble et, puisquelle fait de tout singleton
un ouvert, elle gnre automatiquement un espace de Hausdorff. De plus elle
vrifie trivialement le premier axiome de dnombrabilit puisque, pour tout
point x, il suffit de choisir comme base locale dnombrable B(x) = {x} car
tout ouvert contenant x contient par dfaut le seul lment de cette base
locale.
Un lment de rponse simpose si lon garde en mmoire la dfinition
1C.13 dune suite convergente. En effet, si on concilie ensemble les faits
suivants :
le fait que toute suite convergente (an )nN dans un espace de Hausdorff
nadmet quune seule limite,
le fait que tout ouvert doit contenir tous les termes de la suite lexception possible dun nombre fini,
le fait que pour la topologie discrte tout singleton est un ouvert,
il sensuit que, pour la topologie discrte, toute suite qui converge vers le
point a doit ncessairement prendre la forme a1 , a2 , . . . , ak , a, a, a, . . . o
pour n > k, tous les termes an = a. Bref, dans un espace o rgne la
topologie discrte, toute prise de limite se rduit lexpression dnoncs
triviaux de type :
lim a = a
n

Si lexemple 1C.13 tmoigne amplement du fait que la topologie grossire


ne contient pas assez douverts, il est vident que la topologie discrte
en contient trop . Le second axiome de dnombrabilit nous fournit une
excellente indication de ce qui pourrait constituer juste assez douverts.
Dfinition 1C.22 Un espace topologique (X, T ) vrifie le second
axiome de dnombrabilit ssi il admet une base dnombrable pour sa topologie T .
Remarque. Par opposition au premier axiome de dnombrabilit, lexistence dune base dnombrable est une proprit globale dun espace topologique.
Remarque. Tout espace vrifiant le second axiome de dnombrabilit
vrifie aussi par dfaut le premier axiome de dnombrabilit. En effet, pour
obtenir une base dnombrable B(x) en un point quelconque x, il suffit de
prendre tous les lments de la base dnombrable B qui contiennent x.

118

Annexe 1C

Remarque. Il est clair que tout espace Rn ou Cn muni de la topologie


discrte ne respecte pas le second axiome de dnombrabilit. En effet, on sait
par le problme 1.19 que toute base dune topologie discrte doit contenir
tous les singletons de lespace. Or dans Rn ou Cn , lensemble de ces points
isols nest pas dnombrable. Par opposition, la topologie usuelle (voir section
1.6.1) dfinie sur Rn ou Cn possde, quant elle, une base dnombrable, soit
juste ce quil faut douverts.
Vrifier le second axiome de dnombrabilit est aussi une proprit
topologique.
Proposition 1C.15 Soient (X, TX )
= (Y, TY ), deux espaces homomorphes. Alors si lun des espaces vrifie le second axiome de dnombrabilit,
lautre le vrifie aussi.

1.C.12

Sparabilit

Dfinition 1C.23 Un espace topologique (X, T ) est dit sparable ssi il


contient une partie dnombrable et dense.
Remarque. Il ne faut pas confondre espace spar et espace sparable.
Un espace spar est un espace de Hausdorff qui peut ou non tre sparable. Par exemple, la droite relle munie de la topologie usuelle est la fois
spare et sparable ; la droite relle munie de la topologie discrte est spare puisque chaque singleton est un ouvert mais, pour cette mme raison,
toute partie dense doit contenir tous les singletons et doit par consquent
tre non dnombrable ; la droite relle munie de la topologie triviale {, R}
nest pas spare mais elle est sparable puisquelle admet une partie dense
et dnombrable par dfaut, soit R.
Thorme 1C.16 Tout espace topologique (X, T ) qui vrifie le second
axiome de dnombrabilit est sparable.
Dmonstration. Soit B = {B1 , B2 , . . . , Bn , . . .} une base dnombrable de
(X, T ) 61 . Choisissons un point dans chacun des lments de la base :
x1 B1 , x2 B2 , . . . , xn Bn , . . .
Alors lensemble S = {x1 , x2 , . . . , xn , . . .} est dnombrable. Soit un ouvert
non-vide G T . Maintenant, x G, il existe un lment Bi B tel que
61. Prenez note que cette preuve utilise laxiome du choix.

1.C.13

119

Compacit

x Bi G. Cest dire que G contient au moins un lment de S, soit


xi . Et puisque G est quelconque, selon la dfinition 1C.15, S est une partie
dnombrable et dense de X et donc (X, T ) est un espace sparable.
Nous sommes en mesure de nous demander si la rciproque du thorme
1C.16 est vraie, c.--d. si tout espace topologique sparable possde ncessairement une base dnombrable. La rponse courte est : pas ncessairement.
La rponse un peu plus longue est oui si lespace topologique en question est
aussi un espace mtrique (voir la section 1.6.3).
Pour un espace vectoriel topologique de dimension infinie tel quun espace de Hilbert, la condition de sparabilit conduit lexistence dune base
hilbertienne dnombrable.

1.C.13

Compacit

Voici la dfinition moderne dun ensemble compact.


Dfinition 1C.24 Un ensemble compact dun espace topologique (X, T )
est un sous-ensemble K X dont tout recouvrement ouvert admet un sousrecouvrement fini.
Autrement dit, quelque soit le recouvrement ouvert de K, {Gi }iI , o
lensemble indiciel I est gnralement de cardinalit infinie (dnombrable ou
non dnombrable) :
[
K
Gi
iI

il est toujours possible den extraire un sous-ensemble fini J I tel que :


[
K
Gj
jJ

Note. Dans les textes mathmatiques de langue franaise qui sinspirent


de Bourbaki[2], on utilise plutt le terme semi-compact pour dcrire lensemble tel que dfini en 1C.24, le terme compact tant rserv pour les ensembles qui ont la proprit supplmentaire dtre de Hausdorff (spar).
linverse, certains ouvrages anglophones plus anciens diffrencient entre
compact set (dfinition 1C.24) et compactum (rserv pour les espaces de Hausdorff ou pour les espaces mtriques).
Tout ensemble fini dun espace topologique est compact. De mme, lensemble vide est compact.

120

Annexe 1C

Bien que cette dfinition sapplique aux espaces topologiques en toute


gnralit, la notion de compacit a t labore partir de rsultats obtenus
en considrant des espaces mtriques.
Cest le clbre thorme de Heine-Borel qui est lorigine de la dfinition
moderne de la compacit.
Thorme 1C.17 (Heine-Borel) Tout recouvrement ouvert de lintervalle ferm et born [a, b] sur la droite des rels R admet un sousrecouvrement fini.

R
a

Figure 1.20 Lintervalle [a, b] est compact. Pour fins de visualisation, le


recouvrement se fait laide de boules ouvertes dans R2 . Dans R, le recouvrement consiste de six intervalles ouverts l o les boules ouvertes intersectent
la droite des rels.
La compacit est une proprit topologique.
Les thormes suivants valent pour les ensembles compacts despaces
topologiques gnraux.
Thorme 1C.18 Toute partie ferme dun ensemble compact est compacte.
Dmonstration. Soit F , une partie ferme dun ensemble compact K dun
espace topologique (X, T ). Soit maintenant {Gi }iI , un recouvrement ouvert
de F (voir Fig. 1.22) :
[
F
Gi
iI
c
c
F tant
S un ferm,c F = X\F est donc un ouvert. Puisque X = F F ,
on a que iI Gi F est un recouvrement ouvert de X.

X=

[
iI

Gi F c

1.C.13

121

Compacit

X
S

iI

Gi

Figure 1.21 F est une partie ferme


S de lensemble compact K. On peut
supposer que le recouvrement ouvert iI Gi de F rsulte de lunion dune
infinit douverts de X.
et, a fortiori, un recouvrement ouvert de K :
[
K
Gi F c
iI

Lensemble K tant compact, il admet un sous-recouvrement fini de sorte


que :
K G 1 G2 Gn F c
et puisque F K, par hypothse, le recouvrement fini de K est aussi un
recouvrement fini de F :
F G1 G 2 Gn F c

(1C-5)

Posons G = G1 G2 Gn et procdons ensuite quelques oprations


ensemblistes :

F G F c = F F G F c F = F (G F ) (F c F )
= F G F = F G
pour obtenir
F G1 G2 G n
Donc, tout recouvrement ouvert {Gi }iI de F admet un sous-recouvrement fini. Nous en concluons que F est compact.
Note. Lorsque nous affirmons quune partie A dun espace topologique
(X, T ) est compacte, nous sous-entendons toujours quelle est compacte pour
la topologie induite (A, T (A)).

122

Annexe 1C

Proposition 1C.19 Lintersection dun ensemble compact et dun


ferm est un ensemble compact.
Proposition 1C.20 Lunion finie densembles compacts est un ensemble compact.
Thorme 1C.21 Limage continue dun ensemble compact est un ensemble compact.
Dmonstration. Soient (X, TX ) et (Y, TY ), deux espaces topologiques. Soit
F : X Y , une application continue et K un ensemble compact de X.
Considrons un recouvrement ouvert quelconque de F [K] :
F [K]

Gi

Alors,
K = F 1 F [K] F 1

h[
i

i [
Gi =
F 1 [Gi ]
i

1
Puisque F est continue, la primage
S 1F [Gi ] de tout ouvert Gi de Y est un
ouvert de X. Par consquent, i F [Gi ] est un recouvrement ouvert de K.
Comme K est compact, on peut en extraire un sous-recouvrement fini, soit :

K F 1 [G1 ] F 1 [G2 ] F 1 [Gn ]


et
h
i
F [K] F F 1 [G1 ] F 1 [G2 ] F 1 [Gn ]
F F 1 [G1 ] F F 1 [G2 ] F F 1 [Gn ]
G1 G2 Gn
Donc, tout recouvrement ouvert de F [K] admet un sous-recouvrement fini
et limage continue de lensemble compact K est aussi compacte.
Le thorme suivant vaut pour tous les espaces de Hausdorff.
Thorme 1C.22 Tout sous-ensemble compact dun espace de Hausdorff est ferm.

1.C.13

123

Compacit

Dmonstration. Soit K, un sous-ensemble compact dun espace de Hausdorff


(X, T ). Nous allons dmontrer que K c = X\K est un ouvert.
Si K c = alors K = X et K est un ferm par dfaut. Supposons donc
que ce nest pas le cas et quil existe un point x qui nappartient pas K,
donc x K c .
Considrons la famille de tous les ouverts qui contiennent un point de K,
{Up | p K}. Cette famille forme un recouvrement ouvert de K :
[
K
Up
p K

K tant compact, il existe un sous-recouvrement fini {Up1 , Up2 , . . . , Upn } tel


que :
K Up1 Up2 Upn
Comme x K c et pi K, alors pi 6= x, pour toute valeur de i = 1, . . . , n.
Et puisque X est un espace de Hausdorff, pour chaque valeur de i, il existe
des ouverts Upi et Vpi tels que :
pi Upi , x Vpi ,

et Upi Vpi =

(1C-6)

Dfinissons maintenant :
U = Up1 Up2 Upn

(1C-7a)

V = Vp1 Vp2 Vpn

(1C-7b)

U et V sont tous deux des ouverts puisquils rsultent de lunion et de lintersection finie douverts. Par dfinition, nous avons :
KU
Dun autre ct, V tant lintersection de tous les Vpi , il est ncessairement
contenu dans chacun de ces ouverts,
V Vpi , i = 1, . . . , n
de sorte que Upi Vpi = implique que Upi V = . Il est facile de
dmontrer maintenant que U V = . En effet,
U V = (Up1 Up2 Upn ) V
= (Up1 V ) (Up2 V ) (Upn V )
n
[
=
Upi V =
i=1

124

Annexe 1C

X
U

V
x

Figure 1.22 Lorsque K est un sous-ensemble compact dun espace de


Hausdorff X, pour tout point x K c , on peut trouver deux ouverts U et V
tels que K U , x V et U V = .
Puisque K U , il sensuit que K V = et, par consquent, que V K c .
De plus, comme le point x appartient chacun des Vpi , on a que x V K c .
Puisque x est un point tout fait quelconque de K c , il sensuit que K c
est un voisinage de chacun de ses points, donc un ouvert par dfinition.
Si K c est un ouvert, alors K est un ferm.
Un espace topologique (X, T ) est dit compact si lensemble X est compact
dans lespace (X, T ). Lorsque cest le cas, nous dirons simplement que X est
un espace compact.
Un ensemble compact dun espace qui nest pas ncessairement compact
devient un sous-espace compact lorsquil est dot de la topologie induite. Si
lon considre ce sous-espace en tant quentit propre, alors il convient den
parler en terme despace compact.
Notons que les espaces mtriques de dimension finie Rn et Cn ne sont
pas compacts. Si on peut recouvrir la droite relle laide dune infinit
dnombrable dintervalles ouverts de type (x 1, x + 1), o x est un entier
relatif, il est toutefois impossible den extraire un sous-recouvrement fini.
Dfinition 1C.25 Un espace topologique (X, T ) est dit localement
compact si chacun de ses points admet un voisinage compact. Ainsi, pour
tout point x de lespace, il existe un ouvert G contenant x qui est lui-mme
contenu dans un ensemble compact V :
x X, G T , V X,

tel que

xGV

et

V est compact

1.C.13

125

Compacit

Tous les espaces compacts sont localement compacts. En effet, si x est un


point quelconque dun espace compact X, alors chaque ouvert G contenant
x satisfait x G X. Par contre, linverse nest pas ncessairement vrai.
Par exemple, tous les espaces Rn et Cn de dimension finie sont localement
compacts, mais ils ne sont pas compacts.
Thorme 1C.23 Dans un espace de Hausdorff localement compact,
tout ouvert et tout ferm est localement compact.
Dmonstration. 1) Soit A, un ouvert dun espace de Hausdorff (X, T ) et
x A, un point quelconque de A. Puisque X est localement compact, il
existe un ouvert O et un ensemble compact Q tels que :
x O Q et Q est compact
Notons quil ny a rien dans la dfinition 1C.25 qui exige que le voisinage
compact Q (dans X) soit inclus dans louvert A. Cest pourquoi nous allons
dmontrer que dans un espace de Hausdorff, on peut toujours trouver un
voisinage compact de x entirement inclus dans A :
x A, G T , K X, tel que x G K A et K est compact
Notre point de dpart est O Q. Le thorme 1C.22 nous dit dune part
que Q est un ferm de sorte que Q = Q et O Q. Considrons maintenant
O, ladhrence de O. Par (i) de lexercice 1C.1, O est un ferm et par (ii) du
mme exercice, O est le plus petit ferm contenant O, de sorte que :
xOOQ
Enfin, par le thorme 1C.18, O est compact.
Dfinissons G comme tant lintersection de A et de louvert O :
G=AO
Par construction, G est un ouvert pour lequel :
GOO

et x G A

Considrons G, ladhrence de G. Par (i) et (ii) de lexercice 1C.1, G est le


plus petit ferm contenant G :
GGO

126

Annexe 1C

et par le thorme 1C.18, G est compact. Dnotons par H la diffrence entre


les ensembles G et G :
H = G\G G Gc 62
Puisque H rsulte de lintersection dun ensemble compact et dun ferm, il
est compact par la proposition 1C.19.
Nous devons considrer la possibilit que H = (Pourquoi ?). Si H = ,
alors G = G et G est la fois un ouvert et un ferm. Par consquent,
xG=GA
Il suffit alors de poser K = G pour obtenir :
x G K A,

K est compact

Examinons maintenant le cas o H 6= . Puisque x G, par dfinition


x
/ H, ou encore, x H c . Nous avons vu, lors de la dmonstration du thorme 1C.22, qutant donn un ensemble compact dans un espace de Hausdorff et un point extrieur cet ensemble, il est toujours possible de trouver
deux ouverts disjoints dont lun est un sur-ensemble de lensemble compact
et lautre est un voisinage du point extrieur (voir Fig. 1.22). Contextuellement, cela signifie que, pour tout point p de H et pour le point x H c , il
existe deux ouverts U et W tels que :
p H U,

x W,

et U W =

Nous rappelons limplication suivante tire de la thorie des ensembles :


H U = U c H c
Posons V = G W . V est alors un voisinage ouvert de x tel que :
x V G G,

et U V = = V U c

Puisque V appartient la fois G et U c , il appartient leur intersection :


V G Uc
Par la proposition 1C.19, G U c est compact et par le thorme 1C.22, il
est ferm de sorte que :
V V G Uc
62. Notez que le complment dans X dun ensemble A, Ac , nest quun cas particulier
de la diffrence entre deux ensembles : X\A X Ac = Ac .

1.C.13

127

Compacit

et V est compact par le thorme 1C.18. Mais U c H c = GU c GH c


et il sensuit que :
V V G H c = G\H = G\(G\G)
Utilisons maintenant lidentit suivante de la thorie des ensembles :
A\(A\B) = A B
pour obtenir :
G\(G\G) = G G = G A
et finalement :
xV V A
Puisque V est compact, on na qu poser K = V , et :
x V K A,

K est compact

encore une fois on a trouv un voisinage de x entirement inclus dans A.


Puisque x est un point quelconque de A, il sensuit, par dfinition, que A est
un espace localement compact.

X
A
K
V
x

Figure 1.23 Dans un espace de Hausdorff, tant donn un ouvert A, il est


toujours possible de trouver un voisinage compact K de tout point x A qui
soit entirement inclus dans A. Laffirmation est aussi vraie pour un ferm
quelconque.
2) Soit B, un ferm de (X, T ) et y B, un point quelconque de B.
Puisque X est localement compact, il existe un ouvert O et un ensemble
compact Q tels que :
y O Q et Q est compact

128

Annexe 1C

Posons G = O B et K = Q B. Alors G est un ouvert (de la topologie


induite) et K un ensemble compact (par la proposition 1C.19) tels que :
yGKB
Par consquent, B est un espace localement compact.
Exemple 1C.14. Dans les espaces Rn et Cn de dimension finie, la boule
ouverte unit B(0, 1) et la boule ferme unit Bf (0, 1) 63
Bf (0, 1) = {x | d(0, x) 1}
sont toutes deux localement compactes.
Pouvons-nous tendre le rsultat du thorme de Heine-Borel aux espaces
mtriques de dimension suprieure ? La rponse courte est oui : toute partie
borne et ferme des espaces de dimension finie Rn et Cn est compacte.
Ceci tant dit, il convient, dune part, de dfinir rigoureusement ce que
nous entendons par une partie borne dun espace mtrique et, de lautre,
dapporter une prcision sur les parties fermes .
Dans un espace mtrique, le diamtre dune partie A, dnot diam(A), est
la plus petite borne suprieure de la distance entre deux points quelconques
de A :
diam(A) = sup{ d(x, y) | x, y A}
Le diamtre de A peut tre infini. La partie A est dite borne si son diamtre
est fini.
diam(A) <
Exemple 1C.15. Dans lespace mtrique euclidien Rn de dimension
finie, la boule ouverte unit B(0, 1) et la boule ferme unit Bf (0, 1) sont
toutes deux bornes, chacune ayant un diamtre gal 2.
Considrons lespace topologique que constitue intrinsquement la boule
ouverte unit dun espace euclidien Rn . La boule ouverte unit est borne
puisque son diamtre est gal 2 et ferme car lespace entier est toujours
un ferm de toute topologie. Peut-on alors affirmer que la boule ouverte unit
est compacte ? Non. La raison en revient lusage cavalier que nous faisons
ici du terme ferm . Tel que discut la section 1.6.5, lorsque lon parle de
lespace Rn ou encore de lespace de Hilbert, il est implicitement entendu que
lespace en question est complet, dans quel cas les termes ferm et complet
63. Ici, le 0 est en fait une abbrviation pour le n-uplet (0, . . . , 0).

1.C.13

129

Compacit

sont interchangeables, ce qui nest gnralement pas le cas car la notion


de fermeture est un concept extrinsque alors que celle de compltude est
un concept intrinsque. La boule ferme unit tant complte et borne est
compacte ; la boule ouverte unit ntant pas complte ne lest pas.
Dfinition 1C.26 Une partie A dun espace topologique (X, T ) est dite
relativement compacte si son adhrence A dans X est compacte.
Exemple 1C.16. Puisque tout ferm dun espace de Hausdorff est compact, toute partie dun tel espace est relativement compacte. En particulier
les boules ouvertes unit et les boules fermes unit de Rn et Cn sont relativement compactes.

(a)

(b)

(c)

Figure 1.24 Trois espaces borns. (a) Lespace nest pas compact puisquil nest pas complet, mais il est localement compact (b) Lespace nest
pas compact puisquil nest pas complet (le petit cercle au centre illustre
maladroitement le fait que le point central est manquant), mais il est relativement compact. (c) Lespace est compact puisquil est born et complet.
Rflexion faite, pouvons-nous tendre le rsultat du thorme de HeineBorel aux parties bornes et compltes de tous les espaces mtriques, mme
ceux de dimension infinie ? Cette fois la rponse courte est non. La rponse
un peu plus longue ncessite lintroduction dune dernire dfinition.
Dfinition 1C.27 Une partie A dun espace mtrique X est dite prcompacte ou encore totalement borne si pour tout  > 0, on peut trouver
un recouvrement ouvert fini de A par des boules ouvertes de rayon moindre
que .
[
A
B(xi , )
i=1,...,n

130

Annexe 1C

Figure 1.25 La boule ferme unit dans le plan est totalement borne car
pour toute valeur de  > 0, on peut la recouvrir laide dun nombre fini
de boules ouvertes de rayon moindre que . Ce rsultat stend toutes les
boules fermes unit de dimension finie.
Tout espace mtrique compact est prcompact. Toute partie totalement
borne dun espace mtrique est borne (voir problme 1.31). Linverse est
faux : toute partie borne nest pas ncessairement totalement borne.
Par exemple, tout espace mtrique trivial 64 est born car son diamtre
est gal 1. Mais si lespace est infini, il est impossible de le recouvrir laide
dun nombre fini de boules ouvertes de rayon moindre que 1. Cet espace est
born sans tre totalement born. Un exemple plus important est celui de la
boule ferme unit dans un espace de Hilbert de dimension infinie :
Bf (0, 1) = {x H | d(0, x) 6 1}
En effet, soit B = {ei }iI , une base hilbertienne. Alors tous les vecteurs de
base ei sont inclus dans Bf (0, 1). Au problme 1.27, il a t tabli que pour
deux indices diffrents i, j I, i 6= j,

d(ei , ej ) = 2

Par consquent, toute boule ouverte dont le rayon est plus petit que 22 ne
peut contenir au maximum quun seul des ei . La boule ferme unit dans
lespace de Hilbert, bien que borne nest pas totalement borne (prcompacte).
64. Dans un espace mtrique trivial, la distance entre deux points x et y est 1 si les
deux points sont distincts et 0 si les deux points sont confondus.

1.C.13

Compacit

131

Nous venons de donner deux exemples despaces qui sont complets sans
tre totalement borns. Ceci nous amne professer un critre de compacit
valide pour tout espace mtrique, quil soit de dimension finie ou non.
Thorme 1C.24 Tout espace mtrique complet et totalement born
(prcompact) est compact.
Le fait que la boule unit ferme ne soit pas compacte pour un espace
vectoriel de dimension infinie est significatif ; de fait, lexistence dune boule
ferme unit compacte implique la dimensionalit finie de lespace comme en
tmoigne le thorme suivant :
Thorme 1C.25 Dans un espace vectoriel norm, les noncs suivants sont quivalents :
1) Lespace est de dimension finie.
2) La boule unit ferme est compacte.
3) Lespace est localement compact.
4) Toute partie borne est relativement compacte.
Puisque selon le thorme 1C.21 limage continue dun compact est un
compact, il sensuit que toutes les fonctions continues dfinies sur un domaine
compact sont ncessairement bornes.

132

Chapitre 2

Les oprateurs linaires sur


lespace de Hilbert
I got a paper from Born, which I cannot understand at all.
It is full of matrices, and I hardly know what they are.
Werner Hensenberg

2.1

Introduction

En informatique quantique, lespace dtat possde la structure dun espace de Hilbert de dimension finie. Tout vecteur unitaire appartenant lespace dtat est un vecteur dtat, un ket dans la notation de Dirac. chaque
ket de lespace dtat correspond un bra de lespace dual.
|i h|
Dans ce chapitre, nous introduisons limportante notion doprateur, une
transformation linaire qui transforme un vecteur dtat en un autre vecteur
dtat :
| 0 i = A | i
La dernire quation se lit ainsi : loprateur A agit sur le ket | i pour
produire le ket | 0 i.
Nous tablissons dabord un isomorphieme dalgbre entre lespace des
endomorphismes sur un espace vectoriel de dimension n et lespace des matrices carres dordre n. Lalgbre matriciel, qui est la porte de tous, est

134

Les oprateurs linaires sur lespace de Hilbert

donc la cl mathmatique qui ouvre la porte 1 de linformatique quantique.


Divers types doprateurs sont ensuite prsents dont les trs importants
oprateurs hermitiens et unitaires. chaque oprateur A correspond un
oprateur adjoint, dnot A , dont la reprsentation matricielle est la transconjugue de celle de A 2 .
Nous terminons le chapitre en dmontrant formellement certains rsultats affirms pralablement sans preuves 3 , dont lexistence et lunicit de
loprateur adjoint.

2.2
2.2.1

Algbre linaire
Lespace vectoriel LK (V, W)

Commencons par rafrachir la notion dapplication linaire, en favorisant


cette fois la notation de Dirac.
Soient V et W, deux K-espaces vectoriels. Lapplication F : V W est
une application linaire (ou un homomorphisme despaces vectoriels) si :
F ( | v1 i + | v2 i) = F (| v1 i) + F (| v2 i)
Le sujet de notre tude est cette fois lensemble de toutes les applications
linaires, LK (V, W). Dans cette section, nous nous contenterons de dfinir
quelques notions additionnelles et dtablir certains rsultats gnraux.
Limage de F , dnote Im(F ), est dfinie comme suit :
Im(F ) = { | w i W | F (| v i) = | w i pour un | v i V }

(2.1a)

Le noyau de F , dnot Ker(F ), est lensemble des vecteurs de V dont


limage est llement neutre de W :
Ker(F ) = {| v i V | F (| v i) = 0W }

(2.1b)

Puisque, par linarit, F (0 | v i) = 0 F (| v i), on obtient F (0V ) = 0W .


Donc, 0V fait toujours partie du noyau de F .
1. Dans le langage de linformatique quantique, les oprateurs sont appels portes. Une
porte qui agit sur un qubit pour le transformer en un autre qubit est reprsente par une
matrice carre dordre 2.
2. Les kets rsident dans un espace diffrent de celui de leurs adjoints les bras
tandis quun oprateur et son oprateur adjoint rsident dans un seul et mme espace.
Indpendamment, dans les deux cas, on passe ladjoint par une opration de transconjugaison.
3. Notamment le thorme 1.6.

2.2.1

Lespace vectoriel LK (V, W)

135

Thorme 2.1 Soit F : V W, une application linaire. Alors


limage de F est un sous-espace de W et le noyau de F est un sous-espace
de V.
Dmonstration.
(a) Limage de F est un sous-espace de W.
On sait que llment neutre dun espace vectoriel doit faire partie de
tout sous-espace. Puisque F (0V ) = 0W , alors 0W Im(F ) comme il se
doit. Dmontrons que toute combinaison linaire dlments de Im(F )
est aussi un lment de Im(F ). Soient | w1 i, | w2 i Im(F ). Alors il
existe des | v1 i, | v2 i V tels que F (| v1 i) = | w1 i et F (| v2 i) = | w2 i.
Puisque V est un espace vectoriel, toute combinaison linaire de | v1 i
et | v2 i appartient aussi V. Par linarit,
F ( | v1 i + | v2 i) = F (| v1 i) + F (| v2 i) = | w1 i + | w2 i
Comme W est un espace vectoriel, | w1 i + | w2 i W. Par consquent, | w1 i + | w2 i Im(F ) et Im(F ) est bien un sous-espace de
W.
(b) Le noyau de F est un sous-espace de V.
Puisque F (0V ) = 0W , alors 0V Ker(F ).
Soient | v1 i, | v2 i Ker(F ). Alors F (| v1 i) = 0W et F (| v2 i) = 0W .
De plus :
F ( | v1 i + | v2 i) = F (| v1 i) + F (| v2 i) = 0W + 0W = 0W
Donc, | v1 i + | v2 i Ker(F ) et Ker(F ) est bien un sous-espace de
V.
Le rang de F est la dimension de limage de F :
df.

rang(F ) =
=
= dim Im(F )

(2.2a)

et la nullit de F est la dimension du noyau de F :


df.

null(F ) =
=
= dim Ker(F )

(2.2b)

Thorme 2.2 (Thorme du rang) Soit V, un espace vectoriel de


dimension finie. Soit F : V W, une application linaire. Alors :
dimV = rang(F ) + null(F )

(2.3)

136

Les oprateurs linaires sur lespace de Hilbert

Proposition 2.3 Soit F : V W, une application linaire.


Si les vecteurs | v1 i, | v2 i, . . . , | vn i engendrent V, alors les vecteurs
F (| v1 i), F (| v2 i), . . . , F (| vn i) engendrent Im(F ).
Dmonstration. Soit | w i Im(F ), un vecteur quelconque appartenant
limage de F . Alors il existe un vecteur | v i V tel que F (| v i) = | w i.
Puisque les vecteurs | v1 i, | v2 i, . . . , | vn i engendrent V, alors il existe des
scalaires 1 , 2 , . . . , n tels que :
| v i = 1 | v1 i + 2 | v2 i + + n | vn i
Et par linarit :
F (| v i) = F (1 | v1 i + 2 | v2 i + + n | vn i)
| w i = 1 F (| v1 i) + 2 F (| v2 i) + + n F (| vn i)
Ainsi, tout vecteur | w i Im(F ) peut tre exprim par une combinaison linaire des vecteurs F (| v1 i), F (| v2 i), . . . , F (| vn i). Ces vecteurs engendrent
donc Im(F ). Notons que ces vecteurs ne sont pas ncessairement tous indpendants.
Une application linaire F est dite non-singulire si sa nullit est 0 et
singulire dans le cas contraire. Dire que F est non-singulire revient dire
que le seul vecteur que contient Ker(F ) est 0V . Dire que F est singulire
revient dire quil existe un vecteur non-nul | v i V, | v i =
6 0V tel que
F (| v i) = 0W .
Proposition 2.4 Soit F : V W, une application linaire nonsingulire. Alors limage de tout ensemble de vecteurs linairement indpendants est aussi un ensemble de vecteurs linairement indpendants.
Thorme 2.5 Une application linaire F : V W est un isomorphisme ssi F est non-singulire.
En dautres termes, lapplication linaire F est non-singulire ssi elle est
une bijection.
Nous allons maintenant dfinir une opration daddition interne et une
opration de multiplication externe sur LK (V, W).
Soient F, G deux applications linaires appartenant LK (V, W) et , un
scalaire appartenant K. Alors,
df.

(F + G)(| v i) =
=
= F (| v i) + G(| v i)
df.

( F )(| v i) =
=
= F (| v i)

(2.4a)
(2.4b)

2.2.2

Composition dapplications linaires

137

On dmontre aisment que les applications (F + G) et ( F ) sont aussi des


applications linaires. En effet,


(F + G) | v1 i + | v2 i




= F | v1 i + | v2 i + G | v1 i + | v2 i
= F (| v1 i) + F (| v2 i) + G(| v1 i) + G(| v2 i)




= F (| v1 i) + G(| v1 i) + F (| v2 i) + G(| v2 i)
= (F + G)(| v1 i) + (F + G)(| v2 i)

et


( F ) | v1 i + | v2 i




= F | v1 i + | v2 i = F (| v1 i) + F (| v2 i)
= F (| v1 i) + F (| v2 i)
= ( F )(| v1 i) + ( F )(| v2 i)
Nous venons effectivement de dmontrer le thorme suivant :
Thorme 2.6 Lensemble LK (V, W) est un K-espace vectoriel.
Le prochain thorme traite de la dimensionalit de lespace LK (V, W).
Thorme 2.7 Si la dimension de V est m et la dimension de W est
n, alors la dimension de LK (V, W) est mn.

2.2.2

Composition dapplications linaires

Soient F : U V LK (U, V) et G : V W LK (V, W). La


composition de G par F , dnote par G F , est dfinie par :


df.
(G F )(| u i) =
=
= G F (| u i)
(2.5)
En jetant un coup doeil la Fig. 2.1, on sapercoit que la composition
G F est elle-mme une application :
GF :UW
Mais est-ce que G F est une application linaire ? En dautres mots,
est-ce que G F LK (U, W) ?

138

Les oprateurs linaires sur lespace de Hilbert

V
F

GF

Figure 2.1 Composition dapplications


Il est facile de vrifier que la rponse cette question est oui.


(G F )( | v1 i + | v2 i) = G F ( | v1 i + | v2 i)


= G F (| v1 i) + F (| v2 i)




= G F (| v1 i) + G F (| v2 i)

(2.6)

= (G F )(| v1 i) + (G F )(| v2 i)
Donc, le rsultat dune composition dapplications linaires est toujours une
application linaire.
De plus, la composition dapplications linaires est associative.
G

H (G F )
(a)

(H G) F
(b)

Figure 2.2 Associativit de la composition dapplications


En effet, soient trois applications linaires, F : U V LK (U, V),
G : V W LK (V, W) et H : W Z LK (W, Z). Alors :
H (G F ) = (H G) F

(2.7)

Il convient alors dcrire simplement H G F . Prenez note que ces


applications sont excutes successivement dans lordre inverse, de droite
gauche, soit F en premier, G en second et H en dernier.

2.2.3

Lalgbre linaire LK (V)

139

La composition dapplications linaires est distributive sur laddition.


G (F1 + F2 ) = G F1 + G F2

(2.8a)

(G1 + G2 ) F = G1 F + G2 F

(2.8b)

Si la composition dapplications linaires commute avec la multiplication


scalaire,
(G) (F ) = ()(G F )
(2.8c)
par contre, la composition dapplications linaires nest pas gnralement
commutative.
G F 6= F G
(2.9)

2.2.3

Lalgbre linaire LK (V)

Notant la similitude qui existe entre les quations 2.8a 2.8c et 1A-3a
1A-3c, il nous vient lesprit que la composition dapplications pourrait
servir de deuxime loi de composition interne sur un espace vectoriel, nous
permettant ainsi de dfinir un algbre sur ledit espace. Puisque pour des
applications linaires quelconques F, G LK (V, W), les compositions F G
et G F ne font du sens que ssi V = W, il convient de restreindre notre
algbre lespace des endomorphismes LK (V).
On utilise souvent lexpression transformation linaire pour dsigner un
endomorphisme despace linaire.
Par 2.7, cet algbre est associatif. Notons toutefois quil nest pas commutatif et quen gnral F G 6= G F .
La composition dapplications admet un lment neutre : lapplication
identit I :
I:VV
| v i 7 | v i
I F =F I =F
n2 .

(2.10)

Si dim V est n, alors daprs le thorme 2.7, la dimension de LK (V) est

2.2.4

Reprsentations

Soit B = {| v1 i, | v2 i, . . . , | vn i}, une base quelconque de V. Tout vecteur


| v i V sexprime alors dune faon unique en tant que combinaison linaire

140

Les oprateurs linaires sur lespace de Hilbert

des vecteurs de B :
| v i = 1 | v1 i + 2 | v2 i + + n | vn i =

n
X

i | vi i

(2.11)

i=1

Adoptant la convention de lannexe 2.A, nous crirons dsormais le vecteur


de coordonnes relatif la base B, (1 , n , . . . , n ), laide dun vecteurcolonne (matrice n 1) :

1
2

| v i = ..
.
n
Soit maintenant une transformation linaire F LK (V). La transformation
F est entirement dtermine par son action sur les vecteurs de base puisque,
de par la linarit de F , on a :


F (| v i) = F 1 | v1 i + 2 | v2 i + + n | vn i
(2.12)
= 1 F (| v1 i) + 2 F (| v2 i) + + n F (| vn i)
Mais tous les F (| vi i) sont eux-mmes des vecteurs de V et peuvent aussi
tre dcomposs selons les vecteurs de base :
F (| v1 i) = 11 | v1 i + 12 | v2 i + + 1n | vn i
F (| v2 i) = 21 | v1 i + 22 | v2 i + + 2n | vn i
.......................................
F (| vi i) = i1 | v1 i + i2 | v2 i + + in | vn i

(2.13)

.......................................
F (| vn i) = n1 | v1 i + n2 | v2 i + + nn | vn i
Nous pouvons runir tous les ij du systme dquations linaires 2.13
lintrieur dune matrice carre dordre n, que nous dsignerons par A :

11 12 1n
21 22 2n

..
..
..
A=
...
.
.
.

n1 n2 nn
crivons :
| w i = F (| v i)
| wi i = F (| vi i)

2.2.4

141

Reprsentations

Daprs 2.13, le vecteur-colonne qui contient les coordonnes de | wi i dans


la base B est donc :

i1
i2

| wi i = ..
(2.14)
.
in
Si lon runit maintenant tous ces vecteurs-colonnes | wi i

11
21
i1
n1
12
22
i2
n2

| w1 i = . , | w2 i = . , . . . , | wi i = . , . . . , | wn i = .
..
..
..
..
1n

2n

in

nn

dans une mme matrice carre dordre n que nous dnotons cette fois par
matB (F ) :

11 21 i1 n1
12 22 i2 n2

T
..
..
..
..
..
matB (F ) =
(2.15)
...
=A
.
.
.
.
.

1n 2n in nn
alors, nous affirmons que la matrice matB (F ) caractrise entirement laction
de F sur lespace V. Notons que la matrice matB (F ) est la transpose de la
matrice A dfinie plus haut, soit matB (F ) = AT . Pour viter toute confusion,
il est utile de concevoir la matrice matB (F ) comme tant la juxtaposition
des n vecteurs-colonnes reprsentant laction de F sur chacun des vecteurs
de base, soit :


matB (F ) = F (| v1 i) F (| v2 i) F (| vi i) F (| vn i)
Substituant F (| v i) = | w i et F (| vi i) = | wi i dans 2.12, nous obtenons :
| w i = 1 | w1 i + 2 | w2 i + + n | wn i =

n
X

i | wi i

(2.16)

ij | vj i

(2.17)

i=1

o chacun des vecteurs | wi i est donn par 2.14 :


| wi i = i1 | v1 i + i2 | v2 i + + in | vn i =

n
X
j=1

142

Les oprateurs linaires sur lespace de Hilbert

En combinant les quations 2.16 et 2.17, nous obtenons :


|wi =

n
X
i=1

i | wi i =

n
X
i=1

n
X
j=1

ij | vj i =

n X
n
X
j=1


ij i | vj i

(2.18)

i=1

P
o les scalaires ni=1 ij i sont les composantes du vecteur | w i dans la base
B. Exprimons | w i sous forme dun vecteur-colonne :

Pn

i1
i
11
1
21
2
n1
n
i=1
Pn i2 i 12 1 + 22 2 + + n2 n
i=1

.
.
|wi =
(2.19)
..
..

Pn
1n 1 + 2n 2 + + nn n
i=1 in i
On vrifie aisment que nous obtenons exactement le mme rsultat si nous
multiplions la matrice matB (F ) par le vecteur-colonne reprsentant | v i :
Pn


1
11 21 n1
i=1 i1 i
P
n i2 i 12 22 n2 2
i=1


= .
.
..
..
..
..
(2.20)
|wi =
.
.

.
.
.
.

.
.
Pn
n
1n 2n nn
i=1 in i
{z
} | {z }
|
matB (F )

|vi

Lidentit 2.20 est la formulation matricielle quivalente de lquation linaire


2.18, soit | w i = F (| v i). Laction de la transformation F sur un quelconque
vecteur | v i de V est donc prcisment caractrise par la matrice matB (F ).
Rappelons que la matrice matB (F ) est la transpose de la matrice A, obtenue partir du systme dquations linaires 2.13. Cette transposition est
un artfact de lcriture matricielle o la convention veut que lon reprsente
un vecteur par une matrice-colonne plutt que par une matrice-ligne. Heureusement pour nous, ladoption systmatique de la notation de Dirac nous
permet doublier compltement ce dtail tout en nous immunisant contre
une source derreur potentielle (voir section 2.3.4).
Considrons maintenant lapplication :
mat : LK (V) Mn,n (K)
F 7 matB (F )
qui chaque endomorphisme F fait correspondre la matrice carre matB (F ),
dans la base B de V, selon la prescription tablie en 2.15. Lapplication mat
tablit un isomorphisme entre les deux espaces vectoriels (voir problme 2.8) :

2.2.4

143

Reprsentations

LK (V)
= Mn,n (K)
Notons cependant que cet isomorphisme nest toutefois pas canonique
car il dpend du choix arbitraire dune base de V.
En effet, il nest pas possible dassocier spontanment, de faon naturelle,
un endomorphisme quelconque F une matrice particulire de Mn,n (K).
Bien au contraire, toute matrice carre inversible de Mn,n (K) est en mesure
de caractriser laction dune transformation non-singulire F par le choix
dune base approprie 4 . Ainsi, afin dtablir un isomorphisme entre les deux
espaces vectoriels, il est ncessaire de spcifier au pralable une base quelconque B de V. Cest seulement une fois la base fixe que la bijection peut
stablir entre les deux espaces et que nous sommes en mesure de faire correspondre chaque transformation linaire F une matrice unique matB (F ),
et vice-versa.
Qui plus est, si F et G sont deux endomorphismes tels que F 7 matB (F )
et G 7 matB (G), on dmontre (voir problme 2.9) que la matrice reprsentant la composition F G est donne par :
matB (F G) = matB (F ) matB (G)

(2.21)

De fait, lapplication mat tablit un isomorphisme complet entre les algbres LK (V) et Mn,n (K). Ainsi, tout rsultat obtenu dans un espace est
directement transposable dans lautre. La table 2.1 fait ressortir les points
de comparaison entre ces deux algbres.
Encore une fois, cet isomorphisme entre algbres est non canonique pour
les raisons spcifies ci-haut, ce qui convient parfaitement aux physiciens
pour qui les lois de la physique doivent tre identiques pour tout observateur.
Cet isomorphisme dalgbre nous permet de simplifier considrablement
notre notation. Dabord, puisque les transformations et les matrices sont
interchangeables, il ny a plus lieu de traner le symbole mat dans nos expressions. Ensuite, nous prsumons du fait que la base B de V est donne
implicitement pour faire disparatre toute rfrence cette base. Ds lors, le
mme symbole F est utilis indiffremment pour dsigner la fois lapplication, la matrice ou loprateur. Abstraitement, on conoit que F dsigne
la classe dquivalence des matrices semblables qui caractrisent laction de
F . Concrtement, puisque les interactions physiques se produisent indpendamment de tout systme de coordonnes introduit artificiellement par le
physicien, cel permet ce dernier dcrire au tableau des quations dont les
4. Cette base nest pas ncessairement une base orthonorme.

144

Les oprateurs linaires sur lespace de Hilbert

Espace LK (V)
dimensionalit
n2
addition de transformations
F +G
multiplication scalaire
F
composition de transformations
GF
distributivit droite
G (F1 + F2 ) = G F1 + G F2
distributivit gauche
(G1 + G2 ) F = G1 F + G2 F
la composition commute
avec la multiplication scalaire
(G) (F ) = ()(G F )
associativit de la composition
(H G) F = H (G F )
lment neutre de lalgbre
application identit I
rang de la transformation
nullit de la transformation
transformation singulire

non-singulire
transformation dont la rciproque existe

bijective

Espace Mn,n (K)


dimensionalit
n2
addition matricielle
F +G
multiplication scalaire
F
multiplication matricielle
GF
distributivit droite
G(F1 + F2 ) = GF1 + GF2
distributivit gauche
(G1 + G2 )F = G1 F + G2 F
la multiplication matricielle commute
avec la multiplication scalaire
(G)(F ) = ()GF
associativit du produit matriciel
(HG)F = H(GF )
lment neutre de lalgbre
matrice identit I
rang de la matrice
n rang
det = 0

det 6= 0
matrice inversible

rang = n

Table 2.1 Lisomorphisme complet qui existe entre lalgbre des endomorphismes sur un espace vectoriel de dimension n et celui des matrices carres
n n.

2.2.4

145

Reprsentations

symboles ne font rfrence qu des objets gomtriques purs, en accord avec


le principe de covariance gnralise. Finalement, nous liminons toutes les
parenthses qui ne sont pas essentielles. Par exemple :
F (| v i) = | w i

scrit simplement

F |vi = |wi

De plus, puisquil ny a plus intrt distinguer entre la composition de


transformations linaires et le produit matriciel, il est permis de simplifier
davantage :
(G F )(| v i) = | w i

scrit simplement

GF | v i = | w i

Suivant cette convention, il nexiste plus de diffrences de notation entre les


deux membres de lquation 2.5, chacun scrivant maintenant GF | u i :


GF | u i (G F )(| u i) = G F (| u i)
Un avantage majeur de cette notation lague est quelle sidentifie la
notation de Dirac, utilise universellement en mcanique quantique.
Mais le physicien praticien qui travaille au laboratoire a besoin de donnes
pour insrer dans lordinateur. Rien ne lempche de choisir le rfrentiel qui
lui convient le mieux.
Lorsque lespace vectoriel V est un espace de Hilbert H, il est dusage
de choisir une base hilbertienne orthonorme B = {| 1 i, | 2 i, . . . , | n i}
avec h i | j i = ij . On peut alors exprimer les composantes dun vecteur
quelconque | i laide du produit scalaire :

h 1 | i
h 2 | i

|i =

..

h n | i
o il est clair que les composantes scalaires de | i changent lorsquon passe
une autre base hilbertienne. Similairement, les coefficients de la matrice
caractrisant laction dune transformation linaire F changent eux aussi lors
dun changement de base.
On voit bien que, malgr une connotation ngative malencontreuse, le
fait que lisomorphisme dalgbre en question soit non canonique nest pas
limitatif en soi mais permet plutt au physicien de bnficier du meilleur de
deux mondes.

146

Les oprateurs linaires sur lespace de Hilbert

En mcanique quantique, se donner une reprsentation quivaut fixer


une base hilbertienne 5 . Bien entendu, lexpression dun oprateur peut diffrer de faon significative selon que lon choisisse une reprsentation plutt
quune autre. Si, thoriquement, toutes les rprsentations sont galement
valables, en pratique, il convient de choisir une reprsentation qui vise
simplifier le problme sous tude.

2.2.5

Transformations linaires inversibles

Une transformation linaire F LK (V) est dite inversible sil existe une
transformation F 1 LK (V) telle que :
F F 1 = F 1 F = I

(2.22)

o I est lapplication identit.


Un retour la section 1.2.4 nous rappelle quune application bijective F
est inversible sil existe une application rciproque F 1 qui soit elle mme
une bijection. En dimension finie, dans lespace des endomorphismes LK (V),
il suffit quune transformation linaire F soit injective ou surjective pour
quelle soit bijective et donc, quelle soit inversible 6 .
Une condition quivalente pour quune transformation linaire F soit
inversible est quelle soit non-singulire, c.--d. que Ker(F ) = 0V , ou encore
que rang(F ) = n.
Du moment que lon a fix une base de lespace vectoriel V, on peut
profiter de lisomorphisme dalgbre qui existe entre LK (V) et Mn,n (K) et
exprimer les conditions dinversibilit dune transformation F en termes de
linversibilit de sa matrice correspondante qui sont, au choix :
la matrice F possde une matrice inverse F 1
|F | =
6 0
le rang de la matrice F est gal n
Dans lespace R2 , les transformations du plan sont associes des matrices 2 2. Une base vidente de lespace M2,2 (R) consiste des quatre matrices suivantes :








1 0
0 1
0 0
0 0
A=
, B=
, C=
, D=
0 0
0 0
1 0
0 1
5. Le concept de reprsentation stend aussi aux bases hilbertiennes continues non
dnombrables comme nous le verrons au chapitre 4.
6. Ceci nest pas toujours vrai dans un espace de dimension infinie puisquon peut
dfinir une application qui soit une injection dans un sous-espace strict de dimension
infinie, cette injection ne pouvant pas alors tre surjective.

2.3

Les oprateurs linaires

147

car toute matrice de M2,2 (R) peut tre exprime par une combinaison linaire de A, B, C et D. Le fait que toutes les matrices de cette base sont
singulires et ne possdent pas dinverse peut parfois savrer un inconcnient
et il est souvent avantageux de restreindre lespace Mn,n (K) en ne retenant
que les matrices non-singulires. Lensemble rsultant perd sa structure despace vectoriel car la matrice nulle nen fait dsormais plus partie. Par contre,
chaque matrice de ce nouvel ensemble est inversible et lensemble possde
maintenant la structure de groupe 7 . Ce groupe est appel groupe gnral
linaire de degr n et est dnot par GL(n, K).
Pour les problmes prsentant un haut degr de symtrie les mathmaticiens et les physiciens prfrent remplacer une combinaison linaire de
matrices singulires dans Mn,n (R) par un produit de matrices non-singulires
dans GL(n, K). Dans le cas du plan R2 , toute matrice non-singulire peut
tre dcompose en un produit de matrices eux-mmes non-singulires, chacune reprsentant une transformation lmentaire du plan (voir la figure 2.3
et le problme 2.10).
De faon analogue, il est utile de restreindre lespace des endomorphismes
LK (V) en en retenant que les transformations qui soient bijectives, c.--d. les
automorphismes. On obtient alors un ensemble constitu de transformations
linaires non-singulires qui possde lui aussi la structure de groupe et que
nous dnoterons par Aut(V).
Ces deux groupes hritent de lisomorphisme non canonique qui existe
entre les espaces dont ils sont issus.

= Mn,n (K)

y
Aut(V)
= GL(n, K)
LK (V)

On considre deux groupes isomorphes comme tant deux ralisations dun


mme groupe abstrait.

2.3

Les oprateurs linaires

Au dpart, un oprateur linaire A nest autre quune transformation


linaire entre deux espaces vectoriels topologiques. Dans le cadre de cet
ouvrage, nous restreindrons lappellation doprateur aux endomorphismes
despaces de Hilbert, A Lc (H). On utilise la mme notation pour les oprateurs que pour les matrices.
7. Les groupes sont discuts au Volume II.

148

Les oprateurs linaires sur lespace de Hilbert

Transformations du plan R2
a) une contraction/expansion selon laxe des x

J=

k
0


0
1

b) une contraction/expansion selon laxe des y

K=

1 0
0 k

c) un cisaillement parallle laxe des x

L=

1 k
0 1

d) un cisaillement parallle laxe des y

M=

1
k


0
1

e) une rflexion du plan par la droite x=y

N=

0
1


1
0

Figure 2.3 Transformations lmentaires du plan. Les symboles donns


aux diffrentes matrices ne servent uniquement qu les identifier et nont
aucune signification particulire.

2.3.1

Les oprateurs sur H

149

Il conviendra de parler de transformations lorsque le sujet dintrt est


lespace lui-mme, comme cest le cas pour les transformations du plan, o
chaque point est transform en un autre point du plan. On parlera doprateurs lorsque notre intrt porte plutt sur un vecteur de lespace, particulirement un vecteur dtat, et comment il se transforme en un autre vecteur
dtat sous laction dun oprateur linaire.

2.3.1

Les oprateurs sur H

Nous considrons ici les espaces de Hilbert de dimension finie sur le corps
des complexes ainsi que leurs bases hilbertiennes.
Soit un vecteur | i H. Laction de loprateur A transforme ce vecteur
en | 0 i. Nous pouvons dcrire cette action soit symboliquement,
| 0 i = A | i

(2.23)

ou, si une base nous est donne, sous forme matricielle :




10
11 21 n1
1
0 12 22 n2 2
2

. = .
.
..
..
..
.. ..
.
.
.
.

.
n0
1n 2n nn
n

(2.24)

Parfois, il convient dincorporer le symbole reprsentant loprateur


lintrieur du ket sur lequel il agit, soulignant ainsi le fait que le rsultat
donne encore une fois un ket :
|Ai A|i

(2.25)

de sorte que lcriture | 0 i = | A i est parfaitement lgitime.


Nous allons maintenant dmontrer, de faon informelle, un des grands
avantages de la notation de Dirac. Soit B = {| 1 i, | 2 i, . . . , | n i}, une base
hilbertienne de H. Dornavant, pour simplifier, nous dsignerons les vecteurs
de base tout simplement par leurs indices, soit B = {| 1 i, | 2 i, . . . , | n i}. Tout
vecteur | i de H peut alors scrire de facon unique :
n
n
X
X
|i =
hi|i|ii =
|iihi|i
i=1

i=1

(2.26)

150

Les oprateurs linaires sur lespace de Hilbert

et ses composantes rassembles lintrieur dun vecteur-colonne :

h1|i
h 2 | i

| i = ..
.
hn|i
Manipulons lgrement lquation 2.26 en scindant le braket de la faon suivante :
n
hX
i
|i =
|iihi| |i
(2.27)
i=1

Puisque quelle que soit la base choisie, on a toujours | i = I | i, il appert


que :
n
X
I=
|iihi|
(2.28)
i=1

Cette dernire expression est tout fait lgitime et chaque terme | i i h i | reprsente un oprateur particulier, soit un projecteur. De fait, toute expression
de type | i i h j | 8 , o i nest pas ncessairement gal j reprsente aussi un
oprateur sur H. La notation de Dirac permet de traiter lexpression | i i h j |
comme si | i i et h j | taient des vecteurs indpendants au lieu de parties
intgrantes dun oprateur global. Bien que la justification mathmatique
formelle devra attendre le volume II, nous aurons loccasion dici l de nous
familiariser avec cette forme de dcomposition dyadique des oprateurs.

2.3.2

Les oprateurs adjoints

Soit un oprateur A : H H de LK (H) et h |, un bra quelconque de


lespace dual H . Nous avons en main les lments essentiels nous permettant de dfinir de faon non ambige laction de loprateur A agissant dans
lespace des bras :
A : H H
En effet, laction de A sur tout ket | i de H rsulte en un nouveau ket
A | i = | A i. Le produit scalaire


h| A|i = h|Ai
(2.29)
8. Dans la notation de Dirac, un ket suivi dun bra, par exemple | i i h j |, est la reprsentation dyadique dun tenseur de second rang. Le produit tensoriel sera introduit au
Volume II.

2.3.2

Les oprateurs adjoints

151

dfinit implicitement la fonction :




h| A|i : H C
| i 7 h | A i
qui est une forme linaire, de par la linarit de loprateur A et celle du
produit scalaire (par rapport la deuxime variable). Dnotons cette forme
linaire par h | A :


h|A h| A|i
Alors, pour tout | i H, on a :




h|A |i = h| A|i

(2.30a)

Cette dernire quation dfinit laction de loprateur A qui agit sur un bra
h | de H pour donner un autre bra, h 0 | = h | A, tel que :
h 0 | i = h | A i

(2.30b)

liminant les parenthses de lquation 2.30a, nous retrouvons lidentit suivante :


h|A|i = h|A|i
(2.30c)
qui fait ressortir lambivalence de loprateur A, ce dernier agissant, au choix,
aussi bien sur lespace H que sur H .
On dmontre sans difficults que loprateur A agissant sur lespace dual
est linaire, c.--d. que si :
h | = 1 h 1 | + 2 h 2 |
alors
h | A = 1 h 1 | A + 2 h 2 | A

(2.31)

Le calcul de lexpression h | A | i peut donc seffectuer de deux faons :


soit quon opre dabord sur lespace des bras pour obtenir h | A = h 0 | et
ensuite passer au produit scalaire h 0 | i, ou bien quon opre dabord sur
lespace des kets pour obtenir A | i = | 0 i pour ensuite valuer le produit
scalaire h | 0 i. Dans les deux cas, on obtient le mme rsultat, c.--d. :
h 0 | i = h | 0 i
Il est alors permis de considrer loprateur A comme un oprateur hybride agissant indiffremment sur lespace des kets ou sur celui des bras.

152

Les oprateurs linaires sur lespace de Hilbert

Nous allons maintenant procder la dfinition cruciale de loprateur


adjoint. En dimension finie, lespace dual H est isomorphe H. chaque
ket de H correspond un bra de H . On dnote symboliquement cette correspondance duale par :
h| |i
Soit un oprateur A LK (H) et | 0 i, le ket rsultant de laction de A sur
un ket quelconque | i :
| 0 i = A | i = | A i
On peut tablir la correspondance duale entre | 0 i et h 0 | :
h 0 | | 0 i
et il est correct dcrire :
hA| |Ai
ou encore :
hA| A|i
mais attention, car dans le cas gnral :
h|A = A|i

(2.32)

Pour tablir la correspondance correcte, il convient dintroduire la notion


doprateur adjoint :
Dfinition 2.1 Un oprateur linaire A sur un espace de Hilbert H
admet un oprateur adjoint A ssi :
h A | i = h | A i
pour tout | i, | i H.
Pour la suite, un simple retour lquation 2.30a nous rappelle que :






h | A | i = h | A | i = h | | A i = h | A i
et si lon fait intervenir la dfinition de loprateur adjoint, on obtient :




h | A | i = h A | i = h A | | i
Cette dernire relation, valide pour tout | i H, confirme lgalit entre
les deux formes linaires :
h | A = h A |

(2.33)

2.3.3

Reprsentation matricielle des bras

153

En conclusion, la correspondence duale qui vient corriger 2.32 est :


h | A A | i

(2.34)

En dimension finie, loprateur adjoint existe toujours.


Rappelons les conventions dcriture pour les oprateurs apparaissant
lintrieur des symboles des kets ou des bras :
|Ai = A|i

(2.25)

h A | = h | A

(2.34)

En utilisant la dfinition de loprateur adjoint et lquation 2.33, on


obtient une identit fort utile. Puisque h A | i = h | A i , alors :
h | A | i = h | A | i

(2.35)

On se sert de cette dernire identit pour dmontrer que :


(A ) = A

(2.36)

En effet,


h | (A ) | i = h | A | i = h | A | i = h | A | i
On remarquera que loprateur adjoint rcupre le symbole utilis pour
indiquer la transconjugue dune matrice (matrice adjointe). Ceci nest pas
un effet du hasard, comme nous allons le voir linstant.

2.3.3

Reprsentation matricielle des bras

Si la reprsentation matricielle dun ket quelconque | i dans la base


{| 1 i, | 2 i, . . . , | n i} est :


h1|i
1
h 2 | i 2


| i = .. = ..
. .
hn|i

alors quelle est la reprsentation matricielle du bra h | ?


Le produit scalaire (plus spcifiquement le carr de la norme) nous fournit
un indice important.
k k2 = h | i = 1 1 + 2 2 + + n n

(2.37)

154

Les oprateurs linaires sur lespace de Hilbert

Ainsi, si lon crit h | sous la forme du vecteur-ligne suivant :



h | = 1 2 n

(2.38)

alors le produit scalaire h | i est numriquement gal au produit des matrices reprsentant h | et | i,

h | i = 1 2


2
n .. = 1 1 + 2 2 + + n n
.
n

rsultat qui est consistant puisque le produit dune matrice 1 n par une
matrice n 1 donne un scalaire (matrice 1 1).
Rappelons que la matrice transconjugue est dfinie par :
A = (AT ) = (A )T
La matrice reprsentant le bra h | est donc la transconjugue de la
matrice qui reprsente le ket | i. Ceci scrit symboliquement :
h | = | i

(2.39a)

et puisque (A ) = A, rciproquement, on a aussi que :


| i = h |

(2.39b)

Reprenons lidentit | i = I | i. Puisque (AB) = B A , on a :


h | = | i =

I |i

= | i I = h | I

car I = I. Remarquons de plus que le projecteur | i i h i | est invariant sous


lopration de transconjugaison puisque :
h
i
| i i h i | = h i | | i i = | i i h i |
de sorte que lidentit 2.28 demeure tout aussi valide dans lespace des bras.
Ainsi, tout bra de lespace dual H se dcompose selon :
h| = h|I = h|

n
hX
i=1

n
i X
|iihi| =
h|iihi|
i=1

2.3.3

Reprsentation matricielle des bras

155

et les composantes du bra h | dans la base duale {h 1 |, h 2 |, . . . , h n |} sont


donnes par h | i i. Le bra h | scrit donc sous la forme dun vecteur-ligne :

h| = h|1i h|2i h|ni
ce qui est consistant avec 2.39a puisque :

h1|i


h 2 | i
h | 1 i h | 2 i h | n i = ..
.

hn|i
Selon la convention dcriture tablie la section prcdente, lorsquun
oprateur apparat lintrieur dun ket, on peut lextraire en lcrivant simplement la gauche de ce ket, | A i = A | i. Si loprateur apparat lintrieur dun bra, cest loprateur adjoint qui est extrait la droite de ce bra,
h A | = h | A . Dans le premier cas, on dit que loprateur A pr-multiplie
le ket | i et dans le second, que A post-multiplie le bra h |. Notons quil
ne saurait en tre autrement puisque les expressions | i A et A h | sont
dnues de sens, les matrices correspondantes tant non-conformes. De plus,
cette convention est parfaitement justifie par les rsultats 2.39a et 2.39b.
Par exemple :
h A | = | A i = (A | i) = | i A = h | A
Il est aussi permis dincorporer des scalaires lintrieur des bras ou des
kets, par exemple :
|i |i
et dtablir la correspondance duale :
h| |i

(2.40a)

On peut transformer ce scalaire en oprateur laide de lapplication


identit I. On obtient alors une matrice scalaire, c.--d. une matrice diagonale
dont tous les coefficients non-nuls sont des :

1 0
0
.

.. 1 ... = ... ... =


= I =

0 1
0

156

Les oprateurs linaires sur lespace de Hilbert

La transconjugue de

.
.
=
.
0

la matrice scalaire

0
1

.
..
..
= .

0

est tout simplement :

0
.

1 ..
= I=
1

de sorte que
h | | i
rvle la correspondance duale :
h | | i

(2.40b)

Ce rsultat est tout fait consistant avec la semi-linarit par rapport la


premire variable du produit scalaire. Bien que les scalaires commutent avec
les bras et les kets, il est dusage de les extraire la gauche de ces symboles.
Le petit tableau rcapitulatif suivant rsume les conventions dcriture
couramment utilises en mcanique quantique :
|Ai = A|i

| A i = h | A

(2.41a)

|i = |i

| i = h |

(2.41b)

hA| = h|A

h | = h |

hA| = A|i

(2.41c)

h | = | i

(2.41d)

Pour terminer, la fin de la section 2.3.1, nous avons affirm, sans le


dmontrer, que toute expression de type | i i h j | est un oprateur. Nous
sommes maintenant en mesure den donner une justification informelle. En
effet, | i i h j | est le produit dune matrice n 1 par une matrice 1 n, dont
le rsultat donne une matrice carre n n.
Par exemple, si


1
1
2
2




| i i = .. , | j i = .. , h j | = 1
n
2
.
.
n
alors

1 1 1 2 1 n
2 2 2
n

1
2
..
..
..
| i ih j | =
...
.
.
.

n 1 n 2 n n

2.3.4

Reprsentation matricielle des oprateurs linaires 157

cause de lisomorphisme qui existe entre Mn,n (K) et LK (H), il sensuit


que toute matrice carre est la reprsentation dun oprateur quelconque sur
un espace de Hilbert n dimensions. | i i h j | est bien un oprateur.

2.3.4

Reprsentation matricielle des oprateurs linaires

Soit un oprateur A et B = {| 1 i, | 2 i, . . . , | n i}, une base hilbertienne.


En faisant gnreusement usage de lidentit 2.28, on obtient :
hX
i hX
i
A = IAI =
|iihi| A
|j ihj |
i

|iihi|A|j ihj |

(2.42)

i,j

hi|A|j i|iihj |

i,j

puisque h i | A | j i est un scalaire qui commute aussi bien avec les kets quavec
les bras. Notons que la bonne pratique veut que lon utilise des indices nouvaux et diffrents (ici i et j) chaque fois que lon fait appel lidentit 2.28
dans une mme expression. Notons de plus que la dcomposition dyadique
de loprateur I la droite et la gauche de loprateur A utilise la mme
base hilbertienne B, indice diffremment.
Dfinissons llment de matrice Aij de loprateur A dans la base B par :
df.

Aij =
=
= hi|A|j i

(2.43)

Rappelons que la matrice A rsulte de la juxtaposition des n vecteurscolonnes reprsentant laction de A sur chacun des vecteurs de base :


A = A| 1 i A| 2 i A| j i A| n i
Le ket A| j i = | A j i constitue la j ime colonne de la matrice A et ses composantes dans la base B sont donnes par :


h1|Aj i
h1|A|j i
h 2 | A j i h 2 | A | j i

..
..


.
.

|Aj i =
=

h
i
|
A
j
i
h
i
|
A
|
j
i

..
..

.
.
hn|A|j i
hn|Aj i

158

Les oprateurs linaires sur lespace de Hilbert

Ainsi, le coefficient de la matrice A qui apparait la iime range et la j ime


colonne est donc bien llment de matrice Aij .
Aij = h i | A j i = h i | A | j i
Remplacant h i | A | j i par Aij dans 2.42, on obtient la dcomposition
dyadique suivante de loprateur A :
X
A=
Aij | i i h j |
(2.44)
i,j

Notons que nous retrouvons lidentit 2.28 partir de 2.44. En effet, si


A = I, alors quelle que soit la base hilbertienne on a toujours Aij = ij et :
X
X
I=
ij | i i h j | =
|iihi|
i,j

comme il se doit.
On peut se servir de lquation 2.35 pour dterminer les lments de
matrice de loprateur adjoint.
Aij = h i | A | j i = h j | A | i i = Aji

(2.45)

Quels sont les lments de matrice associs un produit doprateurs ?


Facile.
(AB)ij = h i | AB | j i = h i | A IB | j i
hX
i
X
= h i |A
|kihk| B |j i =
h i | A | k ih k | B | j i
k

Aik Bkj

Nous constatons que nous venons de redcouvrir la formule du produit


matriciel 2A-2.

2.3.5

Valeurs propres et vecteurs propres dun oprateur

Laction dun oprateur linaire A sur un ket quelconque | i scrit


symboliquement :
A | i = | 0 i
En gnral, il nexiste aucune relation entre les kets | i et | 0 i. Toutefois,
pour chaque oprateur linaire A sur le corps des complexes, il existe au

2.3.5

Valeurs propres et vecteurs propres dun oprateur 159

moins un ket | i pour lequel laction de A rsulte en un ket | 0 i qui soit


un multiple de | i, c.--d. :
| 0 i = | i
Lquation
A|i = |i

(2.46)

est appele quation aux valeurs propres. Ce genre dquation est dune importance fondamentale en mcanique quantique.
Tout vecteur | i non-nul qui vrifie lquation 2.46 est appel vecteur
propre de A et la valeur correspondante de est appele valeur propre.
Notons quil est possible que la valeur propre soit nulle.
Il existe une certaine ambigut entourant le vecteur propre associ
toute valeur propre puisque tout multiple de ce vecteur propre est luimme solution de 2.46 :
A|i = A|i = |i = |i
On tente alors de rsoudre cette ambigut, par exemple en normalisant
le vecteur propre :
h|i = 1
(2.47)
mais on ny parvient qu moiti. En effet, il est toujours possible de multiplier le ket | i par ce quil convient dappeler un facteur de phase, c.--d.
un nombre complexe situ sur le cercle unit du plan dArgand, et ceci sans
que la norme du ket en soit affecte. Rappelons que tout facteur de phase
sexprime sous la forme ei , o est un nombre rel. Puisque le module de
tout facteur de phase est toujours gal 1, le fait de remplacer | i par
| ei i dans le membre de gauche de 2.47 naffecte en rien le rsultat car :

h ei | ei i = ei ei h | i = ei ei h | i = h | i
Lensemble de toutes les valeurs propres rattaches un oprateur A est
appell le spectre de A, que lon dnote symboliquement par (A). Dans un
espace de Hilbert de dimension finie n, ce spectre est toujours discret et fini.
De fait, le spectre dun oprateur A est constitu de lensemble des racines
du polynme caractristique associ la matrice A 9 . Puisquil sagit dun
polynme de degr n en , on sait quil existe au plus n racines distinctes.
Lorsquune de ces racines est multiple, on dit que la valeur propre correspondante est dgnre et, par extension, que le spectre est dgnr. Lorsque
toutes les racines sont distinctes, nous dirons que le spectre est non-dgnr.
9. Revoir au besoin la section 2.A.8.

160

Les oprateurs linaires sur lespace de Hilbert

Pour un espace de Hilbert sur le corps des complexes, lexistence des


valeurs propres est assure par le thorme fondamental de lalgbre qui
affirme que tout polynme non constant coefficients dans C admet au
moins une racine complexe. La multiplicit algbrique dune valeur propre
est gale sa multiplicit en tant que racine du polynme caractristique.
Lorsquune valeur propre possde une multiplicit algbrique diffrente de 1,
il est possible, mais non ncessaire, quon puisse lui associer plusieurs vecteurs
propres linairement indpendants. La multiplicit gomtrique dune valeur
propre est gale la dimension du sous-espace engendr par les vecteurs
propres qui lui sont associs : ce sous-espace est appel sous-espace propre et
sera dsign par H . On peut donc interprter gomtriquement lquation
aux valeurs propres 2.46 comme attestant linvariance du sous-espace propre
H sous laction de loprateur A.
En gnral, la multiplicit gomtrique dune valeur propre est toujours
plus petite ou gale sa multiplicit algbrique. Toutefois, en mcanique
quantique, nous aurons principalement affaire des oprateurs normaux 10 ,
et pour cette catgorie doprateurs, la multiplicit algbrique dune valeur
propre est toujours gale sa multiplicit gomtrique 11 .

2.4
2.4.1

Proprits des oprateurs linaires


galit de deux oprateurs linaires

Lapplication nulle est lapplication A qui renvoie tout vecteur | i de


lespace son lment neutre :
A|i = |0i
Le noyau de A est lespace tout entier, Ker(A) = H. Quelle que soit la reprsentation choisie, la matrice correspondant loprateur nul est la matrice
nulle. En ralit, il sagit dune matrice scalaire, de sorte que lon peut crire
tout simplement A = 0.
Proposition 2.8 Une condition suffisante et ncessaire pour quun oprateur A soit loprateur nul est que :
h|A|i = 0
pour tout ket | i de lespace.
10. Voir la section 2.5.5.
11. Ce constat est directement li au fait que tout oprateur normal est diagonalisable.

2.4.1

galit de deux oprateurs linaires

161

Dmonstration.
=
Alors,

Soit dmontrer que A = 0 = h | A | i = 0, | i H.


h|A|i = h|Ai = h|0i

et quel que soit le ket | i, on a toujours h | 0 i = 0.


= Soit dmontrer que h | A | i = 0, | i H = A = 0.
Soit B = {| i i}, une base hilbertienne. Puisque h | A | i = 0, | i H,
alors a fortiori h A i | i i = 0, | i i B. Par 3) du thorme 1.16, on a
que | A i i = | 0 i. Donc laction de A sur tout vecteur de base renvoie
llment neutre. Mais puisque tout vecteur | i est une combinaison linaire
des vecteurs de base, alors A | i = | 0 i et A est loprateur nul.
Thorme 2.9 La condition suffisante et ncessaire pour que deux oprateurs A et B soient gaux est quils soient dfinis sur un mme domaine
et que :
h|A|i = h|B |i
pour tout ket | i de lespace.
Dmonstration. Pour tout ket | i,
h|A|i = h|B |i

h|A B |i = 0

et par la proposition prcdente on a A B = 0, ou encore A = B.


Le thorme 2.9 est trs gnral et vaut pour tout les oprateurs et cela
quelle que soit la dimension de lespace. En informatique quantique, o laccent est mis sur les oprateurs linaires dans des espaces de dimension finie,
nous pouvons relaxer quelque peu cette condition. Dune part, le domaine
de dfinition dun oprateur est toujours lespace entier et de lautre, il suffit que h i | A | i i = h i | B | i i pour une base hilbertienne {| i i} quelconque
pour quil y ait quivalence ou, encore plus simplement, que A | i i = B | i i,
puisque toute transformation est entirement dtermine par son action sur
les vecteurs de base.
Note. Nous serions tents de dire que deux oprateurs sont gaux ssi les
matrices qui les reprsentent sont gales mais cela pourrait nous induire en
erreur (Pourquoi ?).

162

Les oprateurs linaires sur lespace de Hilbert

2.4.2

Trace dun oprateur

La trace dun oprateur A, Tr(A), est la somme de ses lments de matrice


diagonaux :
Tr(A) =

X
hi|A|ii

(2.48)

La trace dun oprateur ne dpend pas de la reprsentation choisie. En


effet :

Tr(A) =

X
X
hi|A|ii =
hi|I A|ii
i

hX
i
X
hi|
| k ih k | A | i i =
h i | k ih k | A | i i
k

i,k

h k | A | i ih i | k i =

i,k

hk|A

hk|AI |ki =

i
| i ih i | | k i

hX

hk|A|ki

Note. Contrairement 2.42 o les indices i et j renvoyaient une mme


base hilbertienne, ici les indices i et k rfrent deux bases hilbertiennes
diffrentes.
Par consquent, quelle que soit la base hilbertienne choisie, la trace demeure invariante.
X
X
Tr(A) =
hi|A|ii =
hk|A|ki
(2.49)
i

Parmi les autres proprits importantes de la trace, on retrouve :

Tr(A + B) = Tr(A) + Tr(B)

(2.50a)

Tr( A) = Tr(A)

(2.50b)

Tr(AB) = Tr(BA)

(2.50c)

Tr(ABC) = Tr(BAC) = Tr(CAB)

(2.50d)

Les deux premires galits expriment le fait que la trace est une forme
linaire et les deux dernires, que dans un produit doprateurs, la trace
demeure invariante sous une permutation cyclique.

2.4.3

2.4.3

Commutateur et relations de commutation

163

Commutateur et relations de commutation

On sait que le produit de deux oprateurs nest gnralement pas commutatif. Le commutateur de deux oprateurs A et B est dfini par :
[A, B] = AB BA

(2.51)

Si les deux oprateurs commutent, alors AB = BA et la valeur de leur


commutateur est nulle, [A, B] = 0.
Parmi les relations de commutation importantes, on retrouve :
[A, A] = 0

(2.52a)

[A, I] = 0

(2.52b)

[A, ] = 0

(2.52c)

[A, B] = [ A, B] = [A, B]

(2.52d)

[A, B] = [B, A]

(2.52e)

[A + B, C] = [A, C] + [B, C]

(2.52f)

[A, B + C] = [A, B] + [A, C]

(2.52g)

[AB, C] = [A, C] B + A [B, C]

(2.52h)

[A, BC] = [A, B] C + B [A, C]

(2.52i)

[A, [B, C]] + [B, [C, A]] + [C, [A, B]] = 0

(2.52j)

[A, B] = [B , A ]

(2.52k)

Le lecteur est invit vrifier par lui-mme ces relations de commutation.


Il est aussi commode de dfinir lanti-commutateur [A, B]+ de deux oprateurs par :
[A, B]+ = AB + BA
(2.53)
Une des proprits les plus importantes des oprateurs commutants est
que tout sous-espace propre de lun est globalement stable sous laction de
lautre, et vice-versa.
En effet, soient A et B, deux oprateurs commutants. Soit , une valeur
propre non-dgnre de A et | i, le vecteur propre correspondant.
A|i = |i

(2.54)

Puisque la valeur propre est non-dgnre, le sous-espace propre correspondant H est uni-dimensionnel.

164

Les oprateurs linaires sur lespace de Hilbert

Le ket B | i est aussi vecteur propre de loprateur A correspondant


la valeur propre puisque :
A(B | i) = AB | i = BA | i = B(A | i) = B( | i) = (B | i)
(2.55)
et puisque la valeur propre est non-dgnre, les kets | i et B | i sont
ncessairement colinaires, c.--d. :
B |i = |i

(2.56)

pour un certain scalaire . Il sensuit que | i est aussi vecteur propre de B


auquel correspond la valeur propre .
Puisque H est uni-dimensionnel, tout ket | i de H peut sexprimer
sous la forme | i = | i, pour un certain scalaire . Par consquent,
B | i = B | i = | i H
et lespace propre H est globalement stable sous laction de loprateur B.
Le cas o la valeur propre est dgnre est plus compliqu mais le
rsultat reste le mme. Par exemple, supposons que la valeur propre soit
doublement dgnre 12 :
A | 1 i = | 1 i
A | 2 i = | 2 i
o les kets | 1 i et | 2 i sont linairement indpendants. Alors tout ket
| i appartenant au sous-espace propre 2-dimensionnel H est aussi vecteur
propre de A. En effet, soit :
| i = | 1 i + | 2 i

(2.57)

Alors,
A | i = A ( | 1 i) + A ( | 2 i) = (A | 1 i) + (A | 2 i)
= ( | 1 i) + ( | 2 i) = ( | 1 i) + ( | 2 i)
= ( | 1 i + | 2 i) = | i
Dun autre ct, on a selon 2.55 :
A(B | 1 i) = (B | 1 i)
A(B | 2 i) = (B | 2 i)
12. Un raisonnement identique sapplique lorsque la multiplicit de la valeur propre est
suprieure 2.

2.4.4

165

Fonctions doprateurs

et les kets B | 1 i et B | 2 i sont aussi vecteurs propres de A associs la


valeur propre . Cependant, cause de la dgnrescence de , B | 1 i et
B | 2 i ne sont pas ncessairement linairement indpendants. Tout ce que
nous pouvons affirmer est que B | 1 i et B | 2 i appartiennent H . Mais
pour un ket | i quelconque de H , on a :
B | i = B( | 1 i + | 2 i) = B | 1 i + B | 2 i H
puisque B | 1 i + B | 2 i est une combinaison linaire de vecteurs appartenant H . Encore une fois, le sous-espace propre H est globalement
stable sous laction de loprateur B.
Nous aurons loccasion de revenir sur ce point la section 2.5.5.2.

2.4.4

Fonctions doprateurs

Lapplication successive et rpte dun oprateur donne lieu la notion


de puissances dun oprateur. Par exemple, on crira A2 pour AA et, par
extension,
n1
An = AAA
= An1 A
| {z. . . A} = AA
n fois

Les rgles habituelles sappliquent :


Ap Aq = Ap+q ,

(Ap )q = Apq

Nous avons dj implicitement dfini A1 en 2.22 alors que nous traitions


des transformations linaires inversibles.
A A1 = A1 A = I
Si nous dfinissons loprateur A0 par :
A0 = I
alors nous avons dfini les puissances dun oprateur An pour tout entier
relatif n.
Tout oprateur commute avec chacune de ses puissances.
[A, An ] = 0

(2.58)

Si | i est vecteur propre de A correspondant la valeur propre , alors


| i est aussi vecteur propre de An correspondant la valeur propre n .
An | i = An1 A | i = An1 | i = 2 An2 | i = = n | i (2.59)

166

Les oprateurs linaires sur lespace de Hilbert

Parmi toutes les fonctions dune variable complexe, il existe une classe
qui se rvle tre de premire importance en analyse complexe, soit celle des
fonctions holomorphes. Une fonction continue est dite holomorphe si elle est
dfinie et drivable (au sens complexe) en tout point dun ouvert de C 13 . Ces
fonctions ont la proprit remarquable dtre localement analytiques, c.--d.
quelles admettent un dveloppement en srie de Taylor en chaque point de
louvert et lon peut toujours crire :
f (z) =

i z i

(2.60)

i=0

En gnral, les coefficients i sont des valeurs complexes 14 .


En physique quantique, il arrive quun oprateur puisse dpendre dautres
oprateurs. Par exemple, loprateur dnergie totale, lhamiltonien, dpend
la fois de loprateur dimpulsion et de loprateur dnergie potentielle. Il
convient alors de dfinir les fonctions doprateurs de la manire suivante :
si f (z) est une fonction holomorphe qui admet un dveloppement en srie,
alors la fonction doprateur f (A) admet un dveloppement en puissances
de A qui fait appel aux mmes coefficients :
f (A) =

i Ai

(2.61)

i=0

Une fonction qui est holomorphe sur lensemble du plan complexe est
appele fonction entire. Pami les fonctions entires, on retrouve les fonctions
polynmiales et lexponentiation complexe. Lexponentiation dun oprateur
est dfinie par :

X
An
eA =
(2.62)
n!
n=0

En combinant 2.52d, 2.52g et 2.58, on dmontre quun oprateur commute avec toute fonction de lui-mme :
[A, f (A)] =

n [A, An ] = 0

(2.63)

n=0

Aussi, si | i est vecteur propre de A correspondant la valeur propre ,


alors | i est aussi vecteur propre de f (A) correspondant la valeur propre
13. Voir section 1.B.5.
14. Si la fonction f (z) est une fonction relle, alors les coefficients i sont rels.

2.5

Types doprateurs linaires

167

f () puisque :
f (A) | i =


 X
n An | i =
n n | i = f () | i

n=0

(2.64)

n=0

Mais attention ! Puisque lalgbre des oprateurs est non commutative,


lordre des oprateurs doit toujours tre respect lorsque nous avons affaire
des fonctions doprateurs. Par exemple, en gnral, on a que :
eA eB 6= eB eA 6= eA+B
et il ny a galit que si les oprateurs A et B commutent.
Par contre, si A et B commutent, alors chacun deux commute avec toute
fonction de lautre :
[A, g(B)] = [f (A), B] = [f (A), g(B)] = 0

2.5
2.5.1

(2.65)

Types doprateurs linaires


Loprateur identit

Loprateur identit I est un oprateur particulier en ce sens que, pour


tout vecteur | i de lespace et quelle que soit la reprsention choisie, on a
toujours :
I |i = 1|i
(2.66)
Loprateur identit ne possde donc quune seule valeur propre, 1, qui est
n fois dgnre. De plus, tout vecteur de lespace est vecteur propre de I.
Nous avons dj eu loccasion de nous familiariser avec la dcomposition
de loprateur identit :
X
I=
|iihi|
(2.27)
i

o {| i i} est une base hilbertienne. Cette relation est connue sous lappellation de relation de fermeture et elle exprime la compltude de la base.
Inversement, si un ensemble de vecteurs orthonorms {| i i} vrifie la relation de compltude, alors cet ensemble de vecteurs constitue bien une base
hilbertienne de lespace.
La relation de fermeture est extrmement utile pour simplifier ou obtenir
de nouvelles expressions. preuve, on retrouve les formules retenir
1.47, 1.48 et 1.49 du chapitre 1 sans effort grce la relation de fermeture :

168

Les oprateurs linaires sur lespace de Hilbert

|i = I |i =

hX

i
|iihi| |i

hi|i|ii

(1.47)

k k2 = h | i = h | I | i
hX
i
X
= h|
|iihi| |i =
h|iihi|i
i

hi|ihi|i =

|h i | i|2

(1.48)

hX
i
h|i = h|I |i = h|
|iihi| |i
i

X
=
h|iihi|i

(1.49)

la section suivante, nous donnerons une interprtation gomtrique


simple de la relation de fermeture.

2.5.2

Projecteurs

Soit | i, un vecteur unitaire quelconque dun espace de Hilbert. Nous


avons dj argument que lexpression | i h | reprsente un oprateur agissant sur cet espace. Dsignons cet oprateur par P .
P = | i h |
Laction de P sur tout vecteur | i de lespace est donne par :
h
i
P | i = | i h | | i = h | i | i

(2.67)

(2.68)

et le rsultat est un vecteur qui est colinaire | i. Loprateur P est donc


loprateur de projection orthogonale, ou projecteur, sur le vecteur | i.
Les valeurs propres de loprateur P vrifient lquation P | i = | i,
ce qui se ramne dans le cas prsent :
h|i|i = |i
Le membre de gauche de lquation 2.69 est soit

(2.69)

2.5.2

169

Projecteurs

1) un vecteur colinaire | i,
2) le vecteur nul | 0 i, correspondant au cas o les vecteurs | i et | i
sont orthogonaux.
Dans le premier cas, lquation aux valeurs propres nadmet de solutions que
ssi | i est lui aussi colinaire | i. Posons donc | i = | i pour un
non-nul. Lquation 2.68 scrit alors P | i = h | i | i ce qui se
rduit P | i = 1 | i. Le projecteur P admet donc la valeur propre nondgnre 1 laquelle correspond le vecteur propre | i. Dans le second cas,
tous les vecteurs non-nuls | i qui sont orthogonaux | i sont des vecteurs
propres de P correspondant la valeur propre 0 puisque lquation aux
valeurs propres se rduit P | i = | 0 i = 0 | i. Nous allons maintenant
dmontrer que la valeur propre 0 est (n 1) fois dgnre.
En effet, posons B = {| i}. Alors B = Vect(B) est un sous-espace
ferm de H qui contient tous les vecteurs colinaires | i. La dimension du
sous-espace B est 1 puisque la base B de ce sous-espace ne contient quun seul
lment. Dun autre ct, daprs la dfinition 1.27, B est le complment
orthogonal de B et consiste justement de lensemble de tous les vecteurs | i
qui sont orthogonaux | i. Cet ensemble constitue aussi un sous-espace
ferm de H, ce qui est confirm par lquation B = B 15 .
Ainsi, le projecteur P dcompose donc lespace de Hilbert en une somme
directe de deux sous-espaces complmentaires :
H = B B
Tout vecteur de B est vecteur propre de P correspondant la valeur propre
1 et tout vecteur de B est vecteur propre de P correspondant la valeur
propre 0. Si la dimension de H est n, alors la dimension de B est n 1, et
la multiplicit gomtrique de la valeur propre 0 est aussi de n 1.
Les projecteurs sont des endomorphismes idempotents dordre 2. En effet,
h
ih
i
P2 = | i h | | i h | = | i h | i h | = | i h | = P
(2.70)
puisque | i est unitaire et par consquent, h | i = 1. Ceci est tout fait
raisonnable puisquune premire application du projecteur P renvoie tout
vecteur | i dans le sous-espace B de sorte quune deuxime projection est
sans effet. Lidempotence de P implique par surcrot que seules les valeurs
propres 1 et 0 sont admissibles car :
(P2 P ) | i = (2 ) | i

(par 2.65)

0 | i = (2 ) | i

(par 2.70)

15. Voir 1) de lexercice 1.3.

170

Les oprateurs linaires sur lespace de Hilbert

ce qui implique que (2 ) = 0 puisquun vecteur propre ne peut tre nul.


Lgalit 2 = ntant vrifie que par les valeurs 0 et 1, ce sont donc les
seules valeurs propres possibles.
Si tous les projecteurs sont des oprateurs idempotents dordre 2, linverse
est galement vrai. Ainsi, tous les oprateurs idempotents dordre 2 sont des
projecteurs.
Si le projecteur P projette tout vecteur | i dans le sous-espace B,
alors loprateur I P est aussi un projecteur qui projette tout vecteur
| i dans le sous-espace complmentaire B . Lapplication successive de ces
deux oprateurs, dans nimporte quel ordre, rsulte en loprateur nul :
P (I P ) = (I P ) P = P P2 = 0

(2.71)

Laction dun projecteur ne se limite pas seulement des projections sur


des sous-espaces unidimensionnels. Soit B = {| 1 i, | 2 i, . . . , | m i}, un ensemble de m vecteurs indpendants et orthonorms. Dfinissons loprateur
Pm par :
m
X
P m =
| i i h i |
(2.72)
i=1

alors Pm est le projecteur orthogonal sur le sous-espace ferm B de dimension m. Il sagit en fait de loprateur qui correspond lapplication PB dite
de projection orthogonale que nous avons dj rencontre en 1.45. Ce constat
justifie de remplacer lcriture Pm par PB . Encore une fois, le projecteur PB
dcompose lespace de Hilbert en une somme directe de deux sous-espaces
complmentaires. Tout vecteur de B est vecteur propre de PB correspondant la valeur propre m fois dgnre 1 et tout vecteur de B est vecteur
propre de PB correspondant la valeur propre (n m) fois dgnre 0.
On dmontre facilement que loprateur PB est idempotent dordre 2. En
effet :
X
 X
 X
m
m
m
2
PB =
| i i h i |
| j i h j | =
| i i h i | j i h j |
=

i=1
m
X
i,j=1

j=1

ij | i i h j | =

i,j=1

m
X

| i i h i | = PB

i=1

ce qui confirme que loprateur PB est bien un projecteur.


La signification gomtrique de loprateur identit I devrait maintenant
tre claire : cest loprateur de projection PH qui projette sur lespace H
tout entier. On doit rejeter 0 comme valeur propre de PH puisque lquation

2.5.2

171

Projecteurs

aux valeurs propres PH | i = I | i = 0 | i nadmet aucune solution, un


vecteur propre ne pouvant tre nul. La valeur propre 1 quant elle est n fois
dgnre. La relation de fermeture
I=

n
X

| i i h i |

i=1

vient confirmer que lensemble {| 1 i, | 2 i, . . . , | n i} de vecteurs indpendants et orthonorms constitue bel et bien une base hilbertienne de H.
2.5.2.1

Restriction dun oprateur un sous-espace

Soit un oprateur A agissant sur un espace de Hilbert H de dimension


n. Effectuons un rappel sur le projecteur PB de la section prcdente, soit :
PB =

m
X

| i i h i |

i=1

o B = {| 1 i, | 2 i, . . . , | m i} est un ensemble de m vecteurs indpendants et orthonorms de lespace de Hilbert, avec m 6 n. Le projecteur PB


dcompose lespace de Hilbert en une somme directe de deux sous-espaces
complmentaires :
H = B B
Construisons maintenant le produit doprateur suivant :
PB A PB
On saperoit que ce produit doprateur renvoie tout vecteur | i de H dans
le sous-espace B. En effet, sous laction initiale de PB , le vecteur | i est
projet une premire fois dans B. Laction subsquente de A peut renvoyer
le vecteur obtenu nimporte o dans H, mais une deuxime application de
PB projette nouveau ce vecteur transform dans B. Le produit doprateur
a donc pour consquence ultime de restreindre ou de confiner laction de A
au sous-espace B, et il sert ainsi dfinir un nouvel oprateur, A|B .
A|B = PB A PB

(2.73)

que nous appellerons la restriction de A (au sous-espace B).


Notons que la restriction A|B est globalement stable pour le sous-espace
B. En effet, pour tout vecteur (ou toute combinaison linaire de vecteurs)
| i B, on a :
A|B | i B
et le sous-espace B est donc globalement stable sous laction de A|B .

172

Les oprateurs linaires sur lespace de Hilbert

2.5.3

Oprateurs hermitiens

Un oprateur hermitien est un oprateur qui est gal son adjoint 16 .


A = A

(2.74)

Lorsque loprateur hermitien est born, on parlera alors doprateur autoadjoint 17 . Les oprateurs hermitiens jouent un rle de toute premire importance en mcanique quantique.
Rappelons que, dans le cas gnral, lextraction dun oprateur de lintrieur dun bra seffectue selon :
h A | = h | A

(2.34)

Si loprateur A est hermitien, alors lextraction se rduit :


hA| = h|A

(2.75)

Une consquence directe est que, lorsquil apparat dans lexpression dun
produit scalaire, un oprateur hermitien scrit indiffremment dun ct ou
de lautre du braket :
hA|i = h|Ai
(2.76)
Note. Noubliez jamais que les quations 2.75 et 2.76 ne sont valides que
pour des oprateurs hermitiens !
Les oprateurs vus jusqu maintenant sont tous hermitiens. En effet,
loprateur identit est un oprateur hermitien puisque I = I. De mme,
tout projecteur P est un oprateur hermitien puisque :
h
i
P = | i h | = h | | i = | i h | = P
Les proprits suivantes des oprateurs hermitiens sont dune importance
fondamentale autant en mcanique quantique quen informatique quantique.
1) les valeurs propres des oprateurs hermitiens sont toujours relles.
2) les vecteurs propres correspondants des valeurs propres distinctes
sont toujours orthogonaux.
16. Certains ouvrages parlent plutt doprateur hermitique.
17. Pour les espaces de dimension finie, les termes hermitien et auto-adjoint
sont interchangeables. Ce nest pas toujours le cas en dimension infinie si loprateur nest
pas born.

2.5.3

173

Oprateurs hermitiens

La premire proprit se dmontre facilement laide de 2.35.


h | A | i = h | A | i

(2.36)

Supposons que est la valeur propre laquelle correspond le vecteur propre


| i. Alors,
A | i = A | i = | i
Puisque 2.36 est vrai quels que soient les vecteurs | i et | i, alors, en
particulier, on a :
h | A | i = h | A | i
h | | i = h | | i
h | i = h | i = h | i

(2.77)

=
Ce rsultat quivaut dire que la valeur propre ne peut prendre quune
valeur relle.
Dmontrons maintenant la deuxime proprit. Soient :
A | i = 1 | i

et

A | i = 2 | i

avec 1 6= 2 . Alors,
h | A | i = 1 h | i

(2.78a)

h | A | i = 2 h | i

(2.78b)

Utilisant 2.35 avec A = A, on obtient :


h | A | i = h | A | i = 1 h | i = 1 h | i

(2.78c)

puisque la valeur propre 1 est relle. Soustrayant 2.78c de 2.78b, on obtient :


0 = (2 1 ) h | i

(2.79)

et puisque, par hypothse 1 6= 2 , il sensuit que | i | i, ou encore


que les vecteurs propres correspondants des valeurs propres distinctes sont
orthogonaux.
Un oprateur A est dit antihermitien si :
A = A

(2.80)

174

Les oprateurs linaires sur lespace de Hilbert

Si A est un oprateur hermitien, alors iA est un oprateur antihermitien. Rciproquement, si A est un oprateur antihermitien, alors iA est un oprateur
hermitien.
Par stricte analogie avec 2A-22, tout oprateur A peut tre dcompos
de faon unique en un oprateur hermitien et un oprateur antihermitien :
A

A + A
2 }
| {z
oprateur
hermitien

A A
2 }
| {z

(2.81)

oprateur
antihermitien

Le produit de tout oprateur avec son adjoint rsulte en un oprateur


hermitien puisque :
(A A) = A (A ) = A A
(2.82)
Le produit dun oprateur hermitien avec lui-mme donne aussi un oprateur hermitien :
(A2 ) = (A A) = A A = A A = A2

(2.83)

Enfin, notons que le produit de deux oprateurs hermitiens nest pas


ncessairement hermitien. En effet, soient deux oprateurs hermitiens A et
B. Alors,
(AB) = B A = BA
En utilisant la dcomposition 2.81, on trouve que :
AB + (AB) AB (AB)
AB + BA AB BA
+
=
+
2
2
2
2
[A, B]+
[A, B]
AB =
+
2 }
2 }
| {z
| {z
AB =

oprateur
hermitien

(2.84)

oprateur
antihermitien

Ainsi, le produit de deux oprateurs hermitiens nest hermitien que si les


deux oprateurs commutent, c.--d. que si [A, B] = 0. Notez de surcrot que
le commutateur doprateurs hermitiens est un oprateur antihermitien.
2.5.3.1

Oprateurs positifs

la section prcdente, en 2.77, nous avons introduit une expression de


type :
h|A|i

2.5.3

175

Oprateurs hermitiens

Dans le cas discut, | i tait spcifiquement un vecteur propre de loprateur


hermitien A. Cette expression demeure encore pertinente si on remplace | i
par tout vecteur unitaire | i de lespace des tats. En fait, on soulve ici un
concept fondamental en mcanique quantique.
Si A est un oprateur hermitien, alors lexpression
df.

h A i =
=
= h|A|i

(2.85)

est appele valeur moyenne, ou esprance quantique, de A dans ltat 18 .


Nous pouvons maintenant introduire le concept doprateur positif.
Dfinition 2.2 Soit A un oprateur hermitien. Loprateur A est dit
positif si la valeur moyenne de A dans ltat est plus grande ou gale
zro, pour tout vecteur unitaire | i de lespace des tats :
h | A | i > 0,

|i

Convention. Sil convient dutiliser le terme dfinie positive pour


dsigner la non-ngativit de la norme k | i k > 0 puisque la norme nest
nulle que ssi le vecteur | i est nul, cel nest pas ncessairement dsirable
dans le cas dun oprateur, spcifiquement si son spectre contient la valeur
0. Dans ce cas, laction de loprateur sur le vecteur propre correspondant
= 0 rsulte en une valeur moyenne nulle mme si le vecteur propre lui-mme
ne lest pas. Dans le langage des oprateurs, lusage gnral veut que le terme
dfini positif soit rserv lorsque les valeurs moyennes sont strictement
positives, h | A | i > 0. Le terme correct pour dsigner un oprateur dont
les valeurs moyennes sont non-ngatives est oprateur semi-dfini positif .
Dans cet ouvrage, nous conviendrons de dsigner simplement un tel oprateur
par lappellation doprateur positif afin dallger lcriture. Par ce qui
prcde, on comprend quun oprateur dfini positif est toujours inversible
alors que ce nest pas ncessairement le cas pour un oprateur positif.
Remarque. Lexpression oprateur positif ou oprateur dfini positif ne
sapplique qu des oprateurs hermitiens.
Les oprateurs hermitiens I et P = | i h | sont des oprateurs positifs
puisque :
h|I |i = h|I i = h|i = 1 > 0
h | P | i = h | ih | i = |h | i|2 > 0
18. Le concept de valeur moyenne sera explor en dtail au chapitre 3.

176

Les oprateurs linaires sur lespace de Hilbert

Notons que I est un oprateur dfini positif alors que P est un oprateur
positif puisquil admet gnralement la valeur 0 comme valeur propre.
Nous allons maintenant noncer un rsultat intermdiaire dont la dmonstration sera diffre la section 2.5.5.1. Pour tout oprateur positif A
de dimension finie, il est toujours possible de trouver un oprateur linaire
B tel que 19 :
A = BB
(2.86)
Si nous insistons pour que loprateur linaire B soit en plus un oprateur
positif, alors nous obtenons le rsultat important que
tout oprateur positif
1
2
possde une racine carre unique, dsigne par A ou A.
Soit , la valeur propre correspondant au vecteur propre | i de loprateur positif A. Puisque A est hermitien par dfaut, est une valeur relle.
De plus,
h|A|i = h||i = h|i =
et puisque h | A | i > 0 par dfinition, il sensuit que toutes les valeurs
propres dun oprateur positif sont non-ngatives. De plus, si A est un oprateur dfini positif, alors > 0. Nous venons effectivement de dmontrer le
thorme suivant :
Thorme 2.10 Un oprateur hermitien A est un oprateur positif ssi
toutes ses valeurs propres sont non-ngatives.
Il convient dcrire :
A>0

(2.87)

pour indiquer un oprateur positif. Cette notation va au-del du simple abus


dcriture puisquelle met en relief la relation dordre naturelle qui existe sur
lensemble des oprateurs positifs 20 , o :
B>A

(B A) > 0

La somme de deux oprateurs positifs A et B donne toujours un oprateur


positif :
h|A + B |i = h|A|i+h|B |i > 0
| {z } | {z }
>0

>0

Par contre, le produit de deux oprateurs positifs A et B nest toujours


positif que si les oprateurs commutent.
Voici quelques proprits supplmentaires des oprateurs positifs :
19. En fait, loprateur B nest dfini qu une transformation unitaire prs.
20. Les oprateurs positifs sont les analogues dans lespace des endomorphismes des
nombres rels positifs.

2.5.4

Oprateurs unitaires

177

1) Pour tout oprateur linaire A, loprateur A A est positif.


2) Pour tout oprateur positif A, on a :
|h | A | i|2 6 h | A | ih | A | i

(2.88)

Il sagit de lingalit gnralise de Cauchy-Schwartz.


3) Pour tout oprateur positif A, on a Tr(A) > 0, avec
Tr(A) = 0 = A = 0

2.5.4

Oprateurs unitaires

Tous les oprateurs abords jusquici dans cette section taient hermitiens. Nous allons maintenant prsenter la deuxime catgorie doprateurs
en importance pour la mcanique quantique, soit les oprateurs unitaires.
Un oprateur linaire U est dit unitaire sil est inversible et que son
inverse soit gal son adjoint :
U 1 = U

(2.89)

ce qui se traduit par la condition quivalente :


U U = U U = I

(2.90)

Notons tout de suite quun oprateur unitaire nest gnralement pas


hermitien. Il existe bien cependant des cas dexception qui vrifient la condition conjointe U = U = U 1 , dont videmment les oprateurs I et I ainsi
quun oprateur de toute premire importance en informatique quantique,
loprateur dHadamard (voir problme 2.17).
Les oprateurs unitaires ont les importantes proprits suivantes :
1) Ils conservent la norme.
2) Le produit de deux oprateurs unitaires donne un oprateur unitaire.
La premire proprit stipule que k | U i k = k | i k. En effet :
q
p
h U | U i = h | U U | i
p
p
= h|I |i = h|i

k|U ik =

= k|ik
En dimension finie, la conservation de la norme caractrise entirement un
oprateur unitaire.

178

Les oprateurs linaires sur lespace de Hilbert

Quant la seconde proprit, elle est vite tablie. Soient U et V , deux


oprateurs unitaires. Alors :
(U V )(U V ) = U V V U = U IU = U U = I
Un rsultat similaire est obtenu avec (U V ) (U V ).
Quelles sont les valeurs propres possibles dun oprateur unitaire ? Soit
U | i = | i. Prenant la norme de chaque ct de lgalit, on obtient :
k|U ik = k|ik
q
p
h | U U | i = h | i
p
p
h | i = ||2 h | i
1 = ||
Ainsi, toute valeur propre dun oprateur unitaire doit ncessairement se
situer sur le cercle unitaire du plan dArgand. Elle prend donc la forme :
= ei ,

R, 0 6 < 2

(2.91)

Les valeurs propres dun oprateur unitaire sont donc des facteurs de phase.
Les oprateurs unitaires ont cette proprit en commun avec les oprateurs hermitiens que deux vecteurs propres correspondants deux valeurs
propres diffrentes sont orthogonaux. Soient :
U | i = ei1 | i

et

U | i = ei2 | i

avec ei1 6= ei2 . Alors,


h | i = h | I | i = h | U U | i
= h U | U i = h ei1 | ei2 i
h | i = ei(2 1 ) h | i
Puisque ei1 6= ei2 , alors 1 6= 2 et la dernire galit nest possible que si
h | i = 0, c.--d. que si les vecteurs | i et | i sont orthogonaux.
Il existe un autre lien entre oprateurs hermitiens et unitaires. Si A est
un oprateur hermitien, alors loprateur U dfini par :
U = eiA ,

A est hermitien

(2.92)

est unitaire. En effet, on a U = eiA = eiA et puisque les oprateurs iA


et iA commutent, alors les fonctions doprateurs eiA et eiA commutent
aussi :
U U = eiA eiA = eiA eiA = U U = ei(AA) = I

2.5.4

179

Oprateurs unitaires

Quelle que soit la reprsentation choisie, il est possible de reconnatre un


oprateur unitaire par simple examen de la matrice associe cet oprateur.
Soit {| i i}, une base hilbertienne quelconque et U un oprateur unitaire.
Alors,
X
h i | U | k i h k | U | j i
h i | j i = h i | U U | j i =
k

Uik
Ukj

Uki
Ukj

Puisque les vecteurs de base sont orthonormaux, on a h i | j i = ij et on


obtient la relation :
X

Ukj = ij
(2.93a)
Uki
k

De faon similaire, on a :
X

Uik Ujk
= ij

(2.93b)

Ainsi, le produit dune colonne de la matrice U par la conjugue dune autre


colonne est 0 si les colonnes sont diffrentes et 1 si les colonnes sont identiques. Ce constat est aussi valide pour les ranges de U .
2.5.4.1

Changement de reprsentation

Nous allons maintenant tudier la transformation S qui permet de passer


dune base hilbertienne {| i i} de lespace des tats, que nous supposons de
dimension finie, une deuxime base {| i0 i} du mme espace. Nous utilisons
un mme indice i = 1, 2, . . . , n pour relier les vecteurs correspondants dans
les deux bases.
| i0 i = S | i i
(2.94a)
Cette transformation est videmment inversible (Pourquoi ?) et lon a :
| i i = S 1 | i0 i

(2.94b)

Nous allons maintenant dmontrer que cette transformation S est unitaire. Dabord, puisque les vecteurs dune base hilbertienne sont orthonormaux, on a :
h i | j i = ij = h i0 | j 0 i
(2.95)
Dans lespace des bras, lquation 2.94a scrit :
h i0 | = h i | S

(2.96)

180

Les oprateurs linaires sur lespace de Hilbert

Soit maintenant un vecteur quelconque | i de lespace qui peut tre


reprsent par une combinaison linaire unique des vecteurs de base :
X
|i =
i | i i
i

valuons laction de la composition des oprateurs S S sur le vecteur | i.


X
X
SS | i =
i S S | i i =
i S | i0 i
i

| j ih j | i i =

i I S | i i =

| j ih j | S | i0 i
i

| j i ji

i | i i = | i

Le vecteur | i tant quelconque, on a :


SS | i = | i

SS = I

(2.97)

De la mme faon, on dmontre aisment que SS = I. En combinant


ces rsultats, on obtient finalement que :
S S = SS = I
et, par consquent, S est bien une transformation unitaire.
La rciproque est tout aussi vraie (voir problme 2.18). De fait, en dimension finie, une transformation unitaire quivaut un changement de reprsentation.
En physique classique, un changement de rfrentiel alors que ltat du
systme demeure inchang conduit la notion de transformation passive. Par
exemple, la transformation de Lorentz relie les systmes inertiels de deux
voyageurs qui observent un mme vnement spatio-temporel, tel lexplosion
dune supernova. Notons que lvnement possde une existence qui est indpendante de tout systme de coordonnes : lexplosion survient, un point
cest tout. Les observateurs enregistrent le temps et le lieu de lexplosion
dans leurs quadrivecteurs respectifs et si les composantes diffrent, leurs variations ne sont toutefois pas indpendantes car elles sont relies par la transformation de Lorentz. La transformation de Lorentz est un exemple dune
transformation que lon peut qualifier de passive, c.--d. une transformation

2.5.4

Oprateurs unitaires

181

qui naffecte pas le systme physique. Par opposition, une transformation qui
change ltat physique du systme est une transformation active.
En physique quantique, ltat du systme est modlis par le vecteur
dtat | i. Pour les fins de la discussion, on peut imaginer qu linstar dun
systme classique, le systme quantique possde une existence propre qui est
indpendante de toute reprsentation que lon choisit pour le dcrire 21 . Cependant, les systmes quantiques microscopiques sont sujets certaines subtilits qui chappent aux systmes classiques macroscopiques. Par exemple,
personne ne met en doute que le fait dobserver une comte distance
laide dun tlescope nexerce aucune influence sur la trajectoire suivie. De
plus dans le cas de la comte, la spcification simultane de sa position et de
sa vitesse tout moment, combine la connaissance des lois de la physique,
permet de prdire de faon prcise sa trajectoire, tant son volution future
que son historique passe.
Les systmes quantiques obissent toutefois une ralit bien diffrente.
Dune part, les systmes quantiques, tout comme le vecteur dtat qui les
modlise, ne sont pas directement observables. En fait, il est plus pertinent ici
de parler de mesure plutt que dobservation. Or, comme nous le verrons plus
en dtail au chapitre 3, la mesure dun systme quantique perturbe le systme
dune manire aussi irrvocable quimprvisible. Linterprtation orthodoxe
de la mcanique quantique postule dailleurs que les grandeurs physiques,
telles la position ou limpulsion, nont mme pas de valeurs dfinies avant
toute mesure. Rajoutez cel le fait quil soit physiquement impossible de
mesurer simultanment, avec prcision, et la position et limpulsion dune
particule microscopique et vous conviendrez que le monde quantique affiche
une ralit particulirement trange et non-familire, qui confond mme les
intervenants du domaine.
Est-ce que, en pratique, la notion de transformation passive conserve sa
pertinence en mcanique quantique ? Dans un sens plutt limit, la rponse
est oui. Elle dcrit le cas o il nexiste quun seul systme, mais deux observateurs transforms lun de lautre. Et encore faut-il tendre, dans cette
description, la notion de systme de faon englober la fois le systme
quantique ainsi que les appareils de mesure. Le cas o un unique observateur
maintient le systme quantique fixe alors quil transforme les appareils de
mesure 22 appartient un point de vue considr comme ntant ni actif ni
21. Cette hypothse de pense nous amne sur un terrain glissant. 90 ans de mcanique quantique nous mettent en garde contre le fait de conceptualiser un systme
quantique en termes classiques .
22. Par exemple, un observateur qui change lorientation spatiale dun dispositif de
Stern-Gerlach.

182

Les oprateurs linaires sur lespace de Hilbert

passif.
2.5.4.2

Transformation des lments de matrice dun oprateur

la section prcdente, nous avons mentionn que les vnements spatiotemporels possdent une existence propre, indpendante de tout systme de
coordonnes. La description de ces vnements peut seffectuer selon une
infinit de cadres de rfrence inertiels, tous aussi valides les uns que les
autres, et relis entre eux par la transformation de Lorentz. Lensemble de
ces cadres de rfrence de Lorentz forment une classe dquivalence.
Dans un manuel dinformatique quantique, on traite les lments de la
thorie, quil sagisse de vecteurs ou doprateurs, en tant quobjets gomtriques purs. Par exemple, lexpression
|i = A|i
nous dit que le vecteur | i est transform sous laction de loprateur A
en un autre vecteur de lespace, | i, ce qui savre, la plupart du temps,
tre une description suffisante pour nos besoins. Il convient de diffrencier
mentalement loprateur en tant quobjet gomtrique agissant sur lespace
de Hilbert de lune de ses rprsentations matricielles faisant intervenir une
base particulire.
Cest lorsque vient le temps de faire des calculs ou dutiliser lordinateur
que le besoin des lments de matrice devient impratif, et on na alors pas
dautre choix que de spcifier une reprsentation donne 23 . Mais toutes ces
reprsentations sont relies entre elles par une relation de similitude, soit :
B = U A U
o U est une transformation unitaire qui symbolise un changement de reprsentation. Il existe une infinit de matrices B semblables A et toutes ont la
potentialit de reprsenter le mme oprateur. Il convient alors denvisager
loprateur A comme la classe dquivalence de toutes ses reprsentations.
Nous allons maintenant tudier de quelle faon les reprsentations matricielles des oprateurs se transforment lors dun changement de base hilbertienne. Nous avons tabli que la transformation qui relie la base initiale
{| i i} la base finale {| i0 i} est unitaire. Dnotant cette transformation par
23. Nous verrons un peu plus loin quil existe une reprsentation naturelle pour un
oprateur hermitien, soit sa reprsentation propre.

2.5.5

183

Oprateurs normaux

U , on rcrit les relations liant ces deux bases :


| i0 i = U | i i

h i0 | = h i | U

|ii = U |i i

hi| = hi |U

(2.98a)
(2.98b)

Soit un oprateur A, dont les lments de matrice sont donns dans la


base initiale par Aij . Les lments de matrice de A dans la nouvelle base
sont donns par :
Ak0 l0 = h k 0 | A | l0 i = h k 0 | IA I | l0 i
X
=
h k 0 | i ih i | A | j ih j | l0 i
ij

X
=
h k | U | i ih i | A | j ih j | U | l i

(2.99)

ij

Uki
Aij Ujl

ij

Puisque U = U 1 , un regard la dfinition 2A.6 nous permet de constater que les matrices qui caractrisent un mme oprateur lors dun changement de reprsentation sont effectivement relies par une relation de similitude. Par consquent, lors dun changement de reprsentation, les valeurs
propres dun oprateur sont conserves. Seuls les vecteurs propres changent.

2.5.5

Oprateurs normaux

Il a t tabli que les oprateurs hermitiens et unitaires ont des proprits


en commun, notamment celle que leurs vecteurs propres correspondant
des valeurs propres diffrentes sont orthogonaux entre eux. Nous allons voir
que ces deux types doprateurs appartiennent tous deux une classe plus
gnrale doprateurs, les oprateurs normaux.
Un oprateur linaire A dun espace de Hilbert est dit normal sil commute avec son adjoint, c.--d. :
[A, A ] = 0

(2.100a)

AA = A A

(2.100b)

ou encore,
Tout oprateur hermitien A est forcment normal puisque, par dfinition,
A = A et que tout oprateur commute avec lui-mme. Il en est de mme
pour tout oprateur unitaire puisque dans ce cas AA = A A = I.
Dans un espace de dimension finie, les oprateurs normaux possdent les
proprits suivantes :

184

Les oprateurs linaires sur lespace de Hilbert


1) Pout tout ket | i de lespace, k A | i k = k A | i k.
2) Si est une valeur propre dun oprateur normal A, alors loprateur
A I est un oprateur normal.
3) Tout vecteur propre dun oprateur normal A est aussi vecteur propre
de son adjoint A . De plus, si est valeur propre de A, alors est
valeur propre de A .
4) Les sous-espaces propres dun oprateur normal A sont mutuellement
orthogonaux.
5) Le noyau dun oprateur normal A et limage de son oprateur adjoint
sont des complments orthogonaux.
De la proprit 1), on tire, en particulier :
| i,

A|i = |0i

A | i = | 0 i

Par consquent, un oprateur normal partage le mme noyau que son adjoint
(voir problme 2.19).
La proprit 2) demeure valide, que la valeur propre soit dgnre ou
non.
La proprit 3) explique la particularit des valeurs propres des oprateurs hermitiens et unitaires. En effet, dans tous les cas, on a :
A|i = |i

et

A | i = | i

(2.101)

Si loprateur A est hermitien, alors, A | i = A | i et


| i = | i

( ) | i = | 0 i

et, par consquent, les valeurs propres sont relles. Si loprateur A est unitaire, alors A1 = A . Puisque | i = I | i, on a :
I | i = AA1 | i = AA | i = A | i = | i = ||2 = 1
Les valeurs propres dun oprateur unitaire sont donc des facteurs de phase.
On sait que les vecteurs propres correspondant des valeurs propres
distinctes des oprateurs hermitiens et unitaires sont orthogonaux entre eux.
Cette proprit partage trouve sa source dans la proprit 4) des oprateurs
normaux.
La proprit 5) snonce aussi sous la forme :
H = Ker(A) Im(A )

2.5.5
2.5.5.1

Oprateurs normaux

185

Dcomposition spectrale dun oprateur normal

Nous commencons dabord par introduire le concept doprateur diagonalisable. Intuitivement, un oprateur A est diagonalisable si sa matrice
correspondante lest aussi. Rappelons quune matrice A est diagonalisable si
elle est en relation de similitude avec une matrice diagonale D, selon :
D = P 1 A P

(2.102)

Les vecteurs-colonnes de la matrice inversible P sont constitus des vecteurs


propres de loprateur A. Dans cet ordre desprit, nous passons la dfinition
suivante.
Dfinition 2.3 Un oprateur linaire A sur un espace de Hilbert est dit
diagonalisable sil existe une base de lespace {| i i} constitue uniquement
de vecteurs propres de A telle que :
A | i i = i | i i

(2.103)

soit vrifi pour chacun des vecteurs de base.


Quelques remarques simposent. Dabord, il est clair que lquation 2.103
est une quation aux valeurs propres do lutilisation du symbole plutt
que celui, plus gnrique, de . Notons que la valeur = 0 de mme que les
valeurs rptes correspondant un spectre dgnr, ne sont pas exclues.
Ensuite, les vecteurs propres qui forment la base de lespace ne sont pas
forcment unitaires ni orthogonaux.
Somme toute, cette dfinition ne nous est pas dune grande utilit. En
mcanique quantique, ce sont les oprateurs normaux qui mritent davantage
notre attention, et nous avons droit une dfinition un peu plus raffine.
Dfinition 2.4 Un oprateur linaire A sur un espace de Hilbert est dit
unitairement diagonalisable sil existe une base hilbertienne {| i i} telle que :
A | i i = i | i i

(2.104)

soit vrifi pour chacun des vecteurs de base.


Nous aurions pu formuler une dfinition quivalente en ces termes : un
oprateur linaire est unitairement diagonalisable si ses vecteurs propres
forment une base hilbertienne. Encore une fois, la dgnrescence du spectre
nest pas pertinente pour la construction de la base hilbertienne puisque lalgorithme de Gram-Schmidt permet de fabriquer une famille orthonormale
de nimporte quel sous-espace propre multi-dimensionnel.

186

Les oprateurs linaires sur lespace de Hilbert

Remarque. Les dfinitions donnes ci-dessus demeurent valides pour des


espaces de Hilbert de dimension infinie condition de rajouter la restriction
supplmentaire que loprateur linaire soit born (voir section 2.7).
Les oprateurs normaux sont videmment associs aux matrices normales
dont la principale proprit est dtre unitairement diagonalisables (thorme
2A.5). La relation de similitude est alors donne par :
D = U A U
o lon a substitu une matrice unitaire U la matrice inversible P . Puisque
les vecteurs-colonnes de U forment une base hilbertienne {| i i} dont les vecteurs de base sont aussi les vecteurs propres de loprateur A, il convient
alors de parler de la reprsentation propre de loprateur A.
Si nous oprons lquation 2.104 par la droite par le bra h i |, et que nous
sommons ensuite sur lensemble des dimensions de lespace, nous obtenons :
X
X
A | i ih i | =
i | i ih i |
i

| i ih i | =

i | i ih i |

ce qui se ramne, en utilisant la relation de fermeture, :


X
A=
i | i ih i |

(2.105)

Dans sa reprsentation propre, loprateur A est effectivement identifi


une matrice diagonale puisque tous les lments de matrice non-diagonaux
sont nuls. En effet, en oprant lquation 2.104 par la gauche par le bra h i |,
on obtient :
h i | A | j i = j h i | j i
Aij = j ij
et on a bien Aij = 0 pour tout i 6= j ainsi que Aii = i pour i = j.
La reprsentation propre dun oprateur permet aussi de simplifier la
notion de fonction doprateur (voir section 2.4.4). En effet si
X
A=
i | i ih i |
i

alors,
f (A) =

f (i ) | i ih i |

Tout ceci nous amne au thorme important suivant.

2.5.5

187

Oprateurs normaux

Thorme 2.11 En dimension finie, un oprateur linaire A sur un


espace de Hilbert H est unitairement diagonalisable ssi il est normal.
Dmonstration. = Soit A un oprateur unitairement diagonalisable.
Dans sa representation propre, A scrit :
X
A=
i | i ih i |
i

Son adjoint, A est alors donn par :


hX
i X h
i
A =
i | i ih i | =
i | i ih i |
i

i | i ih i |

i | i ih i |

Notons que cette dernire relation met bien en vidence le fait que A et A
partagent les mmes vecteurs propres et que le spectre de A est bien le
conjugu du spectre de A, ce que lon peut crire symboliquement :


(A ) = (A)
Dun ct, nous avons :
hX
ihX
i X
A A =
i | i ih i |
j | j ih j | =
i j | i ih i | j ih j |
i

i j ij

i,j

| i ih j | =

i,j

|i | | i ih i |

et de lautre,
A A =

hX
j

X
i,j

ihX
i X
j | j ih j |
i | i ih i | =
j i | j ih j | i ih i |
i

j i ji | j ih i | =

i,j

|i |2 | i ih i |

Par consquent, A A = A A et loprateur A est bien normal.


= Considrons dabord le cas o H est uni-dimensionnel. Dans ce
cas particulier, laction de tout oprateur linaire A se rduit lapplication
dun facteur multiplicatif . En dnotant tout vecteur unitaire de lespace
par | 1 i, il suit que A se dcompose suivant :
A = | 1 ih 1 |

188

Les oprateurs linaires sur lespace de Hilbert

ce qui est consistant avec le fait que toute matrice 1 1 est une matrice
scalaire A = I, dj trivialement sous forme diagonale, que son quation
caractristique est A11 = 0 et que, dans un tel espace, la relation de
fermeture se rduit I = | 1 ih 1 |. Si = 0, nous sommes en prsence de
loprateur nul.
Passons maintenant au cas plus intressant o lespace de Hilbert (sur le
corps des complexes) est de dimension n. Le thorme fondamental de lalgbre nous assure alors que tout oprateur linaire A admet au moins une
valeur propre . Supposons, en toute gnralit, que la multiplicit gomtrique de cette valeur propre soit m, avec 1 6 m 6 n. Soit H , le sous-espace
propre correspondant cette valeur propre et reprsentons par P le projecteur orthogonal sur ce sous-espace.
P =

m
X

| i ih i |

(2.106)

Dans lquation ci-dessus, la dimension de H est m et les {| i i}i=1,...,m


forment une base orthonorme de ce sous-espace propre. Le projecteur P
dcompose lespace de Hilbert en une somme directe de deux sous-espaces
complmentaires :
H = H H

Dfinissons loprateur P par :


P = I P

(2.107)

Il est facile de dmontrer que P est le projecteur orthogonal sur H


. En
effet,
(P )2 = (I P )(I P ) = I 2P + P2 = I 2P + P = I P = P
Puisque P est un oprateur idempotent dordre 2, il est un projecteur.
Tout vecteur | i de H se dcompose en
| i = | i + | i
o | i H et | i H
, avec
P | i = | i

(2.108)

Dun autre ct,


P | i = (I P ) | i = | i P | i
= | i + | i | i = | i

(2.109)

2.5.5

189

Oprateurs normaux

de sorte que P est bien le projecteur sur H


.
Par 2.71, on a :
P P = P P = 0

(2.110)

Nous allons maintenant dmontrer que tout oprateur normal A peut se


dcomposer sous la forme :
A = P + A|H

(2.111)

o A|H est la restriction de loprateur A au sous-espace H

A|H = P A P

(2.112)

Dans un premier temps, on a :


A = IA I = (P + P ) A (P + P )
= P AP + P AP + P AP + P AP
Nous voulons ventuellement dmontrer que les termes croiss P AP
et P AP sont nuls. Mais dabord rappelons que, pour tout | i H ,
A | i = | i

(2.113)

Maintenant, pour tout | i H,


AP | i = A | i = | i = P | i
par 2.108 et 2.113, et nous avons lidentit suivante :
A P = P

(2.114)

Ceci nous permet dliminer le terme P AP puisque :


P AP = P P = P P = 0
Ensuite, pour tout | i H,
P AP | i = P [ AP | i ] = P [ P | i] = P P | i
(P A)P | i = ( P )P | i
et de (P A P ) P | i = 0H , on tire une seconde identit :
P A = P

(2.115)

190

Les oprateurs linaires sur lespace de Hilbert

et le terme P AP disparait son tour :


P AP = P P = 0
Nous avons donc dmontr quun oprateur normal A se dcompose en :
A = P AP + P AP

(2.116)

ou, encore, de faon plus significative :


A = A|H + A|H

(2.117)

c.--d. que A est la somme de sa restriction sur le sous-espace propre H et


de sa restriction sur le sous-espace complmentaire H
.
Dmontrer que A|H = P AP = P est un jeu denfant.
P AP = P P = P2 = P

(2.118)

ce qui confirme lidentit 2.111.


Pour terminer la preuve, il nous faut dmontrer que A|H = P AP est

normal. Pour cel, nous allons dabord dmontrer que P commute avec A
ainsi quavec son adjoint A . En effet,
AP = IAP = (P + P ) AP = P AP + P AP = P AP
= P AP + P AP = P A(P + P ) = P AI = P A
o nous avons tir avantage du fait que P AP = P AP = 0.
De plus, comme A est normal, il partage ses vecteurs propres et, a fortiori,
ses espaces-propres avec son adjoint A de sorte que :
A P = IA P = (P + P ) A P = P A P + P A P = P A P
= P A P + P A P = P A (P + P ) = P A I = P A
o nous avons utilis le mme subterfuge qu la ligne prcdente. Donc,
AP = P A

(2.119a)

A P = P A

(2.119b)

Finalement,
(P AP )(P AP ) = P AP P A P = P P AP A P
= P P AA P P = P P A AP P
= P A P P AP = (P AP ) (P AP )

2.5.5

191

Oprateurs normaux

o nous avons utilis 2.119a et 2.119b et lhypothse que A soit normal.


Nous avons dmontr que tout oprateur A se dcompose selon :
A = P + P AP
o P AP est normal. On peut trafiquer cette quation en remplacant P
par le membre de droite de 2.106 et en posant i = ; i = 1, . . . , m pour
obtenir :
m
X
A=
i | i ih i | + P AP
(2.120)
i

P AP

est normal, on peut continuer le processus par induction


Puisque
avec une autre valeur propre de A diffrente de , dont le sous-espace propre
est strictement contenu dans H
. Le fait que les sous-espaces propres de
A soient mutuellement orthogonaux nous permet de continuer ce processus
jusqu lpuisement complet du spectre de A. Nous obtenons alors :
A=

n
X

i | i ih i |

(2.121)

o les {| i i} forment une base hilbertienne compose de vecteurs propres


de A. Notons que tous les i ne sont pas ncessairement distincts et cest
certainement le cas si le spectre est dgnr. Il est aussi permis quun ou
mme plusieurs des i prenne la valeur 0, introduisant ainsi des oprateurs
nuls dans la sommation.
Tout oprateur normal est donc unitairement diagonalisable.
En termes pratiques, un oprateur est diagonalisable si la matrice qui
le reprsente lest aussi. Par souci dexactitude, il serait plus appropri de
parler de dcomposition spectrale lorsquil est question doprateurs et de rserver le terme diagonalisable pour les matrices. Le thorme suivant est une
reformulation du thorme prcdent en termes de dcomposition spectrale.
Thorme 2.12 Soit A, un oprateur normal sur un espace de Hilbert
H de dimension finie n. Alors il existe une famille doprateurs Pi LC (H),
ainsi quune famille de scalaires i C, avec i = 1, . . . , k et 1 6 k 6 n, tels
que :
1) A = 1 P1 + 2 P2 + + k Pk
2) P1 + P2 + + Pk = I
3) P12 = P1 , P22 = P2 , . . . , Pk2 = Pk
4) Pi Pj = 0, pour i 6= j

192

Les oprateurs linaires sur lespace de Hilbert

La condition 3) nous indique que les Pi sont en fait des projecteurs et


la condition 4), que ces projecteurs sont orthogonaux entre eux. De plus,
ces conditions nous assurent que toute somme de Pi est aussi un projecteur.
Par exemple, si on lve au carr le membre de gauche de lidentit 2), on
obtient :
(P1 + P2 + + Pk )2 =

k X
k
X

Pi Pj =

i=1 j=1

k
X

Pi Pi =

i=1

k
X

Pi = P1 + P2 + + Pk

i=1

La condition 2) nous dit que lespace de Hilbert est dcompos en sousespaces orthogonaux. De fait, H est dcompos selon les sous-espaces propres
de loprateur A qui, rappellons-le, sont orthogonaux entre eux :
H = H1 H2 Hk

(2.122)

Chacun des projecteurs sur ces sous-espaces propres prend une forme similaire 2.106.
La dcomposition 2.122 est en fait une forme de partition, c.--d. un
recouvrement de lespace par un ensemble de sous-espaces non-vides 24 et
deux deux disjoints.
Lensemble des kets | i i utiliss pour la construction des projecteurs
forment une base hilbertienne. En effet, pour respecter les conditions 3)
et 4), on doit avoir simultanment h i | i i = 1 et h i | j i = 0. Cette base hilbertienne constitue la reprsentation propre de loprateur A et les scalaires
i sont alors les valeurs propres de A. En bout du compte, dcomposition
spectrale est synonyme de diagonalisation unitaire.
Le tableau 2.2 liste les valeurs propres associes diffrents oprateurs
normaux.
Nous sommes en mesure de dmontrer un rsultat dj prophtis en 2.86,
soit que pour tout oprateur positif A, il est toujours possible de trouver un
oprateur linaire B tel que :
A = BB

(2.86)

Mais dabord dmontrons que tout oprateur positif possde une racine carre unique. Puisque A est positif, il est donc hermitien et a fortiori normal
et possde ainsi une dcomposition propre :
X
A=
i | i ih i |
(par 2.105)
i

24. Par sous-espace vide, nous entendons ici le sous-espace trivial {0}. Aucun des Hi
nest vide puisque chaque sous-espace propre possde au moins un vecteur propre.

2.5.5

193

Oprateurs normaux

Type doprateur

Valeurs propres
i = eii , i R
(facteur de phase)
i R
(rel)
i = ib, b R
(imaginaire pur)
i > 0
(rel)
i {0, 1}
(rel)
i = 1, i
(rel)
i = 0, i
(rel)

Unitaire
Hermitien
Anti-Hermitien
Positif
Projecteur
Identit
Nul

Table 2.2 Spectre de diffrents oprateurs normaux.


o toutes les valeurs propres sont non-ngatives. Posons
Xp
1
A2 =
i | i ih i |

(2.123)

Puisque toutes les valeurs propres i sont les racines carres positives
1
uniques de nombres rels non-ngatifs, il sensuit que A 2 est unique et positif
(par le thorme 2.10). De plus,
Xp
Xp
Xp p
1
1
A2 A2 =
i | i ih i |
j | j ih j | =
i j | i ih i | j ih j |
i

ij

Xp p
Xp p
X
=
i j ij | i ih j | =
i i | i ih i | =
i | i ih i |
ij

=A
1

et A 2 est bien la racine carre positive unique de loprateur A.


Puisque la matrice qui reprsente loprateur A est diagonalisable, il
existe, daprs le thorme 2A.5, une matrice diagonale D telle que :
D = U A U

194

Les oprateurs linaires sur lespace de Hilbert


1

o U est une matrice unitaire. On vrifiera facilement que A 2 est alors donne
par :

1
A2 = U D U

o D est la matrice diagonale :

1
0

..
.
D=
i
.
.

n
Pour obtenir la dcomposition 2.86, nous navons qu poser
1

B = U A2
1

o U est une transformation unitaire quelconque. Comme B = A 2 U , il


sensuit que :
1
1
1
1
B B = A 2 U U A 2 = A 2 IA 2 = A
Mentionnons que le produit dun oprateur unitaire et dun oprateur hermitien donne un oprateur linaire qui nest en gnral ni unitaire ni hermitien.
Et puisque U est arbitraire, loprateur B nest dfini qu une transformation unitaire prs.
La dcomposition A = B B, valide pour les oprateurs positifs, est trs
utile pour la dmonstration de rsultats additionnels. Nous verrons la section 2.6 une autre forme de dcomposition qui est applicable cette fois tout
oprateur linaire, la dcomposition polaire.
2.5.5.2

Diagonalisation simultane doprateurs

Bien que la diagonalisation dun oprateur soit intressante en soi, en


mcanique quantique on est plus souvent concern par la diagonalisation
simultane dun groupe doprateurs et particulirement par la construction
dun E.C.O.C 25 .
On dit que deux oprateurs sont simultanment diagonalisables ou codiagonalisables, sil existe une base hilbertienne commune aux deux oprateurs
suivant laquelle chaque oprateur est diagonalisable. Le thorme suivant,
qui soulve des points dj adresss en 2.4.3, en dgage lultime condition.
Thorme 2.13 Deux oprateurs normaux A et B sont codiagonalisables ssi ils commutent.
25. Ensemble Complet dObservateurs qui Commutent, voir le chapitre 3.

2.5.5

195

Oprateurs normaux

Dmonstration. = Soit A et B deux oprateurs normaux simultanment


diagonalisables. Alors il existe une base hilbertienne {| i i} pour laquelle :
A | i i = i | i i
B | i i = i | i i
Mais,





AB | i i = A B | i i = A i | i i = i A | i i = i i | i i = i i | i i





BA | i i = B A | i i = B i | i i = i B | i i = i i | i i = i i | i i
En soustrayant ces deux galits, on obtient [A, B] | i i = 0 pour tout vecteur
de la base hilbertienne. Donc AB = BA et les deux oprateurs commutent.
= Pour cette partie de la preuve, dnotera une valeur propre quelconque, dgnre ou non, de loprateur A. Idem pour et loprateur B.
Puisque les oprateurs A et B sont normaux, ils sont unitairement diagonalisables et chacun de ces oprateurs partitionne lespace de Hilbert en
une somme directe de sous-espaces propres, deux deux orthogonaux.
M
M
H=
H =
H
(2.124)
(A)

(B)

Considrons un sous-espace propre particulier de A, soit H en nous


allouant la possibilit que la valeur propre soit dgnre. Par hypothse,
les oprateurs A et B commutent. Nous avons vu la section 2.4.3 que le
sous-espace propre H est globalement stable sous laction de loprateur B,
puisque pour tout ket | i de H on a :
B | i H
Nous allons maintenant, de surcrot, partitionner H en une somme directe
de sous-espaces toujours deux deux orthogonaux. En partant de la tautologie
H = H H
et en utilisant 2.124, on obtient :
h M
i
M
H = H
H =
H H
(B)

(2.125)

(B)

Chaque terme H H est un sous-espace en soi puisquil est le rsultat de


lintersection de deux sous-espaces. Posons :
H = H H ,

H H 6= {0}

196

Les oprateurs linaires sur lespace de Hilbert

c.--d. que nous ne retenons que les H de dimension non-nulle. Puisque H


est globalement stable sous laction de B et quil en est de mme trivialement
pour H , leur intersection H est globalement stable sous laction la fois
de A et de B, c.--d. que, pour tout ket | i de H :
A | i H

et B | i H

Mais H est une partie dun sous-espace propre la fois pour A et pour B
de sorte que, pour tout ket | i de H :
A|i = |i
B |i = |i
En conclusion, nimporte quelle base orthonorme {| i i}i=1,...,dim H de H
codiagonalise les oprateurs A et B dans ce sous-espace :
A|ii = |ii
B |ii = |ii
Et puisque,
H =

(B)

et
H=

M
(A)

H =

(A)
(B)

il sensuit quen choississant une base orthonorme arbitraire dans chacun


des H , on obtient une base commune de vecteurs propres qui codiagonalise
les oprateurs A et B sur lensemble de lespace.

2.6

Dcomposition polaire*

Tout oprateur linaire A peut tre factoris en un produit dun oprateur


unitaire U et dun oprateur hermitien H. La dcomposition peut se faire
gauche :
A = UH
ou droite :
A = H1 U
Pour un oprateur quelconque A LK (V), cette dcomposition nest gnralement pas unique. Toutefois, si nous nous restreignons aux applications

2.6

197

Dcomposition polaire*

non-singulires, A Aut(V), alors nous obtenons une dcomposition polaire


qui est unique.
Thorme 2.14 (Dcomposition polaire) Tout oprateur linaire A
dans un espace de Hilbert de dimension finie peut se dcomposer selon :
A = UP

( gauche)

(2.126a)

A = P1 U

( droite)

(2.126b)

o P et P1 sont des oprateurs positifs uniques et U est un oprateur unitaire.


De plus, si A est inversible, alors U est uniquement dfini par U = AP 1 .
Dmonstration. Nous allons dabord dmontrer le cas o loprateur A est
non-singulier.
Nous savons, par 1) du problme 2.15, que pour tout oprateur linaire A,
loprateur A A est positif. Il en est de mme pour loprateur AA puisque,
pour tout | i H,
h | AA | i = h A | A i = k A | i k2 > 0
Nous pouvons rapidement trouver des candidats pour P et P1 en supposant, a priori, que les relations A = U P et A = P1 U sont valides. Puisque,
par hypothse, P = P et P1 = P1 ,
A A = (U P ) U P = P U U P = P 2
AA = P1 U (P1 U ) = P1 U U P1 = P12
Posons donc, comme point de dpart,
P 2 = A A

(2.127a)

et dfinissons P comme tant lunique racine carre positive de loprateur


positif A A :

P = + P 2 = A A
(2.127b)
Puisque tout oprateur positif est normal, P 2 est unitairement diagonalisable. Dans sa reprsentation propre {| ri i}, en dsignant ses valeurs propres
par 2i , P 2 scrit :
X
P2 =
2i | ri ih ri |
i

o tous les 2i sont non-ngatifs. Par 2.59, si | ri i est vecteur propre de P 2


correspondant la valeur propre 2i , alors | ri i est aussi vecteur propre de P

198

Les oprateurs linaires sur lespace de Hilbert

q
correspondant la valeur propre i = + 2i > 0. P est donc dfini de faon
unique par :
X
P =
i | ri ih ri |
i

et il est facile de vrifier que P est positif puisque pour tout vecteur unitaire
| i, on a :
X
h|P |i =
i |h ri | i|2 > 0
i

le terme de droite tant une somme de rels non-ngatifs.


Puisque P partage la mme reprsentation propre que P 2 , on a :
P | ri i = i | ri i

(2.128)

pour tout vecteur propre | ri i. Comme P = P , pour tout | i H, on a :


h | P 2 | i = h | P P | i = h | A A | i

(par 2.127a)

h P | P i = h A | A i
k P | i k2 = k A | i k2
En particulier,
| i,

P |i = 0

A|i = 0

ce qui revient dire que Ker(P ) = Ker(A), donc que P et A partagent un


mme noyau.
Pour simplifier, supposons dans un premier temps que loprateur A soit
inversible. Dans ce cas, tous les valeurs propres de 2.128 sont strictement
positives, soit i > 0 et loprateur P est dfini positif. Examinons laction
de A sur la base hilbertienne {| ri i} correspondant la reprsentation propre
de P . Posons :
| i i = A | ri i
(2.129)
Alors,
h i | i i = h ri | A A | ri i = h ri | P 2 | ri i
= h ri | 2i | ri i = 2i h ri | ri i = 2i

(2.130)

puisque h ri | rj i = ij .
Normalisons ensuite tous les vecteurs | i i :
| li i =

A | ri i
| i i
=
i
i

(2.131)

2.6

199

Dcomposition polaire*

Nous prtendons que la famille {| li i} ainsi obtenue constitue une base hilbertienne. En effet,
h i | j i
h A ri | A rj i
h ri | A A | rj i
=
=
i j
i j
i j
2
2
j h ri | rj i
h ri | P | rj i
j
=
=
=
ij
i j
i j
i

h li | lj i =

de sorte que h li | li i = 1 et h li | lj i = 0, i 6= j. Donc, {| li i} est bien une base


hilbertienne.
La transformation qui permet de passer de la base hilbertienne {| ri i}
la base hilbertienne {| li i} est une transformation unitaire U car il sagit ni
plus ni moins que dun changement de reprsentation. Posons :
| li i = U | ri i

(i = 1, . . . , n)

(2.132)

Nous sommes maintenant en mesure de prouver que A = U P en dmontrant que laction de U P sur chacun des vecteurs de la base hilbertienne
{| ri i} est identique laction de A.
U P | ri i = i U | ri i
= i | li i
i
=
| i i = | i i
i
= A | ri i

(par 2.128)
(par 2.132)
(par 2.131)
(par 2.129)

Donc,
A = UP

(2.133)

Par hypothse, A est inversible et on a :


null(A) = null(P ) = 0
car A et P partagent un mme noyau. Par consquent P est inversible lui
aussi et U est uniquement dtermin par :
U = AP 1

(2.134)

Nous pourrions procder de la mme faon pour la dcomposition droite


en posant :

(2.135)
P1 = AA

200

Les oprateurs linaires sur lespace de Hilbert

mais il est plus expditif de partir du rsultat obtenu :


A = U P = U P U U = P1 U
avec
P1 = U P U = AU

(2.136)

et de dmontrer que P1 est un oprateur dfini positif qui est gal AA .


En effet,
h | P1 | i = h | U P U | i = h U | P | U i
= h|P |i > 0
en posant | i = U | i et en utilisant le fait que P est un oprateur dfini
positif. Finalement,
P12 = U P U U P U = U P P U = (U P )(U P ) = AA
ce qui termine la dmonstration dans le cas o A est un automorphisme.
Il reste dmontrer que la dcomposition gauche tient toujours lorsque
loprateur A est singulier. Puisque A et P partagent un mme noyau, P est
singulier lui aussi, c.--d. quau moins un des i de 2.128 est gal 0.
Supposons, en toute gnralit que la nullit de A et P soit gale k > 0.
Si k = n, alors A et P sont deux instances de loprateur nul et A = U P
tient trivialement pour tout U . Supposons donc que 0 < k < n.
Comme P est normal, lespace H peut se dcomposer en la somme directe
des sous-espaces propres orthogonaux de P , soit :
H = H=0 H6=0
| {z }
| {z }
dim k

dim nk

o le sous-espace propre H=0 nest nul autre que Ker(P ) car pour tout
vecteur | i H=0 ,
P |i = 0|i = 0
et le seul vecteur | i H6=0 pour lequel P | i = 0 est le vecteur nul.
Dun autre ct, puisque le noyau de A est un sous-espace ferm, on a :

H = Ker(A) Ker(A)
| {z }
| {z }
dim k

dim nk

do lon dduit que :




H=0 = Ker(P ) = Ker(A) et H6=0 = Ker(A) = Ker(P )

2.6

201

Dcomposition polaire*

Donc, il suffit de procder comme prcdemment pour les n k valeurs


propres de P qui sont diffrentes de 0 avec :
| li i =

A | ri i
i

(i = 1, . . . , n k; i 6= 0)

Les {| ri i} et les {| li i} engendrent le mme sous-espace, soit :




Vect(r1 , . . . , rnk ) = Vect(l1 , . . . , lnk ) = Ker(A) = Ker(P )
Il ne reste plus qu choisir dans le noyau de P (et de A) les k vecteurs
orthonormaux qui viennent complter la base hilbertienne et de poser :
| li i = | ri i

(i = n k + 1, . . . , n)

On dfinit la transformation unitaire U toujours de la mme faon :


| li i = U | ri i

(i = 1, . . . , n)

Cette fois, nous avons :


U P | ri i = A | ri i
U P | ri i = A | ri i = 0

(i = 1, . . . , n k)
(i = n k + 1, . . . , n)

et nous avons dmontr que la dcomposition A = U P tient toujours mme


si A nest pas inversible. Notons cependant que, puisque la slection des derniers k vecteurs de base est purement arbitraire, la transformation unitaire
qui relie les | ri i aux | li i nest plus unique.
La dmonstration de la dcomposition droite procde de la faon dj
expose plus haut en posant P1 = U P U = AU (2.136), o P1 est maintenant un oprateur positif (plutt que dfini positif).
Notons encore que si A est un oprateur hermitien, alors P1 = P . En
effet, dans tous les cas on a P1 = P1 = AU . Si en plus A est hermitien,
alors,
P1 = A U = (U A)


(P1 ) = (U A)
P1 = U A = P

(par 2.36)

Nous avons vu en 2.81 que tout oprateur A peut tre dcompos de


faon unique en un oprateur hermitien et un oprateur antihermitien :
A=

A + A A A
+
2
2

202

Les oprateurs linaires sur lespace de Hilbert

Puisque les valeurs propres dun oprateur hermitien sont relles et que celles
dun oprateur anti-hermitien sont purement imaginaires, on peut tablir une
analogie entre la dcomposition de loprateur A ci-dessus et la reprsentation dun nombre complexe sous forme algbrique. Mais tout nombre complexe possde aussi une reprsentation sous forme exponentielle qui sinspire
des coordonnes polaires (r, ) du point correspondant dans le plan cartsien :
z = rei
Cest cette forme exponentielle des nombres complexes que la dcomposition polaire fait rfrence. Dune part, il y a ce lien, dvoil en 2.92, qui existe
entre les oprateurs hermitiens et unitaires et, de lautre, il y a la convention dcriture pour les oprateurs positifs discute en 2.87. Par exemple, la
dcomposition polaire droite
A = P1 eiH
avec P1 > 0 et U = eiH pour un H hermitien, est lquivalent, dans lespace
des oprateurs, de la forme exponentielle des nombres complexes.
Mentionnons, en terminant, que la dcomposition polaire nest gnralement plus possible en dimension infinie.

2.7

Oprateurs borns*

Jusqu prsent, nous nous sommes concentrs sur les proprits algbriques des oprateurs linaires, en ngligeant laspect topologique des espaces sur lesquels ils oprent. Puisque, pour des espaces vectoriels topologiques, les notions de point et de vecteur se confondent, il conviendra dcrire
simplement lorsquil sera question dun point de lespace, en se rservant
| i pour les vecteurs. Aussi nous chercherons, dans un premier temps,
diffrencier les formes linaires par lutilisation de lettres minuscules.
Soient deux espaces vectoriels norms U et V. En gros, une application
borne est une application linaire dont limage de toute partie borne de
U est une partie borne de V. Mais puisque toute partie borne de U peut
tre ramene lintrieur de la boule unit par une translation et, au besoin,
une rduction uniforme par un facteur dchelle k appropri 26 , il est plus
pratique davoir recours la dfinition quivalente suivante.
Dfinition 2.5 Soient deux espaces vectoriels norms U et V. On dit
dune application linaire A : U V quelle est borne si limage de la
boule unit de U est une partie borne de V.
26. Techniquement, une homothtie vectorielle de rapport k < 1.

2.7

203

Oprateurs borns*

Quantitativement, cela signifie quil existe une constante relle C > 0 telle
que, pour tout vecteur unitaire | i de U :
k A | i kV 6 C

k | i kU = 1

(2.137)

Il convient alors de dfinir la norme de lapplication A, dnote k A k, comme


tant le plus petit majorant de lensemble des constantes C qui respectent
lingalit 2.137, soit :



k A k = sup k A | i kV k | i kU = 1
(2.138)
Gomtriquement, la norme de lapplication A est gale au rayon de la
plus petite boule centre lorigine de lespace V qui contient limage de la
boule unit de U. La norme de lapplication nulle est 0.
De faon plus dmocratique, nous aurions pu choisir une dfinition lgrement diffrente, par exemple :



k A | i kV
k A k = sup
(2.139)
k | i kU 6= 0
k | i kU
Le plus important cest de bien vrifier que lingalit suivante est toujours
respecte quel que soit le domaine de la dfinition choisie :
k A | i kV 6 k A k k | i kU

(2.140)

Puisque A | 0 iU = | 0 iV , lingalit 2.140 est de plus respecte lorsque


| i = | 0 iU , quelle que soit la valeur de la norme k A k. Pour un partisan
de la dfinition 2.139, cela lui permet dtendre lingalit 2.140 sur lespace
U au complet.
Lensemble des applications bornes, que lon dnote par B(U, V), constitue un espace vectoriel.
premire vue Lc (H, K), lensemble des formes linaires continues sur
H, encore mieux connu sous le nom de dual topologique H0 , semble manquer
lappel. Cest que, techniquement parlant, Lc (H, K) ne peut faire partie
de B(U, V) puisque K est un corps plutt quun espace vectoriel. Dans le
bel esprit des espaces vectoriels topologiques qui veut que les points et les
vecteurs soient des concepts interchangeables, on ne peut rver de plus belle
occasion pour promouvoir K au titre despace vectoriel dfini sur son propre
corps. Nous pouvons dsormais en toute lgitimit angoisser savoir si une
forme linaire continue f Lc (H, K) est borne ou non.
Pour les cas qui nous intressent le plus, K = R ou C, les deux dfinitions
de la norme dune application sont toutes fins pratiques interchangeables
et rsultent en des valeurs de norme identiques.

204

Les oprateurs linaires sur lespace de Hilbert

Pour f Lc (H, R) ou Lc (H, C), on peut laisser tomber les indices dans
lingalit 2.140 et crire simplement :
kf |ik 6 kf k k|ik

(2.141)

Nous allons effectuer un petit retour sur la continuit des applications


avant daborder un thorme important.
Proposition 2.15 Soit une application linaire A entre deux espaces
vectoriels norms U et V. Lapplication A est continue en tout point de
lespace U ssi A est continue en 0U .
Dmonstration. = Si A est continue en tout point de lespace U, alors
fortiori, A est continue en 0U .
= Supposons que A soit continue en 0U . Alors pour toute suite
(| n i)nN qui converge vers | 0U i on a :
lim k | n i | 0U i kU = 0 = lim k A | n i A | 0U i kV = 0

ou, plus simplement, puisque A | 0U i = | 0V i,


lim k | n i kU = 0 = lim k A | n i kV = 0

(2.142)

Soit maintenant | i, un vecteur quelconque de U ainsi que (| n i)nN , une


suite qui converge vers | i. Alors,
lim k | n i | i kU = 0

Posant | n i = | n i | i dans 2.142, on obtient


lim k | n i | i kU = 0 = lim k A (| n i | i) kV = 0

et par linarit,
lim k | n i | i kU = 0 = lim k A | n i A | i kV = 0

et nous avons ainsi dmontr que A est continue en | i. Ce vecteur tant


quelconque, il sensuit que A est continue sur tout lespace U.
Le thorme suivant ramne la notion dapplication borne en terrain
connu.
Thorme 2.16 Soit une application linaire A entre deux espaces vectoriels norms U et V. Lapplication A est borne ssi lapplication linaire
A est continue.

2.7

205

Oprateurs borns*

Ainsi, aprs tout le mal que nous nous sommes donns pour amliorer le sort
de Lc (H, K), il savert que les formes linaires continues taient dj bornes
par dfaut ! Par dpit, partir de maintenant, si nous parlons volontiers
dapplication borne ou doprateur born, nous nous en restreindrons aux
formes linaires continues.
Notre intrt principal tient aux endomorphismes de lespace de Hilbert,
correspondant au cas U = V = H. Lensemble des oprateurs borns sur
H est dsign simplement par B(H). Puisque le produit de deux oprateurs
borns de B(H) est aussi un oprateur born, il sert dfinir un algbre
doprateurs borns sur lespace de Hilbert.
Rajoutons enfin que, si A, B B(H), alors
kAB k 6 kAkkB k

(2.143)

Nous pouvons utiliser la notion doprateur born pour tendre aux espaces de Hilbert de dimension infinie certains des rsultats importants valids
pour des espaces de dimension finie, en particulier le thorme 1.6.
Thorme 2.17 (Thorme de Riesz) Soit une forme linaire continue
f H0 sur un espace de Hilbert de dimension infinie. Alors il existe un
unique vecteur | i H tel que
f (| i) f (| i) = h | i
pour tout | i H.
Cest une proprit des espaces de Hilbert que toute forme linaire continue de H0 peut scrire sous la forme dun produit scalaire avec un vecteur
fixe de H. Le thorme de Riesz permet dtablir un isomorphisme entre un
espace de Hilbert et son dual topologique. En effet, soit lapplication I :
I : H H0
7 f
Selon le thorme de Riesz, chaque forme linaire de H0 correspond un
point de lespace H. Lapplication I est donc surjective et puisque ce point
correspondant est unique, elle est aussi injective. Par consquent, les deux
espaces sont isomorphes.
En dimension finie, tous les oprateurs linaires sur un espace de Hilbert
sont borns, donc continus, et le thorme 1.6 nest quun cas particulier du
thorme de Riesz.
On se sert du thorme de Riesz pour dmontrer lexistence de loprateur
adjoint.

206

Les oprateurs linaires sur lespace de Hilbert

Thorme 2.18 Soit un espace de Hilbert H de dimension infinie dot


dun produit scalaire hermitien. Soit A B(H), un oprateur born. Alors il
existe un unique oprateur born A tel que :
h A | i = h | A i

(2.144)

pour tout | i, | i H.
Loprateur A est appel loprateur adjoint de A.
Dfinition 2.6 Un oprateur born A sur un espace de Hilbert H est
appel auto-adjoint si A = A.
Pour un oprateur auto-adjoint, lquation 2.144 scrit simplement :
h A | i = h | A i
En dimension infinie, tout oprateur born admet un oprateur adjoint.
Malencontreusement, certains des oprateurs les plus fondamentaux de la
mcanique quantique ont la fcheuse proprit de ne pas tre borns. Il est
cependant toujours possible de leur dfinir un oprateur adjoint, mais leur
domaine de dfinition ne stend plus lespace entier.
Proposition 2.19 Soient un espace de Hilbert H de dimension infinie
sur le corps des complexes C et A B(H), un oprateur born. Alors,
1) A = A
2) k A k = k A k
3) k A A k = k A k2
Dmonstration.
1) Lgalit 2.144 tient aussi en particulier pour | i = | i, soit
h A | i = h | A i

(2.145a)

Prenant le conjugu de chaque ct de cette dernire galit, on obtient


h | A i = h A | i

(2.145b)

Dun autre ct, si lon remplace A par A dans 2.145a, on a


h A | i = h | A i

(2.145c)

2.7

207

Oprateurs borns*
En galant 2.145b et 2.145c, on obtient
h A | i = h A | i
Prenons encore une fois le conjugu de chaque ct :
h | A i = h | A i
Extrayons maintenant les oprateurs des kets de droite :
h | A | i = h | A | i

Cette dernire galit tant valide pour tout | i H, il sensuit que


A = A par le thorme 2.9.
En remplacant A par A dans lquation 2.144 et en utilisant ensuite
le rsulat A = A, on obtient :
h A | i = h | A i

(2.146)

de sorte que lemplacement de loprateur adjoint dans lquation 2.144


est optionel.
2) En faisant bon usage de lingalit de Cauchy-Schwartz et du fait que
si loprateur A est born, alors A lest aussi :
0 6 k A | i k2 = h A | A i

(par 1.18)

= h|A Ai
6 k | i k k A A | i k

(par 2.146)
(par Cauchy-Schwartz)

6 k|ikkA kkA|ik

(par 2.141)

do lon tire
k A | i k 6 k A k k | i k

(2.147)

Cette dernire ingalit tant valide pour toute valeur de | i, il sensuit que k A k est une valeur possible pour la constante C dans 2.137.
Or comme k A k est la plus petite borne suprieure de lensemble des
majorants possibles, il sensuit que
k A k 6 k A k

(2.148)

Un raisonnement identique partant de k A | i k2 et utilisant le rsultat A = A dmontr en 1) conduit


k A k 6 k A k

(2.149)

En combinant 2.148 et 2.149, il rsulte que :


k A k = k A k

(2.150)

208

Les oprateurs linaires sur lespace de Hilbert


3) Partant de k A | i k 6 k A k k | i k et levant au carr, on obtient
k A | i k2 6 k A k2 k | i k2

(2.151)

Il est important de constater que k A k2 est, par dfinition, la plus petite


valeur constante qui valide lingalit 2.151 pour tout | i H. Dans la
dmonstration de 2), nous sommes parvenus une tape intermdiaire
que nous reprenons ici :
k A | i k2 6 k | i k k A A | i k
Cette fois, nous choisissons de poursuivre ainsi :
k A | i k2 6 k A A k k | i k2
En comparant avec 2.151, on tire :
k A k 2 6 k A A k

(2.152)

Faisant usage de 2.143 et de lidentit k A k = k A k dmontre en 2),


il sensuit :
k A A k 6 k A k k A k = k A k 2
(2.153)
et finalement, en combinant 2.152 et 2.153,
k A A k = k A k 2

Pour les besoins plus restreints de linformatique quantique, les espaces


vectoriels suivants sont de toute premire importance : lespace de Hilbert
H (espace dtat de dimension n), son dual H0 (lui aussi de dimension n)
et lensemble des oprateurs borns B(H) (dimension n n). Rappelons
quen dimension finie la topologie joue un rle secondaire, les notions de dual
agbrique et de continu tant confondues avec celles de dual topologique et
de born.
Dans un cadre plus gnral, nous avons dmontr rigoureusement que
tout espace de Hilbert de dimension quelconque est isomorphe son dual
topologique. chaque point de H correspond un f H0 .

(2.154)

Nous allons montrer en terminant pourquoi la notation de Dirac est si


bien adapte nos besoins.

2.7

209

Oprateurs borns*
Reprenons lquation 2.141 en prenant soin de bien spcifier f .
k f ( | i) k 6 k f k k | i k

(2.155)

Nous pourrions raisonnablement laisser tomber le symbole f en remplacant f simplement par . Lquation 2.154 conserve un sens symbolique,

o le de gauche est un point de H et celui de droite, un point de H0 .


Passant du concept de point celui de vecteur, on crit :
|i

|i

(2.156)

o le de gauche est un vecteur dtat de H et celui de droite, un vecteur


de H0 .
Techniquement, il ny a rien dincorrect dans 2.156. Il est vrai que H0
est un espace vectoriel et que ses lments peuvent tre considrs en
tant que vecteurs 27 . Nous prfrons rserver lappellation vecteur pour les
vecteurs dtat. chaque vecteur dtat correspond une forme linaire qui
est un objet gomtrique diffrent et, pour clbrer cette diffrence, nous
utiliserons lappellation de covecteur en parlant des lments de lespace
dual H0
Si nous continuons dcrire | i pour dsigner un vecteur dtat, nous
utiliserons un symbole diffrent, h |, pour dsigner son covecteur associ.
Lisomorphisme entre H et H0 se conoit donc ainsi :
|i

h|

o, dans la plus pure tradition de la mcanique quantique, chaque ket de


H correspond un bra de H0 et inversement.
Lavantage de cette notation simpose de soi. Par exemple, rcrivons
lquation 2.155 ainsi :
k h |( | i) k 6 k h | k k | i k

(2.157)

Par dfinition, h |( | i) = f ( | i) = h | i, mais mme sans cette information, si on laisse tomber les parenthses dans lexpression de gauche,
27. Par exemple, le dual algbrique H est un espace vectoriel et, en tant que tel,
il est toujours possible de lui assigner son propre espace dual, le double dual H . En
dimension finie, on a toujours H = H . Lisomorphisme entre H et H est un exemple
disomorphisme canonique.

210

Les oprateurs linaires sur lespace de Hilbert

on obtient h | | i et, que lon choisisse de fusionner directement les barres


verticales ou dinsrer loprateur identit entre le bra et le ket, le rsultat
est le mme : quand un bra opre sur un ket, on obtient toujours un produit
scalaire.
Lquation 2.157 prend donc la forme rduite :
kh|ik 6 kh|k k|ik
Dans le ct gauche de lingalit, on a une norme hermitienne qui est
gale au module dun nombre complexe quelconque et de lautre, par 2) de
la proposition 2.19, on a que k h | k = k h | k. Mais puisque h | = | i,
on obtient finalement
| h|i | 6 k|ik k|ik
et lon saperoit que lon vient de redcouvrir lingalit de Cauchy-Schwartz
en passant, cette fois-ci, par les oprateurs borns.

2.8

211

Problmes du Chapitre 2

2.8

Problmes du Chapitre 2
Problmes

Problme 2.1. Transpose dune matrice. Dmontrez lidentit


(AB)T = B T AT .
Problme 2.2. Dterminant. Dans lespace des matrices carres
dordre 2, les proprits 1-3 des dterminants (appliques ici uniquement
aux ranges) peuvent scrire :


1 0
=1

(1)
0 1




a b
c d




(2)
=
c d
a b




a b
a b




(3a)
=
c
d
c d




a + p b + q a b p q
=
+

(3b)
c
d c d c d
Dmontrez les proprits 4-8 laide uniquement des proprits 1-3.
Problme 2.3. Inverse dune matrice. Dmontrez les identits
suivantes :
(a) (AB)1 = B 1 A1
(b) (AT )1 = (A1 )T
Problme 2.4. Valeurs propres. Trouvez les valeurs propres et les
vecteurs propres des matrices suivantes :








1 0
0 1
0 i
1 0
I=
, x =
, y =
, z =
0 1
1 0
i 0
0 1
Dterminez la multiplicit algbrique et la multiplicit gomtrique de chacune des valeurs propres.
Problme 2.5. Valeurs propres.

2
i

A = i 2
1 i

Soit la matrice hermitienne :

1
i
2

Trouvez les valeurs propres de A. Dterminez la multiplicit algbrique et


la multiplicit gomtrique de chacune des valeurs propres. Vrifiez lorthogonalit des vecteurs propres. Utilisez la procdure de Gram-Schmidt pour
obtenir une base hilbertienne propre.

212

Les oprateurs linaires sur lespace de Hilbert

Problme 2.6. Matrice orthogonale. Soit A, une matrice carre


dordre 2 qui est orthogonale. Dmontrez que A ne peut prendre que lune
ou lautre des deux formes suivantes :




cos sin
cos sin
,
sin cos
sin cos
o est un paramtre rel.
Problme 2.7. Matrice diagonalisable. Prouvez que la matrice :


1 1
A=
0 1
nest pas diagonalisable.
Problme 2.8. Isomorphisme despace vectoriels. tant donn
une base quelconque B = {| v1 i, | v2 i, . . . , | vn i} dun espace vectoriel V,
dmontrez que lapplication mat :
mat : LK (V) Mn,n (K)
F 7 matB (F )
qui chaque endomorphisme F fait correspondre la matrice carre matB (F )
selon la prescription tablie en 2.15, est un isomorphisme despaces vectoriels.
Problme 2.9. Isomorphisme dalgbres. On appelle morphisme
dalgbre entre deux K-algbres A et B toute application linaire L : A B
telle que :
1) L(IA ) = IB

2) F, G A, L(F G) = L(F )L(G)


o IA et IB sont respectivement les lments neutres pour le produit des
algbres A et B. Si, de plus, L est une bijection, alors on parlera disomorphisme dalgbre.
Dmontrez que lapplication mat dfinie au problme prcdent tablit
un isomorphisme entre les algbres LK (V) et Mn,n (K).
Problme 2.10. Transformations du plan. Pour ce problme,
veuillez vous rfrez aux transformations du plan illustres la figure 2.3
ainsi qu leurs matrices correspondantes.
Soit A, une matrice non-singulire relle dordre 2. Dmontrez que lon
peut toujours dcomposer A selon un des deux schmes suivants :
A = M JKL

ou

A = LJN JL

2.8

213

Problmes du Chapitre 2
Problme 2.11. Trace dun oprateur. Dmontrez que :
X

|h i | A | j i|2 = Tr(AA )

i,j

Problme 2.12. Commutateur. Dmontrez que :


AB =

[A, B] + [A, B]+


2

Problme 2.13. Fonctions doprateurs. Soient A et B, deux


oprateurs commutants. Dmontrez que :
eA eB = eB eA = eA+B
Problme 2.14. Oprateurs hermitiens. Dmontrez que
A est hermitien

h | A | i est rel, | i

Problme 2.15. Oprateurs positifs. Dmontrez les proprits


suivantes des oprateurs positifs :
1) Pour tout oprateur linaire A, loprateur A A est positif.
2) Pour tout oprateur positif A, on a :
|h | A | i|2 6 h | A | ih | A | i

(2.158)

Indice. Utilisez le fait que pour tout oprateur positif A, il est toujours
possible de trouver un oprateur linaire B tel que A = B B.
3) Pour tout oprateur positif A, on a Tr(A) > 0, avec
Tr(A) = 0 = A = 0
Problme 2.16. Oprateurs unitaires. Tout oprateur unitaire se
dcompose selon selon :
U=

U + U
U U
+i
= A + iB
2
2i

Dmontrez que :
1) A et B sont hermitiens
2) [A, B] = [A, U ] = [B, U ] = 0

214

Les oprateurs linaires sur lespace de Hilbert

Problme 2.17. Oprateurs unitaires. Considrez un espace de


Hilbert de dimension deux. Dmontrez que loprateur H reprsent par la
matrice suivante :


1
1 1
H=
2 1 1
est la fois hermitien et unitaire.
Problme 2.18. Oprateurs unitaires. Dmontrez quen dimension finie, tout oprateur unitaire U transforme une base hilbertienne en une
autre base hilbertienne.
Problme 2.19. Oprateurs normaux. Dmontrez les proprits
suivantes des oprateurs normaux dans un espace de Hilbert de dimension
finie.
1) Pout tout ket | i de lespace, k A | i k = k A | i k.
2) Si est une valeur propre dun oprateur normal A, alors loprateur
A I est un oprateur normal.
3) Tout vecteur propre dun oprateur normal A est aussi vecteur propre
de son adjoint A . De plus, si est valeur propre de A, alors est
valeur propre de A .
4) Les sous-espaces propres dun oprateur normal A sont mutuellement
orthogonaux.
5) Le noyau dun oprateur normal A et limage de son oprateur adjoint
sont des complments orthogonaux.

Problmes supplmentaires
Problme 2.20. Dterminant. En vous servant uniquement de la
formule 2A-33, prouvez les proprits 1-11 des dterminants.
Problme 2.21. Oprateurs positifs. Dmontrez le thorme 2.10.
Problme 2.22. Dcomposition polaire. Trouvez les dcompositions polaires gauche et droite des matrices suivantes.






1 i
1
i
1 1
a)
,
b)
,
c)
i 2
i 2
1 0
Problme 2.23. Application borne. Dmontrez le thorme 2.16.
Problme 2.24. Thorme de Riesz. Dmontrez le thorme 2.17.
Problme 2.25. Existence de loprateur adjoint. Dmontrez
le thorme 2.18.

Annexes
du
Chapitre 2

2.A

217

Les matrices

Annexe 2.A

Les matrices

Nous limiterons notre tude aux matrices de dimension finie dont les
coefficients sont des scalaires.

2.A.1

Lalgbre des matrices carres

Nous avons brivement mentionn au chapitre 1 que lensemble Mm,n (K)


des matrices m n possde la structure despace vectoriel si lon dfinit
laddition vectorielle et la multiplication scalaire de la faon suivante :

x11 x1n
y11 y1n
.
.
..
..
..
.
xij
.
yij
.

+ .

xm1 xmn
ym1 ymn

x11 + y11

.
.
=
.
xij + yij

xm1 + ym1


x11 x1n
x11
.
.
.
.
.. = ..

xij
xij
.

xm1 xmn
xm1

x1n
..
.

xmn

x1n + y1n

..
(2A-1a)
.

xmn + ymn

(2A-1b)

Si la multiplication scalaire peut tre gnralise lensemble de toutes


les matrices, laddition vectorielle quant elle ne fait du sens que pour les
matrices de mme type (c.--d. dfinies sur un mme corps et possdant un
mme nombre de lignes ainsi quun mme nombre de colonnes). Pour que
lon puisse proprement parler dalgbre matriciel, il nous faut maintenant
introduire une deuxime loi de composition interne qui dfinit un produit
entre matrices (vecteurs). Ici, nous devons faire face un obstacle majeur : la
multiplication de deux matrices est soumise des contraintes restrictives de
sorte quil est gnralement impossible de doter lespace vectoriel Mm,n (K)
dun produit matriciel !
De fait, la multiplication matricielle nest dfinie que pour des matrices
conformes. Soient deux matrices quelconques A et B. Ces matrices sont dites
conformes si le nombre de colonnes de A est gal au nombre de ranges de
B. En toute gnralit, si A est une matrice m n et B une matrice n p,
alors la matrice rsultante C = AB est une matrice de dimension m p

218

Annexe 2A

o chaque coefficient cij de C est obtenu en multipliant terme--terme les


coefficients de la ime range de A par la j me colonne de B et en sommant
le tout :
cij =

aik bkj

(2A-2)

Notons que si les matrices A et B sont conformes, ce nest pas ncessairement le cas pour les matrices B et A. De fait, le produit BA nest dfini que
si m = p. Et mme si A est de dimension m n et que B est de dimension
n m, les matrices rsultant des produits AB et BA sont respectivement
des matrices carres de dimension m m et n n. Ainsi, il est tout fait
vident que si m 6= n, alors AB 6= BA. Donc, la loi de composition interne
dfinissant le produit vectoriel nest globalement stable que ssi m = n = p.
Par consquent, lalgbre matriciel est donc un algbre de matrices carres 28 , ne sappliquant uniquement quaux espaces vectoriels Mn,n (K). Les
lments neutres additif et multiplicatif de cet algbre sont respectivement :

0Mn,n

0 0
.
..
.

=
. 0 .
0 0

et

1Mn,n

1 0
.
..
.

=
. 1 .
0 1

Nous conviendrons dcrire simplement 0 et I au lieu de 0Mn,n et 1Mn,n


et nous ferons rfrence ces matrices par les appellations respectives de
matrice nulle et de matrice identit. Notons que les coefficients de la matrice
identit peuvent tre identifis au delta de Kronecker ij et que pour toute
matrice carre A dordre n, AI = IA = A.
Lalgbre matriciel est associatif :
A(BC) = (AB)C

(2A-3)

De plus, la multiplication est distributive sur laddition et la multiplication scalaire commute avec la multiplication matricielle :

A(B + C) = AB + BC

(2A-4a)

C(A + B) = CA + CB

(2A-4b)

(A)(B) = ()AB

(2A-4c)

28. Une matrice carre de dimension n n est dite matrice carre dordre n.

2.A.2

Transposition et conjugaison de matrices

219

Un simple exemple suffit pour dmontrer que cet algbre nest pas commutatif :

 
 

0 1
1 0
0 0
=
1 0
0 0
1 0

 
 

1 0
0 1
0 1
=
0 0
1 0
0 0
Donc, en gnral :
AB 6= BA

(2A-5)

De plus, cet algbre admet des diviseurs de zro et le fait que AB = 0


nimplique pas ncessairement que A = 0 ou que B = 0. Par exemple :

 
 

0 0
0 0
1 0
=
0 0
0 1
0 0

2.A.2

Transposition et conjugaison de matrices

Parmi les oprations fondamentales que lon puisse effectuer sur les matrices, il y en a deux qui sont particulirement importantes, soient la transposition et la conjugaison.
La transpose dune matrice A, dnote AT sobtient en inversant les
lignes et les colonnes de A. Les lments de AT sont donns par :
aT
ij = aji
Par exemple :

a11 a12 a13


A = a21 a22 a23
a31 a32 a33

(2A-6)

a11 a21 a31


AT = a12 a22 a32
a13 a23 a33

Les identits suivantes peuvent tre aisment vrifies :


(A + B)T = AT + B T
(AT )T = A
T

(2A-7a)
(2A-7b)

(A) = A ,

(2A-7c)

(AB)T = B T AT

(2A-7d)

La dernire identit nous dit que la transpose dun produit de matrices


est le produit des matrices transposes pris dans lordre inverse.

220

Annexe 2A

La conjugue dune matrice A, dnote A sobtient en remplacant chacun


des lments de A par son conjugu complexe.
aij = (aij )
Un exemple :

1
2 3+i
i 2i
A= 8
3i 4
0

(2A-8)

1
2 3i
i
2i
A = 8
3+i 4
0

Il est tout fait vident que :


(A ) = A

(2A-9)

Il est clair que si B est la conjugue de A, alors A est aussi la conjugue


de B. De plus, une matrice A est une matrice coefficients rels ssi :
A = A

(2A-10)

Il est facile de dmontrer que les oprations de transposition et de conjugaison commutent, c.--d. que :
(AT ) = (A )T

(2A-11)

La transconjugaison est lopration qui consiste prendre successivement


la transposition et la conjugaison (ou indiffremment la conjugaison et la
transposition) dune matrice. Nous utiliserons le symbole pour dsigner
lopration de transconjugaison :
A = (AT )

(2A-12)

La matrice A est appele la matrice adjointe de A. En termes des lments de la matrice A, on a :

aij = (aT
ij ) = aji

(2A-13)

On vrifiera sans peine les identits suivantes :


(A ) = A

(2A-14a)

(A + B) = A + B
(AB) = B A

(2A-14b)
(2A-14c)

2.A.3

2.A.3

221

Matrices symtriques et antisymtriques

Matrices symtriques et antisymtriques

Dfinition 2A.1 Une matrice carre est dite symtrique si elle est gale
sa transpose :
A = AT
(2A-15)
En termes des lments de la matrice A, cel revient dire que :
aij = aji
Voici quelques exemples

1 0
0 2
0 0

(2A-16)

de matrices symtriques :

0
0 1 2
1 0 3i
0
,
3
2 3i 0

La matrice de gauche est un exemple de matrice diagonale, c.--d. une


matrice carre dont tous les lments aij = 0, i 6= j. Toutes les matrices
diagonales sont forcment symtriques.
Loppose dune matrice A est la matrice (-1)A, que lon dsigne simplement par A.
Dfinition 2A.2 Une matrice carre est dite antisymtrique si elle est
gale loppose de sa transpose :
A = AT

(2A-17)

ou encore, en terme des lments :


aij = aji

(2A-18)

Voici quelques exemples de matrices antisymtriques :

0
1 2
0
i
1 i
1 0
i
3
0
3i
,
2 3 0
1 + i 3i
0
Notons que tous les lments diagonaux dune matrice antisymtrique
sont ncessairement nuls. En effet, par 2A-18, on se doit davoir :
aii = aii
ce qui entrane ncessairement que aii = 0, i. Une matrice peut toutefois
avoir tous ses lments diagonaux nuls et tre symtrique, comme cest le
cas dans lexemple donn plus haut.

222

Annexe 2A

On dmontre facilement que toute matrice carre A se dcompose de


faon unique en une matrice symtrique et une matrice antisymtrique :
A

A + AT
2 }
| {z

matrice
symtrique

A AT
2 }
| {z

(2A-19)

matrice
antisymtrique

Par exemple :

6 4 8
6 4 4
0 0 4
4 2 0 = 4 2 3 + 0 0 3
0 6 2
4 3 2
4 3 0

2.A.4

Matrices hermitiennes et antihermitiennes

Dfinition 2A.3 Une matrice est dite hermitienne si elle est gale
sa matrice adjointe :
A = A
(2A-20)
Si
A = A

(2A-21)

on dira que la matrice est antihermitienne.


Toute matrice carre A sur le corps des complexes se dcompose de faon
unique en une matrice hermitienne et une matrice antihermitienne :
A

A + A
2 }
| {z

matrice
hermitienne

A A
2 }
| {z

(2A-22)

matrice
antihermitienne

En informatique quantique, les matrices hermitiennes occupent un rle


de tout premier plan.

2.A.5

Le dterminant

chaque matrice A, il est possible dassocier une grandeur scalaire


laide dune fonction appele dterminant, que nous dnoterons par det.
det : Mn,n (K) 7 K
Il est aussi dusage courant de dnoter le dterminant avec des barres
verticales :
|A| det(A)

2.A.5

223

Le dterminant

ou encore plus explicitement,

a11 a1n
.
..
.. a
A=
.
ij

an1 ann



a11 a1n


.
..
.

det(A) = . aij
.


an1 ann

Nous allons dabord poursuivre une approche pratico-pratique, de Laplace, qui nous permettra de calculer la valeur du dterminant de nimporte
quelle matrice carre. Pour cela, nous devons introduire les concepts de mineurs et de cofacteurs.
Le mineur Mij dune matrice carre A dordre n est le dterminant de la
sous-matrice dordre n 1 obtenue en liminant la fois la ime range et la
j me colonne de A. Par exemple :

6 4 8
A = 4 2 0 ,
0 6 2

M11



2 0
,
=
6 2

M22



6 8
,
=
0 2

M32



6 8

=
4 0

Le cofacteur Cij nest rien dautre que le mineur Mij affect dun signe
1 selon la formule :
Cij = (1)i+j Mij
(2A-23)
Le tableau suivant montre le
cofacteurs :

+



+

.
..

schma simple dalternance des signes des



+
+
+
.. ..
..
. .
.

Une matrice carre dordre 1 ne contient quun unique lment. Le dterminant dune telle matrice est donc gal la valeur de cet lment. Ainsi,
si A = (a11 ) alors |A| = a11 .
Pour obtenir la valeur des dterminants des matrices carres dordre suprieur 1, il convient dutiliser les formules de dveloppement de Laplace :

det(A) =

det(A) =

n
X
j=1
n
X
i=1

aij Cij

(2A-24a)

aij Cij

(2A-24b)

224

Annexe 2A

La formule 2A-24a propose un dveloppement selon la ime range et la


formule 2A-24b selon la j me colonne. Par exemple, soit la matrice dordre 2
suivante :


a11 a12
A=
a21 a22
Alors, les valeurs des diffrents cofacteurs de A sont :
C11 = +M11 = a22

C12 = M12 = a21

C21 = M21 = a12

C22 = +M22 = a11

Il y a quatre dveloppements possibles, soient


selon la 1re range : a11 C11 + a12 C12 = a11 a22 a12 a21
selon la 2me range : a21 C21 + a22 C22 = a21 a12 + a22 a11
selon la 1re colonne : a11 C11 + a21 C21 = a11 a22 a21 a12
selon la 2me colonne : a12 C12 + a22 C22 = a12 a21 + a22 a11
Dans tous les cas le rsultat obtenu est le mme, soit a11 a22 a12 a21 . Le
dterminant dune matrice carre dordre 2 est donc donn par :


a11 a12


(2A-25)
a21 a22 = a11 a22 a12 a21
Poursuivons maintenant avec une

a11
A = a21
a31

matrice dordre 3 :

a12 a13
a22 a23
a32 a33

Cette fois-ci, nous nous contenterons dun dveloppement de Laplace


suivant la 1re range :
|A| = a11 C11 + a12 C12 + a13 C13






a22 a23
a21 a23
a21 a22






+ a13
= a11
a12
a31 a33
a31 a32
a32 a33
= a11 [a22 a33 a23 a32 ] a12 [a21 a33 a23 a31 ] + a13 [a21 a32 a22 a31 ]
= a11 a22 a33 + a12 a23 a31 + a13 a21 a32 a11 a23 a32 a12 a21 a33 a13 a22 a31
Le dterminant dune matrice carre dordre 3 est donc donn par :
Le lecteur pourra vrifier par lui-mme que le mme rsultat est obtenu
quelle que soit la range ou la colonne que lon choisit pour effectuer un

2.A.5


a11

a21

a31

225

Le dterminant

a12
a22
a32


a13
a a a + a12 a23 a31 + a13 a21 a32
a23 = 11 22 33
a11 a23 a32 a12 a21 a33 a13 a22 a31
a33

(2A-26)

dveloppement de Laplace. Cette flexibilit savre trs utile dans la pratique


lorsquune ligne ou une colonne contient un ou plusieurs zros.
Ce serait un exercice strile que de chercher dvelopper les formules
du dterminant pour des matrices carres dordre suprieur 3. Ce quil
est important de faire ressortir, cest quen procdant par rcursion, il est
possible de calculer le dterminant de toute matrice carre, quel que soit son
ordre.
De fait, cest lorsquon tudie les formes multilinaires alternes que la
notion de dterminant prend toute sa signification. Si une telle tude dpasse
le cadre de ce texte, il demeure toutefois possible dextraire trois proprits
fondamentales du dterminant, adaptes ici au contexte matriciel.
Proprit 1 : Le dterminant de la matrice identit est gal 1.
Proprit 2 : Si on intervertit deux ranges (ou deux colonnes) dune
matrice, on change le signe du dterminant.
Proprit 3 : Le dterminant dune matrice carre est une fonction linaire de chacune de ses ranges (colonnes).
Pour fixer les ides, voici comment se traduisent les deux premires proprits dans le langage des matrices carres dordre 2.


1 0


0 1



a b


c d



c d


a b

(2A-27)



b a


d c

(2A-28)

Par exemple, si lon combine les proprits 1 et 2, on obtient immdiatement que :




0 1


1 0 = 1
La troisime proprit exprime le caractre multilinaire de la fonction
de dterminant. Il est plus instructif de dcomposer cette proprit en deux

226

Annexe 2A

parties. Par exemple, si lon se concentre sur la premire range, on obtient :




ma mb


c
d


a + e b + f


c
d

=
=



a b

m
c d


a b


c d +

(2A-29a)


e f


c d

(2A-29b)

Note. La proprit 2A-29b nimplique nullement que :


det(A + B) = det(A) + det(B)
Le lecteur pourra se


a + e b + f


c + g d + h =

(FAUX !)

convaincre plutt de lidentit suivante :










a b







+ e f + a b + e f
c d
g h
g h
c d

Les proprits supplmentaires suivantes dcoulent directement des trois


proprits fondamentales.
Proprit 4 : Si deux ranges (colonnes) dune matrice carre sont gales,
alors le dterminant est nul.
Proprit 5 : La valeur du dterminant demeure inchange si une range (colonne) on additionne un multiple quelconque dune autre range
(colonne).
Proprit 6 : Si tous les lments dune range (colonne) dune matrice
carre sont des zros, alors le dterminant est nul.
Proprit 7 : La valeur du dterminant dune matrice diagonale est gale
au produit des lments diagonaux.
Proprit 8 : Pour une matrice carre dordre n, on a :
det(mA) = mn det(A)

(2A-30)

Nous allons maintenant faire un retour en arrire et reformuler (2A-26)


laide du symbole de Levi-Civita, ijk , o les indices i, j et k peuvent chacuns
prendre les valeurs 1, 2, 3.

ijk

+1 si ijk est une permutation paire de 123


= 1 si ijk est une permutation impaire de 123

0 si deux indices quelconques prennent la mme valeur


(2A-31)

2.A.5

227

Le dterminant

Plus spcifiquement, on a :
123 = 231 = 312 = +1
132 = 213 = 321 = 1
et pour toutes les autres valeurs des indices, par exemple 112 , 232 , 333 , le
symbole de Levi-Civita vaut zro.
Lexamen minutieux de la formule (2A-26) rvle que le dterminant
dune matrice carre dordre 3 consiste en une somme de 3! = 6 termes,
o chaque terme rsulte dun produit dun lment de chaque range et
de chaque colonne. De plus, la moiti de ces termes sont affects dun signe
positif et la moiti dun signe ngatif. Le dterminant peut alors tre exprim
comme suit :
3 X
3 X
3
X
det(A) =
ijk a1i a2j a3k
(2A-32)
i=1 j=1 k=1

La formule 2A-32 se gnralise immdiatement aux matrices carres dordre


n:
n X
n
n
X
X
det(A) =
...
i1 i2 ...in a1i1 a2i2 . . . anin
(2A-33)
i1 =1 i2 =1

in =1

le symbole de Levi-Civita tant gnralis comme se doit n dimensions 29 :

+1 si i1 i2 . . . in est une permutation paire de 123. . .n


i1 i2 ...in = 1 si i1 i2 . . . in est une permutation impaire de 123. . .n

0 si deux indices quelconques prennent la mme valeur


(2A-34)
Ainsi, le dterminant dune matrice carre dordre n consiste en ralit
dune somme de nn termes, mais seulement n! de ces termes ne sont pas
forcment des zros. Chacun de ces n! termes est le rsultat du produit dun
lment tir de chaque range et de chaque colonne et la moiti de ces termes
sont affect dun signe positif et lautre moiti dun signe ngatif. Notons quil
devient prfrable de numroter les indices i1 , i2 , . . . , in pour ne pas risquer
dtre court de symboles.
La formule 2A-33 est trs utile pour dmontrer lune des plus importantes
proprits du dterminant, soit que le dterminant dun produit de deux matrices carres dordre n est gal au produit des dterminants. Mais dabord,
29. Suivant
P la notation dEintein, on convient dallger la notation en supprimant les
symboles
pour crire simplement det(A) = i1 i2 ...in a1i1 a2i2 . . . anin , la sommation tant
sous-entendue pour chacun des indices rpts. Nous ne ferons pas souvent usage de la
notation dEinstein dans ce texte.

228

Annexe 2A

il convient de dmontrer que le dterminant de la matrice transpose est gal


au dterminant de la matrice originale.
Proprit 9 :
det(AT ) = det(A)

(2A-35)

det(AB) = det(A) det(B)

(2A-36)

Proprit 10 :

Enfin, on dmontre que le dterminant de la matrice conjugue est gal


au conjugu complexe du dterminant.
Proprit 11 :

h
i
det(A ) = det(A)

(2A-37)

En combinant les proprits 9 et 11, on dmontre trivialement que le


dterminant de la matrice adjointe est gal au conjugu complexe du dterminant.
Proprit 12 :

h
i
det(A ) = det(A)

(2A-38)

Une matrice est dite singulire lorsque son dterminant est gal zro.
linverse, une matrice est non-singulire lorsque son dterminant est diffrent
de zro.
Le produit de deux matrices non-singulires donne aussi une matrice
non-singulire.

2.A.6

Linverse dune matrice

Une matrice A possde un inverse multiplicatif de gauche sil existe une


matrice B tel que BA = I. De faon similaire, une matrice A possde un
inverse multiplicatif de droite sil existe une matrice B tel que AB = I. Si
A est de dimension finie, linverse multiplicatif de gauche est toujours gal
linverse multiplicatif de droite 30 ; on dit alors que B est linverse de A et
on dnote B par A1 .
AA1 = A1 A = I
(2A-39)
Linverse dune matrice est unique. En effet, si lon a la fois AB = I et
CA = I, il dcoule immdiatement par lassociativit du produit matriciel
que (CA)B = C(AB) et donc que B = C.
30. Ceci nest pas ncessairement vrai lorsque la matrice (ou loprateur) est de dimension infinie.

2.A.6

229

Linverse dune matrice

En posant A = I dans 2A-39, on tire immdiatement que linverse dune


matrice identit est la matice identit puisque II 1 = I = I 1 = I.
Une condition ncessaire et suffisante pour quune matrice A soit inversible est quelle soit non-singulire, c.--d. que son dterminant soit diffrent
de zro.
En combinant les proprits 1 et 10 des matrices, on obtient :
det(AA1 ) = det(I)
det(A) det(A1 ) = 1
et, par consquent :
det(A1 ) =

1
det(A)

(2A-40)

Ainsi, le dterminant de la matrice inverse est donc linverse multiplicatif du


dterminant de la matrice originale, et vice-versa.
Une matrice diagonale est singulire si lun de ses lments diagonaux
est nul (proprit 7). Linverse dune matrice diagonale non-singulire est
aussi une matrice diagonale dont les lments diagonaux sont les inverses
multiplicatifs de chacun des lments diagonaux de la matrice originale.
Voici quelques proprits additionnelles des matrices inversibles :
(A1 )1 = A

(2A-41a)

(AB)1 = B 1 A1
T 1

(A )

= (A

(2A-41b)

1 T

(2A-41c)

Il existe une formule gnrale permettant de trouver linverse de toute


matrice non-singulire :
1
A1 =
CT
(2A-42)
det(A)
o C est ici la comatrice, ou encore la matrice des cofacteurs, c.--d. la
matrice dont chacun des lments Cij est donn par 2A-23. titre dexemple,
prenons la matrice carre dordre 2 :


a b
A=
,
c d


alors

C=


d c
b a

230

Annexe 2A

On trouve alors pour la matrice inverse :



T
1
d c
1
A =
det(A) b a
=

1
ad bc

d

d b

= ad bc
c
c a
ad bc

b
ad bc
a
ad bc

Dfinition 2A.4 Une matrice orthogonale Mn,n (R) est une matrice
carre sur le corps des rels qui est inversible et dont linverse est gal sa
transpose :
A1 = AT
(2A-43)
Le dterminant dune matrice orthogonale est gal 1. En effet :
det(AA1 ) = det(AAT ) = det(I)
det(A) det(AT ) = det(A) det(A) = 1

(prop. 9, 10)

det(A)2 = 1
et, par consquent, det(A) = 1.
Dfinition 2A.5 Une matrice unitaire Mn,n (C) est une matrice carre
sur le corps des complexes qui est inversible et dont linverse est gal son
adjointe :
A1 = A
(2A-44)
Si A et B sont deux matrices unitaires de mme ordre, alors leur produit
donne aussi une matrice unitaire.
(AB)1 = B 1 A1 = B A = (B )T (A )T
= [(A )(B )]T = [(AB) ]T = (AB)
Le dterminant dune matrice unitaire est un nombre complexe dont le
module est gal 1. En effet :
|AA1 | = |AA | = |I|
|A| |A | = 1

|A| |A| = 1

(prop. 1, 10)
(prop. 12)

Si lonpose |A| = z, alors on a zz = 1. Extrayant la racine carre, on obtient


|z| = zz = 1. Ainsi, z est un point situ sur le cercle unitaire dans le plan

2.A.7

231

Trace et rang dune matrice

dArgand. Si lon exprime z sous sa forme exponentielle, on a z = ei pour


un rel quelconque et il est facile de constater que |z| = 1
Les matrices orthogonales sont un cas particulier des matrices unitaires
puisque pour une matrice orthogonale sur le corps des rels on a toujours
A = A et A1 = AT . Dans le plan dArgand, lintersection du cercle unitaire
avec laxe des rels consiste en deux points, +1 et 1, qui sont les deux seules
valeurs admissibles pour le dterminant dune matrice orthogonale.
Les matrices unitaires jouent un rle de premier plan en informatique
quantique.

2.A.7

Trace et rang dune matrice

La trace dune matrice carre A dordre n, dnote Tr(A), est la somme


de ses lments diagonaux :
Tr(A) =

n
X

aii

(2A-45)

i=1

La trace est une forme linaire dont voici les proprits principales :
Tr(A + B) = Tr(A) + Tr(B)

(2A-46a)

Tr(A) = Tr(A)

(2A-46b)

Tr(AT ) = Tr(A)

(2A-46c)

Tr(AB) = Tr(BA)

(2A-46d)

Les deux premires identits expriment simplement la linarit de la trace.


Puisque les lments diagonaux demeurent invariants sous une opration de
transposition, la troisime identit simpose delle-mme. Enfin, la dernire
identit se dmontre comme suit :
 X

n X
n
n X
n
X
aik bki =
bki aik
i=1 k=1

k=1 i=1

Le rang dune matrice carre non-nulle A dordre n, dnot rang(A),


est dfini comme lordre de la plus grande sous-matrice carre de A dont le
dterminant est diffrent de zro. Le rang de toute matrice nulle est 0 et le
rang de toute matrice non-nulle est toujours compris entre 1 et n.
Une matrice carre A dordre n est inversible ssi son rang est gal n.
La proprit 9 des dterminants nous certifie que le rang dune matrice
est gal celui de sa transpose.

232

Annexe 2A

Bien que la dfinition donne ci-dessus soit pertinente dans le cadre de


lalgbre matriciel Mn,n (K), elle demeure peu pratique et lon obtient une
bien meilleure comprhension de la notion de rang si lon se situe plutt dans
le cadre de lespace vectoriel Mn,1 (K), de dimension n. Pour cela, il convient
dintroduire le concept de vecteur-colonne et de considrer la matrice carre
dordre n

a11 a1n
.
..
.. a
A=
.
ij

an1 ann
comme la juxtaposition de n vecteurs-colonnes appartenant Mn,1 (K) :

a11
a12
a1j
a1n


| 1 i = ... , | 2 i = ... , . . . , | j i = ... , . . . , | n i = ...


an1
an2
anj
ann

Le rang de la matrice A peut alors tre interprt comme la dimension du


sous-espace engendr par les n vecteurs-colonnes | 1 i, . . . , | n i, gale au
nombre maximum de vecteurs indpendants.
Ainsi, dire que A est inversible ssi son rang est gal n revient dire
que A est inversible ssi les n vecteurs | 1 i, . . . , | n i sont linairement indpendants, c.--d. que sils engendrent lespace Mn,1 (K).

2.A.8

quation caractristique dune matrice

Lquation caractristique dune matrice est intimement lie aux notions


de vecteurs propres et de valeurs propres, indispensables en mcanique quantique. Il convient dintroduire brivement ces notions ici car elles jettent de
la lumire sur la provenance de lquation caractristique.
Le produit dune matrice nn et dun vecteur-colonne n1 donne encore
un vecteur-colonne n 1. En toute gnralit on peut crire :
A | 1 i = | 2 i
o lon interprte que la matrice A opre sur le vecteur | 1 i pour donner
le vecteur | 2 i.
Nous sommes particulirement intresss au cas o le vecteur | 2 i est
une combinaison linaire de | 1 i, ce que nous exprimons par :
A | 1 i = | 1 i

(2A-47)

2.A.8

quation caractristique dune matrice

233

Cette dernire quation est appele quation aux valeurs propres. Les vecteurs
non-nuls | 1 i qui satisfont lquation sont appels vecteurs propres et les
scalaires correspondants sont appels valeurs propres. Notons que si une
valeur propre peut avoir la valeur zro, ce nest jamais le cas pour un vecteur
propre. La faon correcte dinterprter lquation 2A-47 est de dire que le
sous-espace vectoriel engendr par le vecteur | 1 i demeure invariant sous
laction de A.
On peut manipuler lquation 2A-47 lgrement pour obtenir dabord
A | 1 i I | 1 i = 0 et ensuite factoriser le vecteur propre :
(A I) | 1 i = 0

(2A-48)

Supposons un instant que la matrice (A I) de dimension n n soit inversible. Alors limplication suivante est invitable :
(A I)1 (A I) | 1 i = (A I)1 0 = | 1 i = 0
Or un vecteur propre ne peut tre nul. Cest dire que la matrice (A I)
se doit dtre non-inversible ou singulire. Par consquent, son dterminant
doit tre nul :
|(A I)| = 0
(2A-49a)
Cette dernire quation est lquation caractristique de la matrice A qui
scrit de faon plus explicite :


a11
a12

a1n

a21
a22
a2n

(2A-49b)
..
=0
..
..
..
.

.
.
.


an1
an2
ann
Ce dterminant est en fait un polynme de degr n en appel polynme
caractristique, que dnoterons par Pn (). Ainsi, les valeurs propres de A
sont les racines de Pn (). Par le thorme fondamental de lalgbre, on sait
quil existe exactement n racines complexes de lquation Pn () = 0. Notons
que ces racines ne sont pas ncessairement toutes distinctes. Lensemble de
toutes les valeurs propre {i } de A sappelle le spectre de A. Sil existe une ou
plusieurs racines multiples de lquation caractristique, on dit que le spectre
est dgnr.
On peut facilement trouver les quations caractristiques des matrices
dordre 2 et 3. Pour lordre 2, lquation caractristique est :


a
b

=0
c
d

234

Annexe 2A

et le polynme caractristique est :


P2 () = 2 (a + d) + (ad bc) = 0
et pour lordre 3, lquation caractristique est :


a
b
c

d
e
f = 0

g
h
i
et le polynme caractristique est :
P3 () = 3 (a + e + i)2 + (ae + ai + ei bd cg f h)
(aei + bf g + cdh af h bdi ceg) = 0
Le lecteur attentif aura remarqu que, dans les deux cas et un signe
prs, le coefficient du terme en n1 est gal Tr(A) et que le coefficient
du terme en 0 (le terme constant) est gal det(A). Cette constatation se
gnralise pour les polynmes caractristiques dordre suprieur.
La multiplicit algbrique dune valeur propre i , dnote A (i ) est sa
multiplicit en tant que zro de Pn (). Ainsi, si i possde une multiplicit
algbrique dordre k, on peut toujours crire :
Pn () = ( i )k Pnk ()
o 1 6 k 6 n et Pnk () est un polynme de degr n k en .
Ainsi, une valeur propre i est dgnre si sa multiplicit algbrique est
plus grande que un.
Sil nexiste pas dambigut sur les valeurs propres, on ne peut pas en
dire autant en ce qui concerne les vecteurs propres. Cela tient du fait que
tout multiple dun vecteur propre est aussi vecteur propre. Par exemple, si
| i est un vecteur propre correspondant la valeur propre , alors tout
vecteur | i, 6= 0 est aussi un vecteur propre correspondant cette mme
valeur propre :
A [| i] = [A | i] = [ | i] = [ | i]
On peut rduire cette ambigut en imposant une condition additionnelle sur
le vecteur | i, par exemple que ce dernier soit unitaire :
k|ik = 1

2.A.8

quation caractristique dune matrice

235

mais mme malgr cel, une certaine ambigut persiste toujours 31 .


Lambigut est encore plus forte lorsque la valeur propre est dgnre
car il se peut que plusieurs vecteurs propres indpendants lui soient associs.
Prenons par exemple un cas simple, soit celui de la matrice diagonale
suivante :

1 0 0
A = 0 3 0
0 0 3
Alors lquation caractristique est (1 )(3 )2 = 0 et les valeurs propres
sont 1 (A (1) = 1) et 3 (A (3) = 2). la valeur propre 3, on peut associer
les deux vecteurs-colonnes suivants :


0
0
| 1 i = 1 ,
| 2 i = 0
0
1
car on vrifie immdiatement que A | 1 i = 3 | 1 i et A | 2 i = 3 | 2 i.
Lorsque plusieurs vecteurs propres sont associs une mme valeur propre,
toute combinaison linaire de ces vecteurs propres est aussi un vecteur propre.
A [ | 1 i + | 2 i] = A [ | 1 i] + A [ | 2 i] = [A | 1 i] + [A | 2 i]
= [ | 1 i] + [ | 2 i] = [ | 1 i] + [ | 2 i]
= [ | 1 i + | 2 i]
Dans notre exemple on pourra vrifier que le vecteur :

0
| 3 i = 2 | 1 i + 5| 2 i = 2
5
est aussi vecteur propre associ la valeur propre dgnre 3 de la matrice
A.
Cest une des raisons pour lesquelles les physiciens sont moins intresss
par les vecteurs propres eux-mmes que par les sous-espaces vectoriels engendrs par ces mmes vecteurs propres. Et cest ce qui conduit la notion
de multiplicit gomtrique.
La multiplicit gomtrique dune valeur propre i , dnote G (i ), est la
dimension du sous-espace vectoriel engendr par les vecteurs propres qui lui
sont associs. On pourrait tre tent croire que la multiplicit algbrique
31. Les implications pour la thorie de la mcanique quantique sont discutes la section
TBD.

236

Annexe 2A

concide toujours avec la multiplicit gomtrique, mais ce nest pas ncessairement toujours le cas. De fait, la multiplicit gomtrique dune valeur
propre i est toujours plus petite ou gale sa multiplicit algbrique :
1 6 G (i ) 6 A (i )

(2A-50)

La formule qui donne correctement la multiplicit gomtrique dune valeur


propre i est :
G (i ) = n rang(A i I)
(2A-51)
o n est lordre de la matrice carre A.
Prenons un exemple simple. Soit la matrice :


1 1
A=
0 1
Lordre de la matrice A est n = 2, lquation caractristique est (1 )2 = 0
et il nexiste quune valeur propre dgnre 1, avec A (1) = 2. Recherchons
les vecteurs propres associs cette valeur propre. Si lon pose :
 
  

a
a
1 1
=1
b
b
0 1
on obtient le systme dquations suivant :
a+b=a
b=b
ce systme nest consistant que ssi b = 0 et, par consquent, il ne peut
exister quun seul vecteur propre | i associ la valeur propre dgnre 1,
par exemple :
 
1
|i =
0
Dans ce cas particulier on a G (1) = 1 6= A (1) = 2. On obtient le mme
rsultat si lon fait usage de la formule 2A-51 car


0 1
rang(A 1 I) = rang
=1
0 0
Quant lavenir nous parlerons de la multiplicit dune valeur propre,
nous sous-entendrons toujours sa multiplicit gomtrique.
Maintenant que cette distinction est bien tablie, nous pouvons anticiper
la bonne nouvelle : dans le cas des matrices normales (voir section 2.A.11),

2.A.9

237

Matrices semblables

la multiplicit algbrique et la multiplicit gomtrique sont toujours identiques.


Lvaluation des zros du polynme caractristique prsente certaines
difficults sur le plan pratique. Le calcul dun dterminant dune matrice
carre dordre n requiert lvaluation de n! composantes, ce qui peut devenir
excessif si n est grand. Aussi, pour n > 5, le calcul des zros est intraitable
dun point de vue algbrique. On doit ncessairement avoir recours des
mthodes numriques.
Mentionnons enfin, par souci de compltude, un des thormes les plus
intressants de la thorie des matrices, le thorme de Cayley-Hamilton.
Thorme 2A.1 (Cayley-Hamilton) Toute matrice carre A dordre n
satisfait sa propre quation caractristique :
|A I| = 0
Plus prcisment, si lon remplace par la matrice A dans le polynme
caractristique Pn ()
Pn () = n + cn1 n1 + cn2 n2 + + c1 + c0 = 0
et que Ak reprsente la matrice A multiplie k fois par elle-mme, alors on
obtient la matrice nulle.
Pn (A) = An + cn1 An1 + cn2 An2 + + c1 A + c0 I = 0

2.A.9

Matrices semblables

Dfinition 2A.6 Deux matrices A et B sont dites semblables ou similaires sil existe une matrice inversible P telle que :
B = P 1 A P
La similitude est une relation dquivalence.
Il est facile de dmontrer que deux matrices semblables ont les mmes
valeurs de dterminant et de trace :
det(B) = det(P 1 A P ) = det(P 1 ) det(A) det(P )
1
=
det(A) det(P ) = det(A)
det(P )
Tr(B) = Tr(P 1 A P ) = Tr(P P 1 A) = Tr(I A) = Tr(A)

(par 2A-46d)

238

Annexe 2A

De fait, deux matrices semblables ont la mme quation caractristique


puisque :
|B I| = |P 1 A P I| = |P 1 A P P 1 I P | = |P 1 (A I) P |
= |A I|
Il est donc tout fait logique que la trace et le dterminant soit des invariants dune relation de similitude entre matrices puisquelles partagent
le mme polynme caractristique, et par dfaut, les mmes coefficients des
termes en n1 et en 0 . Une autre consquence directe est que deux matrices
semblables partagent les mmes valeurs propres.
Notons que deux matrices peuvent avoir la mme quation caractristique
sans ncessairement tre semblables. Par exemple, les matrices




1 1
1 0
, B=
A=
0 1
0 1
ont la mme quation caractristique, les mmes valeurs propres et les mmes
valeurs de dterminant et de trace, mais pour toute matrice non-singulire
P dordre 2, on a P 1 AP = I et B 6= I.
En rsum, la liste des invariants de similitude inclut la trace, le dterminant, le rang, les valeurs propres et le polynme caractristique. Notez
cependant que les matrices semblables ne partagent pas ncessairement les
mmes vecteurs propres (voir le problme 2.4).

2.A.10

Matrices diagonisables

Dfinition 2A.7 Une matrice A est diagonisable sil existe une matrice
inversible P telle que la matrice semblable D = P 1 A P est une matrice
diagonale.
Puisque A et D sont semblables, elles partagent la mme quation caractristique. Un des avantages dune matrice diagonale est quil est trivial
dobtenir son quation caractristique puisque :


d11

0

0


0
d22
0

..
=0
..
..
..
.

.
.
.


0
0
dnn
donne immdiatement
(d11 )(d22 ) . . . (dnn ) = 0

2.A.10

239

Matrices diagonisables

et lon constate de visu que les valeurs propres dune matrice diagonale sidentifient avec les lments diagonaux. La trace et le dterminant dune matrice
diagonale sobtiennent respectivement en prenant la somme et le produit de
leurs valeurs propres (compte tenu de la multiplicit algbrique). Si le spectre
dune matrice diagonale contient la valeur zro, alors le dterminant est nul.
Les rsultats obtenus au dernier paragraphe se gnralisent toute matrice carre dordre n, quelle soit diagonale ou non. Ainsi, si le spectre de A
est {i }, alors :
Tr(A) =

A (i ) i

(2A-52a)

A (i )

(2A-52b)

det(A) =

Thorme 2A.2 Une matrice carre A dordre n est diagonisable ssi


les n vecteurs-colonnes de A sont linairement indpendants. Dans un tel
cas, A est semblable une matrice diagonale D :
D = P 1 A P
Les lments diagonaux de D sont les valeurs propres de A et les vecteurscolonnes de la matrice inversible P sont les vecteurs propres correspondants.
Corollaire 2A.3 Une matrice carre A dordre n est diagonisable ssi
la multiplicit algbrique de chacune de ses valeurs propres est gale la
multiplicit gomtrique correspondante.
Si la matrice P est orthogonale, on dit que A est orthogonalement diagonalisable. Dans ce cas particulier, on a :
D = PT AP
Si la matrice P est unitaire, on dit que A est unitairement diagonalisable.
Dans ce cas particulier, on a :
D = P AP
Si la matrice A est dj sous forme diagonale, A = D, nous pouvons
crire trivialement :
D = P 1 D P

P 1 = P = I

240

Annexe 2A

Daprs le thorme prcdent, les vecteurs-colonnes de I sont les vecteurs


propres correspondant aux valeurs propres de D. Ces vecteurs forment une
base canonique de lespace vectoriel Mn,1 (K)



0
0
1
0
1
0



| 1 i = . , | 2 i = . , . . . , | n i = .
.
.
..
.
.
1
0
0
Il existe beaucoup de matrices qui ne soient pas diagonalisables. La matrice


1 1
B=
0 1
introduite la section prcdente est un tel exemple dune matrice nondiagonalisable. En revanche, on peut se demander sil existe des matrices qui
le soient toujours. La rponse complte est donne la section subsquente.
En attendant, le thorme suivant apporte une rponse partielle.
Thorme 2A.4 Toute matrice valeurs propres distinctes est diagonalisable.
Une des tches les plus courantes en mcanique quantique consiste
trouver les valeurs propres et les vecteurs propres des oprateurs reprsents
par des matrices hermitiennes.

2.A.11

Matrices normales

Dfinition 2A.8 Une matrice A est dite normale si elle commute avec
son adjointe :
A A = AA
Parmi les matrices normales, on retrouve entre autres :
les matrices diagonales
les matrices relles symtriques
les matrices relles antisymtriques
les matrices orthogonales
les matrices hermitiennes
les matrices antihermitiennes
les matrices unitaires
Mais cette liste nest pas exhaustive. Par exemple la matrice :

1 0 i
A = i 1 0
0 1 1

2.A.11

241

Matrices normales

est une matrice normale bien quelle ne


1 0 i
1 i 0
1 i
i 1 0 0 1 1 = 0 1
0 1 1
i 0 1
i 0

figure pas sur la liste. En effet,

0
1 0 i
2 i i
1 i 1 0 = i 2
1
1
0 1 1
i 1
2

Donc, AA = A A et A est bien une matrice normale.


Il existe une recette simple pour obtenir, sinon deux, du moins une matrice normale partir dune matrice A quelconque. En effet, les produits
AA et A A engendrent des matrices hermitiennes :
(AA ) = (A ) A = (AA )
(A A) = A (A ) = (A A)

(par 2A-14a et 2A-14c)

qui sont normales par dfaut.


Le thorme suivant est de toute premire importance en mcanique et
en informatique quantique :
Thorme 2A.5 Toute matrice normale A est unitairement diagonalisable :
D = U AU
D est une matrice diagonale et U une matrice unitaire.
En gnral, ni la somme ni le produit de deux matrices normales ne
rsulte en une matrice normale.

242

Bibliographie
[1] Ahlfors, Lars. Complex Analysis. McGraw-Hill, 3me dition, 1979.
[2] Bourbaki, N. Topologie gnrale, chapitres 1-4. Springer-Verlag Berlin
et Heidelberg GmbH & Co. K, rimpression inchange de ldition 1971,
2006.
[3] Cohen-Tannoudji C., Diu B. et Lalo F. Mcanique quantique, Tome I.
Hermann, 1997.
[4] Dirac, P.A.M. The Principles of Quantum Mechanics. Oxford University
Press, 4me. dition, 1958.
[5] Gelfand, I.M. et Vilenkin, N.Ya. Les distributions, Vol 4 - Applications
de lanalyse harmonique. Dunod, Paris, 1967.
[6] Gieres, Franois. Formalisme de Dirac et surprises en mcanique quantique. http: // arxiv. org/ abs/ quant-ph/ 9907070 , 1999.
[7] Heisenberg, Werner. ber quantentheoretische umdeutung kinematischer und mechanischer beziehungen. Zeitschrift fr Physik, 33 :879
893, Sept. 1925.
[8] Madrid, Rafael de la. Quantum Mechanics in Rigged Hilbert Space language. Thse de doctorat, Universit de Valladolid, 2001.
[9] Madrid, Rafael de la. The role of the Rigged Hilbert Space in Quantum
Mechanics. http: // arxiv. org/ abs/ quant-ph/ 0502053 , 2005.
[10] Morin, Edgar. Introduction la pense complexe. ditions du Seuil,
nouvelle dition, 2005.
[11] Needham, Tristan. Visual Complex Analysis. Clarendon Press, 1997.
[12] von Neumann, Johann. Mathematische Grundlagen der Quantenmechanik. Berlin, Springer, 1932.
[13] Penrose, Roger. The Road to Reality - A complete guide to the laws of
the universe. Vintage Books, 2006.

244

BIBLIOGRAPHIE

[14] Schrdinger, Erwin. Quantisierung als eigenwertproblem (Erste mitteilung.). Annalen der Physik, 79 :361376, 1926.
[15] Schrdinger, Erwin.
Uber das verhaeltnis der Heisenberg-BornJordanschen quantenmechanik zu der meinen. Annalen der Physik,
79 :489527, 1926.
[16] Schwartz, Laurent. Thorie des distributions. Hermann, nouveau tirage,
1997.

Index
adhrence, 32, 4647, 112
dans un espace mtrique, 31
algorithme de Gram-Schmidt,
42, 5355
application, 7
bijection, 8
injection, 8
surjection, 8
application linaire, 9, 134
image, 134
inversible, 146
non-singulire, 136
noyau, 134
nullit, 135
rang, 135
base dun espace vectoriel, 6
base hilbertienne, 46, 5557
boule ouverte, 23, 24, 26
combinaison linaire, 4, 44
commutateur, 163
compacit, 119
locale, 124
relative, 129
continuit, 105, 106, 108
en un point, 107
squentielle, 111
covecteur, 12, 66, 209
dcomposition polaire, 197

dcomposition spectrale, 191, 192


delta de Kronecker, 13
dterminant, 222, 223227
dimension, 6
quation caractristique, 233
quivalence topologique,
voir homomorphisme
quation aux valeurs propres, 159
espace de Haussdorff,
3536, 114
espace de Hilbert, 38
L2 , 61
l2 , 57
complet, 47
pr-hilbertien, 17
espace du qubit, 25
espace dual, 11
algbrique, 12
topologique, 40
espace linaire, voir espace
vectoriel
espace mtrique, 22
complet, 33
de Hausdorff, 36
prcompact, 129
sparable, 37
topologie usuelle, 2629
espace topologique, 97
sparable, 118

246
espace vectoriel, 78
complexe, 3
de fonctions, 4
norm, 19
espace de Banach, 38
rel, 3
sous-espace, 4
espace dtat, 65, 133
ferm, 98
forme linaire, 9
homomorphisme, 109
identit de Parseval, 43
ingalit de Bessel, 46, 52
ingalit de Cauchy-Schwartz,
17, 20
indpendance linaire, 5
isomorphisme, 9
isomtrique, 34
mtrique, 22
euclidienne, 23
hermitienne, 24
triviale, 22
matrice, 217
adjointe, 220
conjugue, 220
des cofacteurs, 229
diagonalisable, 240
hermitienne, 222
inversible, 229
normale, 240
orthogonale, 230
rang, 231
semblable, 237
singulire, 228
symtrique, 221
trace, 231
transpose, 219

INDEX
unitaire, 230
norme, 18
quivalente, 21
euclidienne, 20
hermitienne, 20
uniforme, 21, 60
notation de Dirac,
bra, 66
ket, 66
produit scalaire, 66
oprateur adjoint, 152, 206
oprateur linaire, 147
auto-adjoint, 206
hermitien, 172
identit, 167
normal, 183
positif, 175
spectre, 159
trace, 162
unitaire, 177
ouvert, 97
produit scalaire, 13
canonique sur Cn , 17
canonique sur Rn , 15
euclidien, 14
hermitien, 16
reprsentation, 146
propre, 186
suite convergente, 110
dans lespace L2 , 62
dans un espace de Hausdorff, 114
dans un espace mtrique, 30, 31,
36
dans un espace topologique, 110
dans un espace vectoriel norm,
38

INDEX
suite de Cauchy, 33
thorme de Heine-Borel, 120
thorme de Cayley-Hamilton, 237
thorme du rang, 135
thorme de Riesz, 205
topologie, 97
base topologique, 26, 102
discrte, 98, 117
grossire, 98, 111
induite, 104
plus (moins) fine, 100
triplet de Gelfand, 69
RHS, 69
valeur propre, 159
multiplicit algbrique, 160
multiplicit gomtrique, 160, 235
vecteur, 78
dtat, 65
de coordonnes, 10
orthogonal, 14
position, 23
unitaire, 19
vecteur propre, 159
voisinage dun point, 99

247

248

INDEX

You might also like