You are on page 1of 258

Automatique

Dynamique et contrle des systmes


Nicolas Petit Pierre Rouchon
MINES ParisTech
CAS - Centre Automatique et Systmes
Unit Mathmatiques et Systmes
1
Avant propos : un bref rappel de lhistoire de lAutomatique Les
mcanismes de rgulation et dadaptation, largement rpandus dans la na-
ture, sont aussi la base du fonctionnement des systmes crs et utiliss
par lhomme. Depuis trs longtemps, on les retrouve dans diverses machines
et inventions. Avec la rvolution industrielle et le rgulateur de Watt, on a
vu apparatre les premires formalisations modernes : modlisation (avec les
quations direntielles inventes par Newton) et stabilit. Le point de d-
part de la thorie mathmatique des systmes remonte ainsi aux travaux du
mathmaticien et astronome anglais G. Airy. Il fut le premier tenter une
analyse du rgulateur de Watt. Ce nest quen 1868, que le physicien cos-
sais J. C. Maxwell publia une premire analyse mathmatique convaincante
et expliqua certains comportements erratiques observs parmi les nombreux
rgulateurs en service cet poque. Ses travaux furent le point de dpart de
nombreux autres sur la stabilit, notion marque par le travail de H. Poincar
et A. M. Lyapounov, sa caractrisation ayant t obtenue indpendamment
par les mathmaticiens A. Hurwitz et E. J. Routh. Durant les annes 1930,
les recherches aux Bell Telephone Laboratories sur les amplicateurs ont
t lorigine de notions encore enseignes aujourdhui. Citons par exemple
les travaux de Nyquist et de Bode caractrisant partir de la rponse fr-
quentielle en boucle ouverte celle de la boucle ferme.
Tous ces dveloppements ont vu le jour dans le cadre des systmes li-
naires ayant une seule commande et une seule sortie. On disposait dune
mesure sous la forme dun signal lectrique. Cette dernire tait alors en-
tre dans un amplicateur qui restituait en sortie un autre signal lectrique
quon utilisait comme signal de contrle. Ce nest quaprs les annes 1950
que les dveloppements thoriques et technologiques (avec linvention des cal-
culateurs numriques) permirent le traitement des systmes multi-variables
linaires et non linaires ayant plusieurs entres et plusieurs sorties. Citons
comme contributions importantes dans les annes 1960 celles de R. Bellmann
avec la programmation dynamique, celles de R. Kalman avec la commanda-
bilit, le ltrage et la commande linaire quadratique ; celles de L. Pontryagin
avec la commande optimale. Ces contributions continuent encore aujourdhui
alimenter les recherches en thorie des systmes. Le champ dapplication
sest considrablement tendu. Alors quaujourdhui lAutomatique est omni-
prsente dans les domaines industriels tels que laronautique, larospatiale,
lautomobile, ou le gnie des procds, certaines recherches actuelles sap-
puyant sur des notions cls prsentes dans ce cours concernent la construc-
tion dun premier calculateur quantique.
2
Objectif de ce cours Le but est de prsenter les notions et outils fon-
damentaux ncessaires lanalyse et au contrle des systmes. Ce cours est
articul autour des trois thmes suivants :
Systmes dynamiques : stabilit, robustesse, thorie de perturbations.
Commandabilit : stabilisation par bouclage, planication et suivi de
trajectoire.
Observabilit : estimation, observateur asymptotique, ltrage et diag-
nostic.
Le cours part de quelques exemples issus du monde industriel ou acad-
mique. Chaque exemple motive et justie les dnitions et rsultats abstraits
sur lesquels reposent une classe dalgorithmes de contrle et/ou destimation.
Dans bien des domaines scientiques, une thorie a trs souvent pour origine
une petite collection dexemples reprsentatifs bien compris et analyss. Nous
nous inscrivons dans cette dmarche. Une approche qui part du particulier
pour aller vers le gnral permet aussi de mieux comprendre les ressorts fon-
damentaux sur lesquels reposent certains rsultats mais aussi de bien cerner
leur limitations. LAutomatique est un domaine actif de recherche scienti-
que. Le cours abordera certaines questions qui nadmettent pas de rponse
claire aujourdhui bien quelles aient de fortes motivations pratiques.
Note de cette dition Nous vous serions reconnaissants de nous faire part
de vos critiques et des erreurs que vous auriez dcouvertes par un message
explicatif
nicolas.petit@mines-paristech.fr ou
pierre.rouchon@mines-paristech.fr
en identiant votre message par Poly Mines corrections.
Nicolas Petit et Pierre Rouchon
Fvrier 2012
Table des matires
1 Systmes dynamiques et rgulateurs 7
1.1 Systmes dynamiques non linaires . . . . . . . . . . . . . . . 7
1.1.1 Existence et unicit des solutions . . . . . . . . . . . . 11
1.1.2 Sensibilit et premire variation . . . . . . . . . . . . . 14
1.1.3 Stabilit locale autour dun quilibre . . . . . . . . . . 15
1.2 Systmes dynamiques linaires . . . . . . . . . . . . . . . . . . 18
1.2.1 Lexponentielle dune matrice . . . . . . . . . . . . . . 18
1.2.2 Forme de Jordan et calcul de lexponentielle . . . . . . 19
1.2.3 Portraits de phases des systmes linaires . . . . . . . . 22
1.2.4 Polynme caractristique . . . . . . . . . . . . . . . . . 23
1.2.5 Systmes linaires instationnaires . . . . . . . . . . . . 27
1.2.6 Complments : matrices symtriques et quation de
Lyapounov . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.3 Stabilit des systmes non linaires . . . . . . . . . . . . . . . 30
1.3.1 tude au premier ordre . . . . . . . . . . . . . . . . . . 30
1.3.2 Fonctions de Lyapounov . . . . . . . . . . . . . . . . . 32
1.3.3 Robustesse paramtrique . . . . . . . . . . . . . . . . . 37
1.3.4 Complments : caractre intrinsque des valeurs propres
du systme linaris tangent . . . . . . . . . . . . . . . 38
1.3.5 Complments : les systmes dynamiques dans le plan . 39
1.4 Systmes multi-chelles lents/rapides . . . . . . . . . . . . . . 45
1.4.1 Perturbations singulires . . . . . . . . . . . . . . . . . 47
1.4.2 Feedback sur un systme deux chelles de temps . . . 52
1.4.3 Modle de contrle et modle de simulation . . . . . . 53
1.5 Cas dtude . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
1.5.1 Prsentation du systme . . . . . . . . . . . . . . . . . 56
1.5.2 Un rgulateur PI . . . . . . . . . . . . . . . . . . . . . 57
1.5.3 Une modlisation simplie . . . . . . . . . . . . . . . 59
1.5.4 Passage en temps continu . . . . . . . . . . . . . . . . 60
1.5.5 Simulations en boucle ouverte et en boucle ferme . . . 61
3
4 TABLE DES MATIRES
1.5.6 Un rsultat gnral : rgulateur PI sur un systme non
linaire du premier ordre . . . . . . . . . . . . . . . . . 63
1.5.7 Dynamiques ngliges : rle du contrle dans lapproxi-
mation . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
1.5.8 Intrt de la pr-compensation (feedforward) . . . . . . 70
1.5.9 Pr-compensation et suivi de trajectoires sur un sys-
tme linaire du premier ordre . . . . . . . . . . . . . . 72
1.6 Cas dtude . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
2 Fonctions de transfert 79
2.1 Passage la fonction de transfert . . . . . . . . . . . . . . . . 80
2.1.1 Questions de robustesse . . . . . . . . . . . . . . . . . 80
2.1.2 Principe des calculs . . . . . . . . . . . . . . . . . . . . 81
2.1.3 Rgime asymptotique forc . . . . . . . . . . . . . . . . 83
2.1.4 Simplications ples-zros . . . . . . . . . . . . . . . . 84
2.1.5 Formalisme . . . . . . . . . . . . . . . . . . . . . . . . 85
2.1.6 Du transfert vers ltat : ralisation . . . . . . . . . . . 87
2.2 Schmas blocs et fonctions de transfert . . . . . . . . . . . . . 90
2.2.1 De la forme dtat vers le transfert . . . . . . . . . . . 90
2.2.2 Transfert avec perturbation et bouclage . . . . . . . . . 92
2.3 Marge de robustesse . . . . . . . . . . . . . . . . . . . . . . . 94
2.3.1 Critre de Nyquist . . . . . . . . . . . . . . . . . . . . 94
2.3.2 Marge de phase . . . . . . . . . . . . . . . . . . . . . . 102
2.3.3 Marge de gain . . . . . . . . . . . . . . . . . . . . . . . 105
2.3.4 Lecture des marges sur le diagramme de Bode . . . . . 106
2.3.5 Ples dominants . . . . . . . . . . . . . . . . . . . . . . 107
2.4 Complments . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
2.4.1 Calcul de tous les contrleurs PID stabilisant un sys-
tme du premier ordre retard . . . . . . . . . . . . . 108
2.4.2 Mthodes de rglage de Ziegler-Nichols . . . . . . . . . 111
2.4.3 Prdicteur de Smith . . . . . . . . . . . . . . . . . . . 114
2.4.4 Systmes non minimum de phase . . . . . . . . . . . 116
3 Commandabilit, stabilisation 119
3.1 Un exemple de planication et de suivi de trajectoires . . . . . 120
3.1.1 Modlisation de deux oscillateurs en parallle . . . . . 120
3.1.2 Planication de trajectoires . . . . . . . . . . . . . . . 121
3.1.3 Stabilisation et suivi de trajectoires . . . . . . . . . . . 122
3.1.4 Autres exemples . . . . . . . . . . . . . . . . . . . . . . 124
3.2 Commandabilit non linaire . . . . . . . . . . . . . . . . . . . 128
TABLE DES MATIRES 5
3.2.1 Exemple de non commandabilit par la prsence din-
tgrale premire . . . . . . . . . . . . . . . . . . . . . . 129
3.3 Commandabilit linaire . . . . . . . . . . . . . . . . . . . . . 131
3.3.1 Matrice de commandabilit et intgrales premires . . . 132
3.3.2 Invariance . . . . . . . . . . . . . . . . . . . . . . . . . 134
3.3.3 Critre de Kalman et forme de Brunovsky . . . . . . . 135
3.3.4 Planication et suivi de trajectoires . . . . . . . . . . . 141
3.4 Commande linaire quadratique LQR . . . . . . . . . . . . . . 143
3.4.1 Multiplicateurs de Lagrange en dimension innie . . . . 146
3.4.2 Problme aux deux bouts dans le cas linaire quadratique151
3.4.3 Planication de trajectoires . . . . . . . . . . . . . . . 153
3.4.4 Rgulateur LQR . . . . . . . . . . . . . . . . . . . . . 155
3.5 Complments . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
3.5.1 Linarisation par bouclage . . . . . . . . . . . . . . . . 163
3.5.2 Stabilisation par mthode de Lyapounov et backstepping170
4 Observabilit, estimation et adaptation 173
4.1 Un exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
4.1.1 Un modle simple de moteur courant continu . . . . 175
4.1.2 Estimation de la vitesse et de la charge . . . . . . . . . 175
4.1.3 Prise en compte des chelles de temps . . . . . . . . . . 177
4.1.4 Contraintes sur les courants . . . . . . . . . . . . . . . 178
4.2 Observabilit non linaire . . . . . . . . . . . . . . . . . . . . 179
4.2.1 Dnition . . . . . . . . . . . . . . . . . . . . . . . . . 179
4.2.2 Critre . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
4.2.3 Observateur, estimation, moindres carrs . . . . . . . . 182
4.3 Observabilit linaire . . . . . . . . . . . . . . . . . . . . . . . 184
4.3.1 Le critre de Kalman . . . . . . . . . . . . . . . . . . . 184
4.3.2 Observateurs asymptotiques . . . . . . . . . . . . . . . 186
4.3.3 Observateurs rduits de Luenberger . . . . . . . . . . . 187
4.4 Observateur-contrleur . . . . . . . . . . . . . . . . . . . . . . 187
4.4.1 Version tat multi-entre multi-sortie (MIMO)
1
. . . . 187
4.4.2 Version transfert mono-entre mono-sortie (SISO)
2
. . 189
4.5 Filtre de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . 190
4.5.1 Formalisme . . . . . . . . . . . . . . . . . . . . . . . . 191
4.5.2 Hypothses et dnition du ltre . . . . . . . . . . . . 192
4.6 Complments . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
4.6.1 Estimation de paramtres et commande adaptative . . 199
1. MIMO : pour Multi-Input Multi-Output
2. SISO : pour Single-Input Single-Output
6 TABLE DES MATIRES
4.6.2 Linarisation par injection de sortie . . . . . . . . . . . 201
4.6.3 Contraction . . . . . . . . . . . . . . . . . . . . . . . . 202
A Sur le thorme de Cauchy-Lipchitz 207
B Autour des fonctions de Lyapounov 215
C Moyennisation 221
C.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
C.2 Le rsultat de base . . . . . . . . . . . . . . . . . . . . . . . . 222
C.3 Un exemple classique . . . . . . . . . . . . . . . . . . . . . . . 224
C.4 Recherche dextremum (extremum seeking) . . . . . . . . . . . 225
C.5 Boucle verrouillage de phase PLL . . . . . . . . . . . . . . . 226
D Automatique en temps discret 229
D.1 Reprsentation externe et interne . . . . . . . . . . . . . . . . 234
D.1.1 Transforme en z . . . . . . . . . . . . . . . . . . . . . 235
D.1.2 Ralisation canonique dune fonction de transfert discrte236
D.2 Analyse de la stabilit . . . . . . . . . . . . . . . . . . . . . . 237
D.3 Commandabilit en temps discret . . . . . . . . . . . . . . . . 238
D.3.1 Placement de ples . . . . . . . . . . . . . . . . . . . . 239
D.3.2 Rendre une matrice nilpotente par feedback . . . . . . 239
D.3.3 Synthse dune commande pour aller en temps ni
un point dquilibre arbitraire . . . . . . . . . . . . . . 240
D.3.4 Commande linaire quadratique LQR en temps discret 240
D.4 Observabilit, reconstructibilit et ltrage . . . . . . . . . . . 242
D.4.1 Filtre de Kalman en temps discret . . . . . . . . . . . . 243
Rfrences 244
Index 251
Chapitre 1
Systmes dynamiques et
rgulateurs
1.1 Systmes dynamiques non linaires
Nous nous intressons des systmes dynamiques reprsents par un
nombre ni dquations direntielles du premier ordre couples entre elles
que nous crivons
d
dt
x
1
= v
1
(x
1
, ..., x
n
, u
1
, ..., u
m
, t)
d
dt
x
2
= v
2
(x
1
, ..., x
n
, u
1
, ..., u
m
, t)
.
.
.
d
dt
x
n
= v
n
(x
1
, ..., x
n
, u
1
, ..., u
m
, t)
o les grandeurs x
1
,...,x
n
sont appeles tats, les grandeurs u
1
,...,u
m
sont
les entres (ou commandes), et n et m sont des entiers. Le temps t est ici
considr de manire gnrale dans le second membre des quations. Les
fonctions (v
i
)
i=1,...,n
sont valeur relle. En toute gnralit, leur rgularit
peut tre trs faible, mme si, comme on le verra par la suite, de nombreuses
proprits fondamentales proviennent justement de leur rgularit.
Il est commode dcrire le systme direntiel prcdent sous la forme
vectorielle (appele forme dtat)
d
dt
x = v(x, u, t) (1.1)
Pour calculer lvolution future dun tel systme, il faut connatre les gran-
deurs t u(t) ainsi que la condition initiale de ltat. On dit que ltat x
7
8 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
du systme reprsente sa mmoire. tant donne lvolution du systme, on
sintresse souvent un certain nombre de grandeurs (par exemple car elles
ont un intrt pratique) quon nomme sorties ou mesures. Les quations de
sorties que nous considrons sont de la forme
y = h(x, u, t) R
q
(1.2)
o q est un entier souvent infrieur n
1
.
Le formalisme (1.1) (1.2) que nous venons de prsenter est trs gnral.
On trouve un vaste choix dexemples dans les domaines de la mcanique
(les quations dEuler-Lagrange, voir [44] par exemple, exprimant le prin-
cipe de moindre action sont des quations dordre 2 dans les variables de
congurations (positions gnralises), ltat est alors constitu des positions
gnralises et leur vitesses), les machines lectriques (voir [46]), laronau-
tique (voir lExemple 1), la robotique (voir [58]), la chimie, la biochimie, les
sciences du vivant (voir [37])
2
.
Ce que nous cherchons faire dans le domaine de lAutomatique ce nest
pas simplement tudier les proprits des systmes dquations direntielles,
mais les contrler. Dans lquation (1.1), on peut agir sur ltat x en choi-
sissant u. Loutil principal de lAutomaticien cest la rtro-action u = k(t, x)
aussi appele feedback. En spciant de la sorte la commande, on change
compltement le comportement du systme dynamique (1.1) qui devient
d
dt
x = v(x, k(t, x), t)
En pratique, on sera souvent limit lutilisation de la mesure dnie en (1.2).
Dans ce contexte, les rtro-actions envisageables sont de la forme u = k(t, y).
On parle alors de retour de sortie. Cest un problme dicile pour lequel
nous montrerons, au Chapitre 4 quil est en fait utile dutiliser un systme
dynamique supplmentaire (on parlera dobservateur) qui permettra de bien
plus intressantes possibilits.
1. Bien souvent seules certaines composantes sont mesures pour des raisons technolo-
giques, il existe des exceptions notables comme dans les applications de fusion de capteurs
(voir le Chapitre 4) o on dispose de mesures redondantes de certaines composantes de
ltat x.
2. Pourtant, on pourra remarquer que certains domaines chappent ce formalisme.
On peut citer quelques exemples tels que ltude de la turbulence dans les coulements, les
phnomnes thermiques dans les chambres de combustion, ou les ondes de propagation.
Ltude des systmes de dimension innie est traite dans de nombreux ouvrages sur les
quations direntielles partielles [19] aussi appels systmes paramtres distribus. Ils
sont en grande partie absent de ce cours.
1.1. SYSTMES DYNAMIQUES NON LINAIRES 9
Que ce soit parce quon a choisi une loi de rtroaction particulire ou parce
que le systme considr ne possde pas de commande, il est important de
comprendre comment tudier les systmes libres de la forme
d
dt
x = v(x, t) (1.3)
On dira quun tel systme est stationnaire (par opposition au cas (1.3) ins-
tationnaire) lorsque v ne dpend pas explicitement du temps. Dans ce cas
lquation scrit
d
dt
x = v(x)
Un des concepts cls dans ltude des systmes dynamiques est la notion
de point dquilibre (appel galement point stationnaire) x. On appelle point
dquilibre, un point x tel que, si le systme direntiel (1.3) est initialis en ce
point, c.--d. x(0) = x, alors le systme reste en x pour tous les temps futurs.
Dans le cas dun systme stationnaire, les points dquilibre sont simplement
3
caractriss par lquation v( x) = 0.
Autour dun point dquilibre il est tentant de chercher une expression
approche des quations dynamiques (1.3) quon souhaite tudier. En gn-
ral, lorsque le systme est instationnaire, on obtiendra un systme linaire
instationnaire (appel linaris tangent) de la forme
d
dt
x = A(t)x + B(t)u (1.4)
y = C(t)x + D(t)u (1.5)
Comme nous le verrons (notamment la Section 1.3), cette approche est in-
tressante car elle fournit souvent une information locale sur le comportement
de (1.3) autour de x. Nanmoins, cette information est parfois insusante,
surtout lorsquon recherche des informations sur le comportement du systme
loin de lquilibre. En outre, les systmes linaires et les systmes non linaires
sont en fait trs dirents par nature. Soumis une superposition dexcita-
tions (par une somme de termes dans la commande), les systmes linaires
rpondent daprs le principe de superposition : leur sortie est la somme des
sorties correspondant chacun des termes dexcitation. Ce principe, qui ne
sapplique pas aux systmes non linaires, est la base de lanalyse de Fou-
rier des signaux. Il existe de nombreux phnomnes quon ne constate que
chez les systmes rgis par des quations non linaires (on pourra se rfrer
3. On notera lintrt dun formalisme du premier ordre. Si on considre lquation
d
2
dt
2
x = 2x, dont ltat est (x,
d
dt
x)
T
, les points dquilibre sont donns par ( x,
d
dt
x) = (0, 0)
et pas uniquement par lquation 2 x = 0.
10 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
[40] pour une discussion plus dtaille). Les systmes non linaires peuvent
diverger en temps ni alors que cest seulement en temps inni quun systme
linaire peut diverger (c.--d. que son tat tend vers linni). Un systme non
linaire peut avoir de multiples points dquilibre isols. Lunicit des points
dquilibre nest pas non plus garantie dans le cas des systmes linaires, mais
elle apparat sous la forme de sous espaces vectoriels de points dquilibre.
Enn, et cest un des faits les plus marquants, un systme non linaire peut
possder un ou plusieurs cycles limites. Cest une des particularit les plus
importantes et aussi lune des plus frquemment observes en pratique. Alors
que les systmes linaires peuvent avoir des trajectoires oscillantes, lampli-
tude de celles-ci dpendent de la condition initiale. Dans le cas non linaire il
est possible dobserver des trajectoires oscillantes dont lamplitude ne d-
pend pas de la condition initiale. Cest en exploitant cette proprit quon
a construit les premiers circuits lectriques oscillants qui sont la base de
llectronique (et de la synthse sonore notamment). titre dillustration,
on pourra se reporter londe de densit observe dans les puits de ptrole
prsents dans lExemple 10.
Exemple 1 (Missile dans le plan). En grande partie cause des eets aro-
dynamiques, les quations qui rgissent le mouvement dun missile ou dune
fuse sont non linaires. Aprs rduction un plan, les quations de la dy-
namique dun missile sexpriment au moyen de 6 tats. Les variables x
m
et
y
m
correspondent aux coordonnes du centre de gravit de lengin, V
m
est sa
vitesse,
m
,
m
et
m
correspondent des angles, et on utilise deux variables
intermdiaires
A
et
T
pour exprimer les seconds membres de la dynamique
(voir la Figure 1.1).
x
m
= V
m
cos
m
y
m
= V
m
sin
m

V
m
=
1
m
_
T cos
T

1
2
SV
2
m
C
D
(
T
)
_
o sin
T
=
_
1
1
1 + tan
2

m
+ tan
2

m

m
= tan
A
g
V
m
o 1 + tan
2

A
=
tan
2

T
tan
2

m

m
= 0.3(
c

m
)

m
= 0.3(
c

m
)
_

_
(1.6)
Les deux commandes sont
c
,
c
, tandis que m(t) et T(t) sont des fonctions
1.1. SYSTMES DYNAMIQUES NON LINAIRES 11
donnes du temps (variation de la masse et de la pousse), et S sont des
constantes et C
D
(.) est le coecient de trane. Ce modle prend en compte
les eets arodynamiques dus aux angles dattaque du corps du missile, la
perte de masse au cours du vol (qui est loin dtre ngligeable), et les dyna-
miques des actionneurs ( travers des vrins).
Figure 1.1 Variables dcrivant un missile.
1.1.1 Existence et unicit des solutions
Loutil de base de la modlisation mathmatique dun modle physique
est le problme de Cauchy. Il consiste en une condition initiale et une quation
direntielle
x(0) = x
0
,
d
dt
x(t) = v(x(t), t) (1.7)
Face ce problme, on est en droit desprer que les proprits suivantes sont
satisfaites
1. quune solution avec ces conditions initiales existe
2. que cette solution soit unique
3. que les solutions dpendent continment des conditions initiales
On trouvera une dmonstration lmentaire du thorme de Cauchy-Lipschitz
( partir du schma dEuler explicite et de la notion de solution approchante)
dans lAnnexe A. Ce thorme dont une version un peu plus gnrale est
donne ci-dessous garantie lexistence et lunicit pour des temps courts. En
12 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
revanche lexistence pour des temps t arbitrairement grands est nettement
plus dlicate. On peut la garantir sous des hypothses fortes (voir Lemme 1).
Enn, la continuit de la solution par rapport sa condition initiale peut tre
garantie, mais sous une hypothse plus forte. Cest lobjet du Thorme 2.
Thorme 1 (Cauchy-Lipschitz. Existence et unicit). Soit R
n
R
(x, t) v(x, t) R
n
une fonction satisfaisant aux deux proprits suivantes :
1. (localement lipchitzienne par rapport x) pour tout (x, t) R
n
R,
il existe
x,t
> 0 et K
x,t
> 0, tels que, pour tout y R
n
vriant
|x y|
x,t
on a |v(x, t) v(y, t)| K
x,t
|x y|
2. (localement intgrable par rapport t) pour tout x R
n
, lapplication
t v(x, t) est localement intgrable
4
.
On considre le problme de Cauchy,
x(0) = x
0
,
d
dt
x(t) = v(x(t), t),
Ce problme possde les proprits suivantes
1. existence locale en temps : pour toute condition initiale x
0
R
n
, il
existe > 0 et une fonction ] , [ t x(t) R
n
drivable par
rapport t et solution du problme de Cauchy.
2. unicit globale en temps : pour toute condition initiale x
0
R
n
et pour
tout a, b > 0 il existe au plus une fonction ] a, b[ t x(t) R
n
drivable par rapport t et solution du problme de Cauchy.
Une dmonstration de ce thorme, reposant sur le thorme du point xe
de Picard dans un espace de Banach, gure dans [51, 34]. On peut vrier
grce aux exemples qui suivent que les hypothses du Thorme 1 de Cauchy-
Lipchitz sont eectivement ncessaires :
lquation
d
dt
x =
_
[x[ admet deux solutions partant de x
0
= 0 : x(t) =
0 et x(t) = t
2
/4 ; on remarque que
_
[x[ nest pas Lipchitz en x = 0
bien quelle y soit continue. En dehors du point 0, lunique solution
de lquation direntielle (voir [10, page 149])est x(0) = l, x(t) =
1
4
(t + 2

l)
2
.
toute solution de
d
dt
x = 1/t nest pas dnie en t = 0 car 1/t nest pas
localement intgrable autour de 0 alors que
d
dt
x = 1/
_
[t[ admet des
solutions parfaitement dnies en 0.
4. + x x, chacune de ses composantes est une fonction mesurable du temps dont
lintgrale de la valeur absolue sur tout intervalle born est borne, voir [52].
1.1. SYSTMES DYNAMIQUES NON LINAIRES 13
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
1
2
3
4
5
6
7
8
9
10
t
x
Figure 1.2 Dpendance de la solution dune quation direntielle par
rapport sa condition initiale. Trois solutions dune quation scalaire au
cours du temps. Elles ne peuvent se croiser en vertu de la proprit dunicit.
Thorme 2 (Dpendance en la condition initiale). Soit R
n
R (x, t)
v(x, t) R
n
une fonction continue drives partielles
v
x
i
continues par
rapport x. Soit x
0
R
n
une condition initiale, il existe une unique solution
t x(t) telle que x(0) = x
0
. Cette solution, considre comme une fonc-
tion de la condition initiale x
0
, admet des direntielles partielles
x
i
(x
0
,t)
x
0
j
continues par rapport x
0
et t.
Ce thorme est dmontr dans [36, page 29]. Il est illustr par la Fi-
gure 1.2 o on a reprsent trois solutions de la mme quation direntielle
scalaire ( second membre C
1
) obtenues en faisant varier la condition ini-
tiale. On remarque que les courbes ne se croisent pas (cela est interdit par la
proprit dunicit). Elles semblent scarter lorsque t croit.
Lexistence pour tout temps t > 0 nest pas une consquence du Tho-
rme 1 de Cauchy-Lipchitz. En eet,
d
dt
x = x
2
vrie bien toutes ses hypo-
thses, mais comme la solution qui part de x
0
est x(t) =
x
0
1tx
0
, on voit que,
pour x
0
> 0, la solution explose en t = 1/x
0
. La solution explose en temps
ni.
On peut donner une condition assez gnrale (mais relativement forte)
pour viter lexplosion en temps ni. Cest lobjet du lemme suivant.
Lemme 1 (existence globale en temps). En plus des hypothses du Tho-
rme 1, si on suppose quil existe M
0
(t), M
1
(t) > 0 fonctions localement in-
tgrables telles que pour tout x R
n
, |v(x, t)| M
0
(t) +M
1
(t)|x|, alors la
solution (unique) au problme de Cauchy est dnie pour t ] , +[.
14 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Noter que ce lemme ne dit pas que les trajectoires restent bornes. A
priori, elles ne le sont pas comme le montre lexemple
d
dt
x = x : elles peuvent
tendre vers linni mais en temps inni.
1.1.2 Sensibilit et premire variation
Nous nous intressons la solution du systme
d
dt
x(t) = f(x(t), u(t), p), x(0) = x
0
o x R
n
, u R
m
, p R
r
, f est une fonction C
1
de x, u et p (n, m, r N).
On suppose ici que la fonction R t u(t) R
m
est continue par morceaux.
Ainsi, les hypothses du thorme 1 sont satisfaites et donc la solution t
x(t) existe pour t autour de 0 et est unique. On regarde sa dpendance des
petites variations de lentre u, du paramtre p ou de sa condition initiale
x
0
. Nous ne prsentons pas de faon rigoureuse les rsultats de drivabilit
de x par rapport u, p et x
0
. Ils dcoulent du thorme 2 et du fait que
f est C
1
. Nous prsentons simplement la faon de calculer directement les
drives partielles de x par rapport aux composantes de x
0
et p, ainsi que la
direntielle de x par rapport u.
La mthode est lmentaire : il sut de direntier les quations. On
note lopration de dierentiation. Ainsi les petites variations de u, p et
x
0
, notes u, p et x
0
, engendrent des petites variations de x, notes x.
Il faut bien comprendre que p et x
0
sont des petits vecteurs de R
r
et R
n
alors que u et x sont des petites fonctions du temps valeur dans R
m
et
R
n
, respectivement. Ainsi x est solution de lquation direntielle
d
dt
(x)(t) =
_
f
x
_
t
x +
_
f
u
_
t
u(t) +
_
f
p
_
t
p
avec comme condition initiale x(0) = x
0
. Les matrices Jacobiennes
f
x
,
f
u
et
f
p
sont values le long de la trajectoire (x(t), u(t), p). Cest pourquoi
nous les notons
_
f
x
_
t
,
_
f
u
_
t
et
_
f
p
_
t
. Ainsi, x est solution dune quation
direntielle ane coecients dpendant a priori du temps :
d
dt
(x)(t) = A(t)x + b(t), x(0) = x
0
,
o A(t) =
_
f
x
_
t
et b(t) =
_
f
u
_
t
u(t) +
_
f
p
_
t
p.
Supposons que lon souhaite calculer la drive partielle de x par rapport
p
k
, le k-ime paramtre scalaire (k 1, . . . , r). On note W(t) R
n
1.1. SYSTMES DYNAMIQUES NON LINAIRES 15
cette drive partielle linstant t. Le calcul ci-dessus nous dit que W est la
solution du systme ane dpendant du temps suivant :
d
dt
W =
_
f
x
_
t
W +
_
f
p
k
_
t
avec comme condition initiale W(0) = 0. De mme, pour la drive par-
tielle par rapport x
0
k
note V (t) R
n
, on doit rsoudre le systme linaire
dpendant du temps
d
dt
V =
_
f
x
_
t
V
avec comme condition initiale V (0) = (
j,k
)
1jn
o ici
jk
est le symbole de
Kronecker qui vaut 1 si j = k et 0 sinon.
Noter quil nest pas possible de dnir la drive partielle de x par rap-
port u
k
avec un simple vecteur car u
k
est une fonction de t. On parle alors
de direntielle partielle qui est, chaque instant, un oprateur linaire sur
des fonctions, une fonctionnelle linaire donc.
1.1.3 Stabilit locale autour dun quilibre
La notion de stabilit sattache formaliser lintuition suivante : un point
dquilibre sera dit stable si un petit dsquilibre initial nentrane que de
petits carts pour tout temps postrieur ; en bref de petites causes nont que
de petites consquences.
Dnition 1 (Stabilit (au sens de Lyapounov) et instabilit). On re-
prend les notations et hypothses du Thorme 1 de Cauchy Lipchitz. On sup-
pose de plus quil existe un point dquilibre x R
n
caractris par v( x, t) = 0
pour tout t R.
Lquilibre x R
n
est dit stable (au sens de Lyapounov) si et seulement
si pour tout > 0, il existe > 0 tel que pour toute condition initiale x
0
vriant |x
0
x| , la solution de
d
dt
x = v(x, t) issue de x
0
t = 0, est
dnie pour tout temps positif et vrie |x(t) x| pour tout temps t 0.
Sil nest pas stable, il est dit instable.
Dnition 2 (Stabilit asymptotique). Avec les notations de la Dni-
tion 1, lquilibre x est dit localement asymptotiquement stable si et seule-
ment sil est stable et si, de plus, il existe > 0 tel que toutes les solu-
tions x(t) de
d
dt
x = v(x, t), partant en t = 0 de conditions initiales x
0
telles
que |x
0
x| , convergent vers x lorsque t tend vers +.
16 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Figure 1.3 Stabilit (gauche) et stabilit asymptotique (droite).
Ces notions de stabilit sont illustres sur la Figure 1.3. Lorsque x est
asymptotiquement stable, on dit souvent que le systme oublie sa condition
initiale. En eet, localement, quelle que soit la condition initiale, la trajectoire
converge vers x. Lorsque, dans la Dnition 2, la condition initiale peut tre
librement choisie, on dit que x est globalement asymptotiquement stable.
Exemple 2 (Oscillateur harmonique). Un exemple dquilibre stable mais
non asymptotiquement stable est celui de loscillateur harmonique non amorti
(le paramtre > 0 est la pulsation)
d
dt
x
1
= x
2
,
d
dt
x
2
=
2
x
1
(1.8)
Le rajout dun amortissement
d
dt
x
1
= x
2
,
d
dt
x
2
=
2
x
1
2 x
2
(1.9)
rend alors lquilibre (0, 0) asymptotiquement stable. Le paramtre sans di-
mension > 0 est le facteur damortissement : pour ]0, 1[ le retour
lquilibre se fait sous la forme doscillations amorties ; pour 1, le retour
lquilibre se fait quasiment sans oscillation, i.e., avec un trs petit nombre
de changements de signe pour x
1
et x
2
. Comme on le verra en dtails dans
la Section 1.2 consacre aux systmes linaires, cela vient du fait bien connu
que les racines s du polynme caractristique
s
2
+ 2 s +
2
= 0
de lquation du second ordre
d
2
dt
2
x
1
+ 2
d
dt
x
1
+
2
x
1
= 0
1.1. SYSTMES DYNAMIQUES NON LINAIRES 17
P
M P
M
Figure 1.4 Deux congurations possibles dun avion de combat. Noter
la dirence de position relative entre le centre de pousse (P) et le centre
de masse (M) entre les deux congurations. Le systme est stable dans la
conguration de droite, et instable dans la conguration de gauche.
qui correspond au systme (1.9), sont relles ngatives pour > 1 et com-
plexes conjugues avec une partie relle ngative si 0 < < 1. Noter enn
quaucun des quilibres du double intgrateur, (1.8) avec = 0, nest stable.
Exemple 3 (Stabilit des avions). La position relative du centre de masse
et du centre de pression arodynamique conditionnent la stabilit en boucle
ouverte des avions. Si lengin est trop stable, il est dicile manoeuvrer. On
doit alors utiliser des surfaces de contrle (volets) trs tendues pour gnrer
les forces requises pour les manoeuvres. En rgime supersonique, le centre
de pression se dcale vers larrire de lappareil. Lors de la conception dun
appareil de combat, il est souvent prfr de prvoir un centre de pousse
lavant du centre de pression lors du rgime subsonique, lavion y est instable
en boucle ouverte (notamment pour le dcollage et latterrissage), alors quen
rgime supersonique il est stable car le centre de pression passe larrire.
On se reportera louvrage [2] pour de trs nombreuses explications et dve-
loppements sur ce thme.
Du fait du caractre local de la Dnition 2, il est possible, sous certaines
conditions, de dduire la stabilit asymptotique des termes du dveloppement
limit lordre 1 des quations direntielles autour de lquilibre (le systme
linaris tangent)
5
. Avant dnoncer un rsultat fondamental dans ce cadre
5. Ce calcul lordre 1 est mme lorigine de la thorie des matrices et de lanalyse
spectrale
18 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
(Thorme 10) nous devons dabord tudier les systmes linaires.
1.2 Systmes dynamiques linaires
Cette section ne comporte que le strict minimum sur les systmes li-
naires. Pour un expos complet, nous renvoyons [34]. Considrons le sys-
tme linaire
d
dt
x(t) = Ax(t) (1.10)
avec x(t) R
n
et A une matrice n n coecients rels constants. Une
des principales spcicits des systmes linaires est que, par homothtie, les
proprits locales sont galement globales. Cest en particulier vrai pour la
stabilit asymptotique qui peut stablir, comme nous le verrons au Tho-
rme 4, en tudiant les valeurs propres de A.
1.2.1 Lexponentielle dune matrice
La matrice dpendant du temps exp(tA) est dnie par la srie absolu-
ment convergente
exp(tA) =
_
I + tA +
t
2
2!
A
2
+ . . . +
t
k
k!
A
k
+ . . .
_
(1.11)
o I est la matrice identit. On appelle t exp(tA) lexponentielle de la
matrice A. Quel que soit x
0
R
n
, lunique solution x(t) du problme de
Cauchy
d
dt
x(t) = Ax(t), x(0) = x
0
sexprime sous la forme
x(t) = exp(tA) x
0
Proposition 1 (Proprits de lexponentielle de matrice). L exponentielle
de matrice satisfait les proprits suivantes
exp(tA) exp(A) = exp((t + )A)
d
dt
(exp(tA)) = exp(tA) A = Aexp(tA)
exp(PAP
1
) = P exp(A)P
1
exp(A) = lim
m+
_
I +
A
m
_
m
det(exp(A)) = exp(tr(A))
o t et sont des rels, P est une matrice inversible, det dsigne le dter-
minant et tr dsigne la trace. En outre, si A et B sont des matrices qui
commutent, c.--d. AB = BA alors exp(A) exp(B) = exp(A + B).
1.2. SYSTMES DYNAMIQUES LINAIRES 19
1.2.2 Forme de Jordan et calcul de lexponentielle
Le calcul de lexponentielle de matrice exp(tA) peut tre simpli en
faisant intervenir une transformation P inversible qui diagonalise A, lorsque
cest possible, ou qui transforme A en une matrice diagonale par blocs, dite
matrice de Jordan (voir par exemple [34]). Le rsultat suivant prcise les
notations.
Thorme 3 (Rduction de Jordan). Soit A une matrice n n dont le
polynme caractristique scind sur C scrit sous la forme
det(sI A) =
q

i=1
(s
i
)

i
, (
i
,=
j
, si i ,= j)
Il existe une matrice inversible T ( coecients complexes) telle que
A = T
1
JT
o
J =
_
_
_
_
_
J
1
0
J
2
.
.
.
0 J
q
_
_
_
_
_
,
avec pour i = 1, ..., q,
J
i
=
_
_
_
_
_
_
_
_

i
v
i,1
0 . . . 0
0
i
v
i,2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0
.
.
.
.
.
.

i
v
i,
i1
0 . . . . . . 0
i
_
_
_
_
_
_
_
_
o pour tout i, j, v
i,j
vaut 0 ou 1.
Thorme 4 (CNS de stabilit asymptotique dun systme linaire sta-
tionnaire). Soit le problme de Cauchy pour le systme linaire stationnaire
d
dt
x = Ax, x(0) = x
0
o A est une matrice n n et x
0
R
n
. Ce systme
possde la proprit que lim
t
x(t) = 0 quel que soit x
0
(c.--d. que le point
dquilibre 0 est globalement asymptotiquement stable) si et seulement si
toutes les valeurs propres de A ont une partie relle strictement ngative.
Dmonstration.
20 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
La condition est ncessaire.
Considrons valeur propre de A et v un vecteur propre associ. Il vient,
pour tout i N, A
i
v =
i
v. On a alors, pour tout t > 0,
exp(tA)v =

i=0
t
i
i!
A
i
v =

i=0
(t)
i
v = exp(t)v
Donc, pour avoir lim
t
x(t) = 0 quelle que soit la condition initiale, il
faut que toutes les valeurs propres aient une partie relle '(
i
) strictement
ngative.
La condition est susante.
Supposons la condition ralise et notons = sup
i=1,...n
'(
i
). Daprs le
Thorme 3, on peut dcomposer A = T
1
JT, avec J = D + N o D est
diagonale et N est nilpotente. Daprs la Proposition 1, on a
exp(tA) = T
1
exp(tJ)T
Les matrice D et N commutent. Intressons nous donc a
exp(tJ) = exp(tD) exp(tN)
Par construction, on a D = diag(
i
) o les
i
sont les valeurs propres de A.
On obtient directement
exp(tD) =
_
_
_
_
_
exp t
1
0
exp t
2
.
.
.
0 exp t
n
_
_
_
_
_
Notons |M| =

i=1,...,n,j=1,...,n
[m
i,j
[, pour M = (m
i,j
) matrice n n. On
peut clairement tablir, pour tout t > 0,
|exp(tD)| =

i=1,...,n
[exp(t
i
)[ nexp(t)
Dautre part, N tant nilpotente, on a, pour tout t > 0,
exp(tN) = I + tN +
t
2
2
N
2
+ ... +
t
n1
(n 1)!
N
n1
Donc, on peut majorer
|exp(tN)| p(t)
1.2. SYSTMES DYNAMIQUES LINAIRES 21
par le polynme p(t) 1+t |N|+
t
2
2
|N
2
|+... +
t
n1
(n1)!
|N
n1
|. Il vient alors
|exp(tJ)| = |exp(tD) exp(tN)| |exp(tD)| |exp(tN)| np(t) exp(t)
On en dduit, en utilisant |exp(tA)| |T
1
| |exp(tJ)| |T|, que
lim
t
|exp(tA)| = 0
do la conclusion.
Dans le cas o le systme linaire est eectivement (globalement) asymp-
totiquement stable, on a en fait convergence exponentielle vers zro de toutes
les trajectoires. Le rsultat suivant prcise ce point, on peut utiliser nim-
porte quel minorant strict (en valeur absolue) des parties relles des valeurs
propres comme constante dans cet nonc. On trouvera une dmonstration
dans [12].
Proposition 2 (Estimation de la convergence dun systme linaire). Soit le
problme de Cauchy pour le systme linaire stationnaire
d
dt
x = Ax, x(0) =
x
0
o A est une matrice n n et x
0
R
n
. Si toutes les valeurs propres de
A sont partie relle strictement ngative, alors il existe K > 0 et > 0 tel
que, pour tout t 0
|exp(tA)| K exp (t)
et donc
|x(t)| K
_
_
x
0
_
_
exp (t)
Thorme 5 (CNS de stabilit dun systme linaire stationnaire). Le point
dquilibre x = 0 du systme linaire
d
dt
x = Ax est stable si et seulement si
toutes les valeurs propres de A ont une partie relle ngative ou nulle et si
toute valeur propre ayant une partie relle nulle et une multiplicit suprieure
ou gale 2 correspond un bloc de Jordan dordre 1.
Lide de la dmonstration du Thorme 5 repose sur le calcul de lexpo-
nentielle dune matrice de Jordan dordre suprieur 1. Considrons le cas
le plus simple o on a un bloc de Jordan de taille p et dordre p
J
p
=
_
_
_
_
_
1 0
.
.
.
.
.
.
.
.
.
1
0
_
_
_
_
_
22 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Dans ce cas, lexponentielle de matrice exp(tJ
p
) vaut
exp(tJ
p
) = exp(t)
_
_
_
_
_
_
1 t . . .
t
p1
(p1)!
0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
t
0 . . . 0 1
_
_
_
_
_
_
Les termes polynomiaux napparaissent que dans ce cas. Dans le cas dune
valeur propre partie relle nulle, le terme exponentiel ne procure pas damor-
tissement et par consquent, ne domine pas les termes polynomiaux. Ensuite,
par les formules de changement de base, on en retrouvera des combinaisons
linaires dans les coordonnes dorigine, prouvant ainsi que les composantes
de lexponentielle de la matrice sont non bornes lorsque t croit. On en dduit
linstabilit du systme. Une dmonstration dtaille se trouve dans [12]. Une
interprtation de ce rsultat est que la forme de Jordan dordre suprieur 1
met en vidence un couplage entre les tats, qui rsultent en une instabilit.
Exemple 4. Considrons une matrice A ayant toutes ses valeurs propres
partie relle ngative ou nulle. Si les valeurs propres partie relle nulle
sont toutes simples, le systme est stable. Le fait que valeur propre de A
partie relle nulle et de multiplicit m corresponde un bloc de Jordan de
taille 1 est quivalent la condition rang(I A) = n m. On vriera
ainsi simplement que la matrice A
1
correspond un systme stable alors que
la matrice A
2
correspond un systme instable, avec
A
1
=
_
_
_
_
0 1 0 0
1 0 0 0
0 0 0 1
0 0 1 0
_
_
_
_
, A
2
=
_
_
_
_
0 1 0 0
1 0 1 0
0 0 0 1
0 0 1 0
_
_
_
_
1.2.3 Portraits de phases des systmes linaires
Nous allons considrer maintenant les cas les plus intressants, principale-
ment les cas gnriques (i.e. invariants par lgres modications des lments
de la matrice A), quon peut rencontrer en dimensions n = 2 et n = 3.
Dimension n = 2
Les principaux cas sont illustrs sur les Figures 1.5, et 1.6. On a not

1
et
2
les valeurs propres de A (distinctes ou non, relles ou complexes
conjugues),
1
et
2
sont des vecteurs propres rels associs quand ils existent.
On appelle ici plan de phases lespace R
n
correspondant ltat x. Pour
1.2. SYSTMES DYNAMIQUES LINAIRES 23
chaque cas, on a reprsent lemplacement des valeurs propres de A dans le
plan complexe, et lallure gnrale des trajectoires (note portrait de phases)
du systme
d
dt
x = Ax. Cette forme gnrale, comme on la vu, ne dpend par
de la condition initiale.
Dimension n = 3
La Figure 1.7, montre sur un exemple comment, partir des portraits de
phases en dimension 2, on construit, dans les cas gnriques, le portrait de
phases en dimension 3 : il sut de dcomposer R
3
en somme despaces propres
invariants de dimension 1 ou 2. On a convergence suivant une direction et
enroulement avec convergence (typique dun foyer stable) suivant deux autres
directions.
1.2.4 Polynme caractristique
Les valeurs propres de A (son spectre) correspondent aux racines de son
polynme caractristique
6
P(s)
P(s) = det(sI A) = s
n

n1

=0

= 0
partir des coecients de la matrice A les coecients

de ce poly-
nme P(s) se calculent simplement.
Exemple 5 (Forme canonique dun systme linaire). Soit t y(t) R
solution de
y
(n)
=
0
y +
1
y
(1)
+ . . . +
n1
y
(n1)
o les
i
sont des scalaires et o la -ime drive de y par rapport au temps
est note y
()
.
En posant x = (y, y
(1)
, . . . , y
(n1)
)
T
vecteur de R
n
, cette quation scalaire
dordre n devient un systme du premier ordre de dimension n,
d
dt
x = Ax,
6. Ce dernier est obtenu en remplaant dans
d
dt
x = Ax, loprateur
d
dt
par s la variable
de Laplace et en cherchant les conditions sur s C pour le systme linaire de n quations
n inconnues sx = Ax admette des solutions x non triviales. Ce qui quivaut dire que
la matrice sI A nest pas inversible, cest dire que son dterminant P(s), un polynme
de degr n, est nul
24 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Figure 1.5 Portraits de phases plans et linaires lorsque les valeurs propres
de A,
1
et
2
, ont une partie imaginaire non nulle.
Figure 1.6 Portraits de phases plans et linaires,
d
dt
x = Ax, lorsque les
valeurs propres de A,
1
et
2
, sont relles (
1
et
2
vecteurs propres de A,
lorsquils existent).
1.2. SYSTMES DYNAMIQUES LINAIRES 25
valeurs propres
trajectoire
Figure 1.7 Exemple de portrait de phases dun systme linaire de dimen-
sion 3 en fonction des valeurs propres de A.
avec pour A la matrice suivante
A =
_
_
_
_
_
_
_
_
_
0 1 0 . . . . . . 0
0 0 1 0 . . . 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 . . .
.
.
.
0 1 0
0 . . . . . . . . . 0 1

0
. . . . . . . . .
n2

n1
_
_
_
_
_
_
_
_
_
Puisque la matrice A a une forme compagne (aussi appele forme canonique),
son polynme caractristique P(s) sobtient trs simplement en partant di-
rectement de la forme scalaire dordre n. Il sut de remplacer
d
dt
par s
s
n
y =
0
y +
1
sy + . . . +
n1
s
n1
y
La condition pour que cette quation linaire en y ait des solutions non nulles
donne P(s)
P(s) = s
n

1
s . . .
n1
s
n1
= 0
On dit que la matrice A est Hurwitz (stable), lorsque toutes ses valeurs
propres sont partie relle strictement ngative, i.e., les zros du polynme
P(s) sont dans le demi-plan '(s) < 0. Daprs le Thorme 4, le point
dquilibre 0 est asymptotiquement stable sous cette hypothse. On dit alors
que P(s) est un polynme Hurwitz (stable).
Dnition 3 (Polynme Hurwitz). Un polynme coecients rels dont
toutes les racines rsident dans le demi plan complexe ouvert gauche (i.e.
sont partie relle strictement ngative) est un polynme Hurwitz.
26 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Les polynmes Hurwitz sont caractriss par la condition ncessaire et
susante dtaille dans le thorme suivant.
Thorme 6 (Hermite-Biehler). Soit P(s) = a
0
+a
1
s+...+a
n
s
n
un polynme
de degr n coecients rels. On dnit P
p
(s
2
) et sP
i
(s
2
) les parties paires
et impaires de P(s), si bien que P(s) = P
p
(s
2
) + sP
i
(s
2
). Ce polynme est
Hurwitz si et seulement si
1. tous les zros de w P
p
(w
2
) et de w P
i
(w
2
) sont rels et dis-
tincts
2. a
n
et a
n1
sont de mme signe
3. les racines positives ranges en ordre croissant de w P
i
(w
2
) (no-
tes w
i1
,...) et les racines positives ranges en ordre croissant de s
P
p
(w
2
) (notes w
p1
,...) satisfont la proprit d entrelacement
0 < w
p1
< w
e1
< w
p2
< w
e2
< ...
Exemple 6. Considrons le polynme P(s) = 36 + 34s + 61s
2
+ 36s
3
+
29s
4
+11s
5
+4s
6
+s
7
. On a alors P
p
(s
2
) = 36+61s
2
+29s
4
+4s
6
et P
i
(s
2
) =
34 + 36s
2
+ 11s
4
+ s
6
. Les racines positives ranges en ordre croissant des
polynmes
w P
p
(w
2
) = 36 61w
2
+ 29w
4
4w
6
et
w P
i
(w
2
) = 34 36w
2
+ 11w
4
w
6
sont [1 3/2 2] et [1.2873 1.8786 2.4111]. Elles satisfont bien la pro-
prit dentrelacement. Tous les zros de w P
p
(w
2
) et de w P
i
(w
2
)
sont rels et distincts. Enn, les coecients a
n
= 1 et a
n1
= 4 sont de
mme signe. Le polynme P(s) est donc Hurwitz comme on peut aisment le
vrier numriquement.
De manire gnrale, ce nest pas en calculant les racines du polynme
caractristique quon peut vrier que les parties relles des valeurs propres
sont ngatives, mais en analysant ses coecients. Cest lobjet du critre de
Routh explicit dans le Thorme 7. On sait dailleurs depuis Galois, quil
nexiste pas de formule gnrale utilisant des radicaux donnant les racines
dun polynme partir de ses coecients pour un degr n 5.
Thorme 7 (Critre de Routh). Soit P(s) = a
0
+ a
1
s + ... + a
n
s
n
un
polynme de degr n coecients rels. On dnit la table de Routh partir
1.2. SYSTMES DYNAMIQUES LINAIRES 27
de ces deux premires lignes comme suit
s
n
a
n
a
n2
a
n4
...
s
n1
a
n1
a
n3
a
n5
s
n2
b
n1
b
n3
b
n5
s
n3
c
n1
c
n3
c
n5
. . . .
. . . .
. . . .
s
0
g
n1
. .
o
b
n1
=
1
a
n1

a
n
a
n2
a
n1
a
n3

, b
n3
=
1
a
n1

a
n
a
n4
a
n1
a
n5

, ...
c
n1
=
1
b
n1

a
n1
a
n3
b
n1
b
n3

...
Le nombre de racines de P(s) ayant une partie relle positive est gal au
nombre de changements de signe dans la premire colonne de la table de
Routh. Le polynme P(s) est Hurwitz si et seulement si il ny a pas de chan-
gement de signe dans la premire colonne de la table de Routh.
On trouvera dans [24, 25] la dmonstration de ce rsultat. Pour les sys-
tmes dordres 2 et 3,
d
dt
x = Ax de polynme caractristique P(s) = det(sI
A), on en dduit les conditions suivantes de stabilit asymptotique :
pour n = 2 et P(s) = s
2

1
s
0
,

0
= det(A) < 0 et
1
= tr(A) < 0. (1.12)
pour n = 3 et P(s) = s
3

2
s
2

1
s
0
,

0
< 0,
1
< 0,
2
< 0 et
0
<
1

2
. (1.13)
1.2.5 Systmes linaires instationnaires
La solution gnrale du systme linaire stationnaire avec terme de for-
age b(t)
d
dt
x = Ax + b(t), x R
n
, b(t) R
n
scrit
x(t) = exp(tA)x(0) +
_
t
0
exp ((t )A) b() d (1.14)
28 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Si A dpend du temps t (cas instationnaire), on nobtient pas, contrai-
rement ce quon pourrait croire, une formule correcte en remplaant tA
et (t )A par les intgrales
_
t
0
A et
_
t

A, respectivement. La raison fon-


damentale est que le produit de deux matrices nest pas commutatif en
gnral et donc que lon na pas lidentit pourtant fort sduisante sui-
vante :
d
dt
_
exp
_
_
t
0
A() d
__
= A(t) exp
_
_
t
0
A() d
_
. Cest cependant vrai
si A(t
1
) et A(t
2
) commutent, c.--d. A(t
1
)A(t
2
) = A(t
2
)A(t
1
) pour tout couple
(t
1
, t
2
).
Ainsi cette quadrature instationnaire, fausse en gnrale pour n > 1, nest
valide quessentiellement en dimension 1 (o la commutation est trivialement
vraie) : la solution gnrale de lquation scalaire ane coecients variables
d
dt
x = a(t)x + b(t), x R
est
x(t) = exp
__
t
0
a() d
_
x(0) +
_
t
0
exp
__
t

a() d
_
b() d
partir de la dimension 2, on ne dispose plus de formules explicites et
gnrales pour calculer la solution de
d
dt
x = A(t)x + b(t), mme si b(t) = 0.
Un exemple est lquation dAiry [1] :
d
2
dt
2
x = (a + bt)x qui nadmet pas
de quadrature simple avec des fonctions usuelles (exponentielle, logarithme,
...) et qui dnit les fonctions dAiry, une classe particulire de fonctions
spciales
7
.
Il est faux en gnral de dire que, si chaque instant t, A(t) a ses valeurs
propres partie relle strictement ngative, alors les solutions de
d
dt
x = A(t)x
convergent vers 0. Un contre-exemple sut sen convaincre. Considrons
A(t) =
_
1 + 1.5 cos
2
t 1 1.5 sin t cos t
1 1.5 sin t cos t 1 + 1.5 sin
2
t
_
Pour tout t, les valeurs propres de A(t) sont 0.250.25

7i. Or, le systme


d
dt
x(t) = A(t)x(t) a pour solution
x(t) =
_
e
0.5t
cos t e
t
sin t
e
0.5t
sin t e
t
cos t
_
x
0
7. En fait limmense majorit les fonctions spciales (fonctions de Bessel, de Jacobi
voir [7]) sont solutions dquations direntielles du second ordre coecients polyn-
miaux en t : elles correspondent donc des matrices carres A(t) de dimension 2 dont les
coecients sont simplement des polynmes en t.
1.2. SYSTMES DYNAMIQUES LINAIRES 29
qui, pour des conditions initiales x
0
aussi proches de 0 quon le souhaite,
diverge lorsque t +. Un autre exemple, encore plus simple est fourni
par la matrice
A(t) =
_
0 1
(1 + k(t)) 0.2
_
correspondant un systme masse-ressort dont le ressort a une raideur va-
riable dans le temps. Si on choisit k(t) = cos(2t)/2, le systme devient in-
stable, alors que pour tout temps t x, la matrice correspond un systme
exponentiellement stable. Une explication intuitive est que si le ressort est
raide la contraction et mou la dilatation, les dplacements de la masse
croissent au lieu de se rduire (voir [62]).
En conclusion, on ne dispose pas de mthode gnrale pour caractriser,
partir des formules donnant A(t), la stabilit du systme direntiel linaire
coecients dpendant du temps
d
dt
x = A(t)x, sauf lorsque dim(x) = 1, bien
sr.
1.2.6 Complments : matrices symtriques et quation
de Lyapounov
On donne ici deux rsultats utiles qui permettent de caractriser les ma-
trices constantes ayant un polynme caractristique Hurwitz.
Thorme 8 (Sylvester). Une matrice symtrique de /
n
(R) est dnie po-
sitive si et seulement si tous ses mineurs principaux sont strictement positifs.
Le thorme suivant est souvent utilis pour construire une fonction de
Lyapounov V (dnition B) dun systme linaire asymptotiquement stable
(P sert pour exhiber V (x) = x
T
Px)
Thorme 9 (quation de Lyapounov). Soit A une matrice et Q une ma-
trice symtrique dnie positive. Si A est Hurwitz (stable), alors il existe
une matrice symtrique dnie positive P solution de lquation suivante,
quation dite de Lyapounov
A
T
P + PA = Q (1.15)
Rciproquement, sil existe des matrices symtrique dnies positives P et Q
telles que (1.15) est vrie, alors A est Hurwitz (stable).
30 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
1.3 Stabilit des systmes non linaires
1.3.1 tude au premier ordre
Les notions de stabilit de la Section 1.1.3 sont, dans le cadre non li-
naire, locales. Autour dun point dquilibre, les quations non linaires de
la dynamique sont proches de leur dveloppement limit. Il est naturel de
se demander quelle information peut tre dduite dun tel dveloppement au
premier ordre.
Comme nous lavons voqu la Section 1.1, un systme non linaire peut
avoir plusieurs points dquilibre isols. Autour de chacun de ces quilibres,
les quations peuvent admettre des systmes linariss tangents trs di-
rents et donc localement des proprits direntes. On pourra se reporter
lexemple suivant.
Exemple 7. Le systme suivant
d
dt
x
1
= a
1
x
1
x
2
x
1
+ a
2
d
dt
x
2
= x
2
+ x
2
1
possde, suivant les valeurs des paramtres a
1
, a
2
, un portrait de phase trs
intressant. Il est tudi en dtail dans [54]. Il sagit en fait dun simple sys-
tme linaire
d
dt
x = a
1
x+u+a
2
o on choisit une commande proportionnelle
u = kx dont le gain k varie (de manire adaptative
8
) selon lquation dif-
frentielle
d
dt
k = k + x
2
. Lide est que tant que le x na pas converg vers
zro, le gain k augmente de telle sorte que la commande entrane eective-
ment le systme vers zro. La convergence espre de x tant exponentielle,
la croissance de k devrait tre limite. On peut montrer que ce nest pas le cas
si le paramtre a
2
,= 0. On a reprsent sur la Figure 1.8, le portrait de phase
du systme pour a
1
= 3 , a
2
= 1.1. Comme cela est montr dans [54], pour
ces valeurs, le systme possde deux foyers stables, un cycle limite instable et
un point selle. Lorsque le systme converge, ce nest pas vers zro.
Daprs le thorme suivant, il est possible de dduire la stabilit asympto-
tique locale dun point dquilibre hyperbolique daprs son linaris tangent.
Dnition 4 (Point dquilibre hyperbolique). Un point dquilibre x de
lquation
d
dt
x = v(x) est dit hyperbolique si les valeurs propres de la matrice
8. La commande adaptative est un domaine scientique riche de lautomatique. On
pourra se rfrer [5].
1.3. STABILIT DES SYSTMES NON LINAIRES 31
4 3 2 1 0 1 2 3 4
0
1
2
3
4
Foyer
Foyer
Point selle
Cycle limite
Figure 1.8 Portrait de phase dun systme avec deux foyers stables, un
point selle et un cycle limite instable.
Jacobienne
v
x
( x) =
_
v
i
x
j
_
1i,jn
sont toutes partie relle non nulle.
Thorme 10 (Stabilit asymptotique locale dun point dquilibre hyper-
bolique (premire mthode de Lyapounov)). Soit R
n
x v(x) R
n
continment drivable par rapport x et x R
n
tel que v( x) = 0. Le point
dquilibre x de
d
dt
x = v(x)
est localement asymptotiquement stable (c.f. Dnition 1) si les valeurs
propres de la matrice Jacobienne
v
x
( x) =
_
v
i
x
j
_
1i,jn
sont toutes partie relle strictement ngative. Le point dquilibre x est
instable au sens de Lyapounov si au moins lune des valeurs propres de la
matrice Jacobienne
v
x
( x) est partie relle strictement positive.
Il est important de bien comprendre ce rsultat. On commence par crire
un dveloppement limit autour de x
d
dt
x =
d
dt
(x x) = v(x) = v( x) +
v
x
( x)(x x) + (x x)
32 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
o (x x) rassemble les termes dordres suprieurs. On ne considre que les
termes dordre 1 en = x x pour en dduire le systme direntiel linaire
coecients constants (A ne dpend pas du temps) suivant
d
dt
= A
avec (t) R
n
et A =
v
x
( x) la matrice Jacobienne de v en x. On sait,
daprs le Thorme 4, que toutes ses solutions convergent vers 0 lorsque
les valeurs propres de A sont toutes partie relle strictement ngative. Le
Thorme 10 nonce que, si le systme linaire du premier ordre est asymp-
totiquement stable, alors les termes dordre suprieur ne peuvent pas tre
dstabilisateurs pour des conditions initiales proches de lquilibre. La preuve
de ce rsultat est reproduite un peu plus loin. Elle utilise la seconde mthode
de Lyapounov, un autre outil pour montrer la stabilit dun point dquilibre
qui sinspire la notion dnergie et de dissipation. Nous dveloppons cette
mthode maintenant.
1.3.2 Fonctions de Lyapounov
titre dintroduction, reprenons lexemple 2 de loscillateur harmonique
amorti et considrons la fonction
V (x
1
, x
2
) =

2
2
(x
1
)
2
+
1
2
(x
2
)
2
qui nest autre que son nergie totale. Un calcul simple montre que pour
t (x
1
(t), x
2
(t)) solution de (1.9), on a
d
dt
(V (x
1
(t), x
2
(t))) =
V
x
1
d
dt
x
1
+
V
x
2
d
dt
x
2
Or
d
dt
x
1
= x
2
et
d
dt
x
2
= 2x
2

2
x
1
. Donc
d
dt
V = 2(x
2
)
2
0
Ainsi, t V (x
1
(t), x
2
(t)) est une fonction dcroissante, comme elle est po-
sitive, elle converge vers une valeur positive. Il est intuitif de penser que
d
dt
V converge vers 0 et donc que x
2
converge vers 0. Mais si x
2
converge
vers 0, il est aussi intuitif de penser que sa drive converge aussi vers 0.
Or,
d
dt
x
2
= 2x
2

2
x
1
et donc x
1
tend vers 0 aussi. Le raisonnement
ci-dessus nest pas trs rigoureux mais il est correct car on a aaire des
1.3. STABILIT DES SYSTMES NON LINAIRES 33
fonctions du temps V, x
1
, x
2
, .... uniformment continues, c.--d. dont le mo-
dule de continuit en t ne dpend pas de t
9
. Cette continuit uniforme vient
du fait que, comme V est dcroissante le long des trajectoires et que V est
inni quand x
1
ou x
2
tend vers linni, les trajectoires sont ncessairement
bornes et donc sont des fonctions uniformment continues du temps. En
eet, leurs drives en temps sont uniformment bornes. Or, un lemme clas-
sique danalyse (lemme de Barbalat) dit que, si lintgrale
_
t
0
h(s)ds dune
fonction uniformment continue h de [0, +[ dans R est convergente pour t
tendant vers linni, alors cette fonction h admet 0 comme limite en t = +.
Comme V (t) V (0) =
_
t
0
d
dt
V on sait que
d
dt
V converge vers 0 et comme
d
dt
V (t)
d
dt
V (0) =
_
t
0
d
2
dt
2
V ,
d
2
dt
2
V converge aussi vers 0. Ce qui nous donne
que x
2
et x
1
convergent vers 0. En fait, nous aurions pu faire le raisonne-
ment lidentique pour un systme gnral pour peu que nous disposions
dune fonction V , innie linni (on dira non borne radialement), borne
infrieurement et dcroissante le long de toute trajectoire.
Il est remarquable que dans ces calculs nous nayons jamais eu besoin
dexpliciter la loi horaire des trajectoires t x
1
(t) et t x
2
(t). Cest la
force des fonctions V dites de Lyapounov : elles fournissent des informa-
tions prcieuses sur les solutions dquations direntielles sans requrir la
connaissance prcise des lois horaires.
Un lecteur ayant compris ce qui prcde naura pas de dicult mon-
trer le rsultat suivant. Des variantes de ce thorme sont donnes dans
lAnnexe B.
Thorme 11 (Invariance de LaSalle). Soit R
n
un ouvert non vide.
x v(x) R
n
une fonction continment drivable de x. Soit x
V (x) R une fonction relle continment drivable de x . On suppose
1. quil existe c R tel que le sous-ensemble 1
c
= x [ V (x) c de
R
n
soit un compact (ferm born dans R
n
) non vide.
2. que V dcrot le long des trajectoires de
d
dt
x = v(x), c.--d. , pour tout
x 1
c
,
d
dt
V (x) = V (x) v(x) =
n

i=1
V
x
i
(x) v
i
(x) 0
Alors, pour toute condition initiale x
0
1
c
, la solution de
d
dt
x = v(x) reste
dans 1
c
, est dnie pour tout temps t > 0 (pas dexplosion en temps ni) et
9. Une fonction R t h(t) R
n
est dite uniformment continue si pour tout > 0,
il existe > 0 indpendant de t, tel que |h(t +) h(t)| pour tout t R.
34 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
converge vers le plus grand sous-ensemble invariant inclus dans
_
x 1
c
[
d
dt
V (x) = 0
_
.
Une fonction V de lespace dtat valeur relle qui dcrot le long de
toutes les trajectoires, i.e., telle que
d
dt
V 0 est dite fonction de Lyapounov.
Un ensemble c R
n
est dit invariant si, et seulement si, les solutions de
d
dt
x = v(x) dont les conditions initiales appartiennent c, restent dans c
pour les temps t o elles sont dnies. Ainsi, lensemble invariant dont il est
question dans le thorme 11 est caractris par le systme sur-dtermin de
n + 1 quations
d
dt

1
= v
1
()
.
.
.
d
dt

n
= v
n
()
n

i=1
V
x
i
() v
i
() = 0
et n inconnues (
1
(t), . . . ,
n
(t)) 1
c
qui sont des fonctions continment dri-
vables de t. Pour rsoudre ce systme, i.e., obtenir les quations de lensemble
invariant de LaSalle, il sut de driver un certain nombre de fois la dernire
quation et de remplacer, chaque nouvelle drivation en temps, les
d
dt

i
par
v
i
(). On obtient ainsi une famille dquations portant uniquement sur qui
caractrise cet ensemble limite qui attire les trajectoires initialises dans 1
c
:
cest un attracteur.
Dans le cas o x 1
c
est un point dquilibre, v( x) = 0, il est clair
que (t) = x est une solution du systme sur-dtermin prcdent et donc x
appartient cet ensemble limite. Si, maintenant, x est lunique solution de
ce systme sur-dtermin, alors on est sr que les trajectoires du systme qui
dmarrent dans 1
c
convergent toutes vers x.
Si maintenant, on suppose dans le thorme 11 que le paramtre c R
peut tre choisi aussi grand que lon veut, alors dune part, V tend vers
+ quand |x| tend vers linni c.--d. que V est non borne radialement
et, dautre part, toute trajectoire x(t) est borne pour les temps t > 0 car
contenue dans 1
c
avec c = V (x(0)). Enn, si on suppose en plus que le
point dquilibre x est lunique solution = x du systme sur-dtermin ci-
dessus, alors toutes les trajectoires convergent vers lquilibre x qui est dit
globalement asymptotiquement stable.
1.3. STABILIT DES SYSTMES NON LINAIRES 35
Figure 1.9 Forme gnrale de la fonction v.
Exemple 8. Considrons un systme scalaire, dim(x) = 1, de la forme
d
dt
x = v(x(t))
o v (fonction Lipschitz) satisfait les deux proprits suivantes :
1. pour tout x ,= 0 on a xv(x) < 0
2.
_
+
0
v(x)dx = , et
_
0

v(x)dx = +
La forme gnrale de v est donne sur la Figure 1.9. Une fonction candidate
tre de Lyapounov est
V (x) =
_
x
0
v()d
Par construction, daprs le point 1, V est continue et possde une drive
continue. On a
d
dt
V (x) = v(x)
2
Donc, pour tout x,
d
dt
V (x) 0. Enn, daprs le point 2, V (x) +lorsque
[x[ +. Daprs le Thorme 11, on peut prendre pour c nimporte quelle
valeur positive. Comme
d
dt
V = 0 implique x = 0, on en dduit que 0 est
globalement asymptotiquement stable. titre dexemple, on obtient, par ce
raisonnement, la stabilit asymptotique de lorigine pour le systme
d
dt
x = x sinh x
alors quen considrant le linaris tangent autour de 0, on ne peut pas
conclure (le point dquilibre 0 ntant pas hyperbolique).
Montrons en quoi la preuve du Thorme 10 repose sur le Thorme 11
dinvariance de LaSalle. Avec les notations du Thorme 10, considrons un
36 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
point dquilibre x. On suppose que les valeurs propres du linaire tangent,
c.--d. les valeurs propres de la matrice Jacobienne A =
_
v
i
x
j
( x)
_
1i,j,n
sont
toutes partie relle strictement ngative. Il nous faut construire une fonc-
tion de Lyapounov V autour de x. On sait que exp(tA) est une matrice qui
converge exponentiellement vers 0 quand t tend vers +(voir Proposition 2).
On pose
P =
_
+
0
exp(sA
T
) exp(sA) ds
o A
T
est la transpose de A. Par cette construction, P est une matrice
symtrique dnie positive. On pose
V (x) = (x x)
T
P(x x).
Ainsi on a
V (x) =
_
+
0
[exp(sA)(x x)]
T
exp(sA)(x x) ds
On a en drivant par rapport au temps sous le signe somme
d
dt
V (x) =
_
+
0
_
[exp(sA)(x x)]
T
exp(sA)v(x) + [exp(sA)v(x)]
T
exp(sA)(x x)
_
ds
car
d
dt
x = v(x). Comme v(x) = A(x x) + o(|x x|), on a
d
dt
V (x) =
_
+
0
[exp(sA)(x x)]
T
exp(sA)A(x x) ds
+
_
+
0
[exp(sA)A(x x)]
T
exp(sA)(x x) ds + o(|x x|
2
)
Ainsi,
d
dt
V (x) = (x x)
T
Q(x x) + o(|x x|
2
)
avec la matrice symtrique Q, dnie par lintgrale
Q =
_
+
0
_
[exp(sA)A]
T
exp(sA) + [exp(sA)]
T
exp(sA)A
_
ds
Comme
d
ds
exp(sA) = exp(sA)A (voir Proposition 1), on a
d
ds
_
(exp(sA))
T
exp(sA)

= [exp(sA)A]
T
exp(sA) + [exp(sA)]
T
exp(sA)A
1.3. STABILIT DES SYSTMES NON LINAIRES 37
et donc lintgrale dnissant Q se calcule explicitement, pour donner sim-
plement
Q =
_
(exp(sA))
T
exp(sA)

s=+
s=0
= I
o I est la matrice identit de taille n. Ainsi, on a
d
dt
V (x) = |x x|
2
+ o(|x x|
2
)
Donc
d
dt
V 0 pour x assez proche de x et ne sannule quen x = x. Le
Thorme 11 avec c > 0 assez petit permet alors de conclure : le point
dquilibre x est localement asymptotiquement stable.
Ainsi, lorsque les valeurs propres au point dquilibre x de
d
dt
x = v(x)
sont toutes partie relle ngative, des petits carts lquilibre sont natu-
rellement amortis : le systme oublie sa condition initiale et converge vers x.
Le systme nest que transitoirement aect pas une petite perturbation de
conditions initiales.
1.3.3 Robustesse paramtrique
Imaginons que les quations dpendent en fait de paramtres nots p =
(p
1
, . . . , p
r
) R
r
plus ou moins bien connus :
d
dt
x = v(x, p), avec v fonction
continment drivable par rapport x et p. On suppose que, pour une valeur
nominale du paramtre p, le systme admet un point dquilibre x, v( x, p) = 0
et que les valeurs propres du systme linaris tangent en ce point x sont
toutes partie relle strictement ngative. Quen est-il des systmes voisins
obtenus pour des valeurs de p proche de p ? En fait, pour p proche de p,
d
dt
x =
v(x, p) admet aussi un point dquilibre (p) qui dpend continment de p,
v((p), p), ( p) = x. De plus, les valeurs propres en (p) sont toutes partie
relle strictement ngative. Ainsi, qualitativement, le systme ne change pas
de comportement lorsquon bouge un peu les paramtres : localement autour
de x, les trajectoires convergent vers un point dquilibre unique qui reste
proche de x. La situation est dite robuste au sens o elle ne change que trs
peu lorsque lon bouge un peu la condition initiale et les paramtres.
Lexistence de (p) rsulte en fait du thorme des fonctions implicites.
Le point dquilibre est dni implicitement par v(x, p) = 0 ; pour p = p on
a une solution x; pour cette solution x, la matrice Jacobienne
v
i
x
j
( x, p) est
inversible (pas de valeur propre nulle puisquelles sont toutes par hypothse
partie relle strictement ngative) ; v dpend continment de p. Le fait que
les valeurs propres en (p) restent partie relle strictement ngative, vient
du fait que les valeurs propres dune matrice dpendent de faon continue de
38 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
ses coecients
10
.
1.3.4 Complments : caractre intrinsque des valeurs
propres du systme linaris tangent
Les valeurs propres du linaire tangent associ un quilibre sont des
nombres intrinsques, i.e. ils ne dpendent pas des systmes de coordonnes x.
Lorsque quon pose
d
dt
x = v(x), on considre un jeu particulier de variables
pour crire les quations du systme. Ici, on a choisi, pour reprsenter notre
systme les variables (x
1
, . . . , x
n
) R
n
. Ce choix est clairement arbitraire :
on pourrait tout aussi bien prendre dautres variables, par exemple les va-
riables z = (z
1
, . . . , z
n
) dnies par une correspondance bi-univoque avec les
variables x : z = (x) et x = (z) o les fonctions et sont des appli-
cations inverses lune de lautre. Par exemple, pour reprer un point dans la
plan on doit dnir un jeu de deux nombres. On peut prendre les coordon-
nes cartsiennes avec labscisse et lordonne mais on peut aussi prendre les
coordonnes polaires avec un angle et la distance lorigine. Il est vident
que les rsultats de nature qualitative ne doivent pas dpendre du choix des
variables. Cest bien le cas de la proprit de stabilit.
Si dans les variables x, la dynamique scrit
d
dt
x = v(x) et quelle admet
un point dquilibre x asymptotiquement stable, alors dans les variables z,
les quations vont bien-sr changer, mais le point dquilibre x aura son
correspondant z via les transformations inversibles et , et z sera bien-
sr lui aussi asymptotiquement stable. Supposons les transformations et
rgulires (diomorphismes continment drivables). Alors, les quations
dans les variables z se dduisent de celles dans les variables x par un simple
calcul de fonctions composes
d
dt
x =
d
dt
(z) =
_

z
_
d
dt
z = v((z))
Ainsi,
d
dt
z = w(z) =
_

z
_
1
v((z))
Comme v( x) = 0, w( z) = 0. Un calcul montre alors que la matrice Jacobienne
de v en x est semblable celle de w en z

z
( z)
w
z
( z) =
v
x
( x)

z
( z)
10. On na pas en gnral de dpendance plus rgulire que C
0
: prendre par exemple
_
0 1
p 0
_
avec p proche de 0 ; les valeurs propres sont

p.
1.3. STABILIT DES SYSTMES NON LINAIRES 39
car

z
( z) est une matrice inversible. Il sut de driver par rapport z la
relation

z
(z) w(z) = v((z))
et de remarquer, puisque w( z) = 0, quil nest pas utile de calculer la drive
seconde

2

z
2
car elle est en facteur de w( z). Ainsi les valeurs propres obtenues
avec les variables x sont les mmes que celles obtenues avec les variables z.
Le spectre de la matrice du linaire tangent autour dun point dquilibre
est indpendant du choix des variables que lon choisit pour faire les calculs.
Ces valeurs propres ont pour unit linverse dun temps : ce sont des indica-
teurs intrinsques caractrisant les chelles du systme. On les appelle aussi
exposants caractristiques.
1.3.5 Complments : les systmes dynamiques dans le
plan
Dans bien des cas pratiques, on se trouve confront des systmes de
dimension 2. Il est notable que, dans ces cas, on peut tablir un certain
nombre de rsultats thoriques trs informatifs. Nous les prsentons dans ce
qui suit.
Thorme 12 (Poincar). Le systme autonome plan
d
dt
x = v(x) avec x
R
2
, ne peut admettre que quelques types de rgimes asymptotiques possibles.
tant donne une condition initiale x
0
R
2
, considrons t x(t) la solution
de
d
dt
x = v(x) qui dmarre en t = 0 en x
0
. Alors, pour des temps t 0, on ne
peut avoir que les cas de gure suivants (voir illustrations sur la Figure 1.10) :
1. Si x(t) ne reste pas born, alors soit x(t) explose en temps ni, soit x(t)
nexplose pas en temps ni mais alors x(t) est dni pour tout t > 0 et
lim
t+
|x(t)| = +. En rsum : si la trajectoire nest pas borne
pour les temps positifs, elle converge vers linni en temps ni ou en
temps inni.
2. Si x(t) reste born pour les temps positifs alors elle est dnie pour tout
temps t > 0 et on distingue trois cas :
(a) soit x(t) converge vers un point dquilibre (en temps inni si x
0
nest pas un point dquilibre)
(b) soit x(t) converge vers une trajectoire priodique ( cycle limite)
(c) soit x(t) senroule autour dune courbe ferme du plan forme de
trajectoires qui partent en t = dun point dquilibre et qui
arrive en t = + vers, a priori, un autre point dquilibre (orbite
40 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Figure 1.10 Les quatre comportements asymptotiques possibles pour une
trajectoire dun systme dynamique autonome dni dans le plan.
htrocline si les deux points dquilibres sont dirents et orbite
homocline si les deux points dquilibres sont identiques).
En rsum, lorsque la trajectoire reste borne elle converge soit vers un
point soit vers une courbe ferme du plan, courbe qui est tangente au champs
de vecteurs v(x). Ainsi en dimension 2, on ne peut pas avoir de comporte-
ments asymptotiques trs compliqus : il est dusage de dire quen dimension
deux, il ne peut pas y avoir de chaos. Il faut bien comprendre que cela nest
vrai que pour le plan (sur le tore S
1
S
1
ce nest plus vrai, les trajectoires
peuvent tre partout denses), et que pour les systmes continus autonomes,
i.e., dnis par deux quations direntielles scalaires ne dpendant pas du
temps. Largument essentiel de dmonstration est lunicit des trajectoires.
Dans le plan deux trajectoires ne peuvent se couper sans tre confondues.
Si lon rajoute par exemple une dpendance priodique en temps v(x, t)
v(x, t + 2) alors ce nest plus vrai. Le systme autonome sous-jacent est de
dimension 3 : (x
1
, x
2
, ) R
2
S
1
avec
d
dt
x
1
= v
1
(x
1
, x
2
, ),
d
dt
x
2
= v
2
(x
1
, x
2
, ),
d
dt
= 1.
Ce nest plus vrai non plus avec les systmes discrets mme de dimension
un. Par exemple les solutions de lquation logistique x
k+1
= 4x
k
(1 x
k
) qui
dmarrent en x
0
[0, 1] restent toujours dans [0, 1] mais elles sont partout
denses dans [0, 1]. Pour comprendre ce phnomne il faut tudier des itres
de la formule de rcurrence. On a reprsent les applications correspondantes
sur la Figure 1.11. Les rgimes asymptotiques pour les indices k grands sont
complexes.
Sous une hypothse supplmentaire, on peut spcier la nature de la
limite.
1.3. STABILIT DES SYSTMES NON LINAIRES 41
0 0.2 0.4 0.6 0.8 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Figure 1.11 Premire bissectrice et graphes de la fonction logistique [0, 1]
x f(x) = 4x(1x) [0, 1] et de ses deux premires itres, f f et f f f.
Thorme 13 (Critre de Bendixon). Soit R
2
x v(x) R
2
une fonction
continue et drivable. On suppose que div(v)(x) =
v
1
x
1
(x) +
v
2
x
2
(x) < 0 pour
presque tout x R
2
. Soit t x(t) une solution de
d
dt
x = v(x) qui reste
borne pour les temps t positifs. Alors, sa limite quand t tend vers + est
un point dquilibre, i.e., une solution x R
2
de v( x) = 0.
Ce rsultat nest plus du tout vrai en dimension suprieure deux. Il sut
de prendre le systme chaotique de Lorenz (reprsent sur la Figure 1.12) de
lexemple suivant.
Exemple 9 (Systme de Lorenz).
_

_
dx
1
dt
= s(x
1
+ x
2
)
dx
2
dt
= rx
1
x
2
x
1
x
3
dx
3
dt
= bx
3
+ x
1
x
2
,
avec s = 10, r = 28 et b = 8/3. Toutes les trajectoires sont bornes, la
divergence du champs de vecteurs, s 1 b < 0, et les trajectoires ont
des comportements asymptotiques complexes et encore aujourdhui assez mal
compris.
De la caractrisation des rgimes asymptotiques illustrs sur la Figure 1.10,
on peut montrer directement le rsultat suivant, rsultat utile pour montrer
42 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
10
0
10
20
10
0
10
20
5
10
15
20
25
30
35
40
45
Figure 1.12 Systme chaotique de Lorenz.
lexistence dune orbite priodique (cycle limite) tel quillustre sur la Fi-
gure 1.13.
Thorme 14 (Poincar-Bendixon). Soit R
2
x = v(x) R
2
une fonction
de classe C
1
. On considre le systme dynamique
d
dt
x = v(x). On suppose
quil existe dans le plan un ensemble compact tel que
toute trajectoire ayant sa condition initiale dans reste dans pour
les temps t > 0 ( est positivement invariant).
soit ne contient aucun point dquilibre, soit contient un unique
point dquilibre dont toutes les valeurs propres sont partie relle stric-
tement positive.
alors contient une orbite priodique (cycle limite).
Lide derrire cet nonc est que les trajectoires bornes dans le plan
doivent approcher des orbites priodiques ou des points dquilibre lorsque
le temps tend vers linni. Si ne contient aucun point dquilibre alors il
doit contenir une orbite priodique. Si contient un unique point dquilibre
hyperbolique instable dans toutes les directions, alors au voisinage de ce point,
les trajectoires sont repousses par ce point. Il est alors possible de dnir
une courbe ferme permettant dexclure ce point et de se ramener au cas
prcdent.
1.3. STABILIT DES SYSTMES NON LINAIRES 43
Figure 1.13 Existence dun cycle limite dans un compact positivement
invariant et qui ne comporte quun seul point dquilibre type foyer instable
ou nud instable.
Exemple 10 (Exemple de cycle limite : londe de densit). Un exemple de
cycle limite observ en pratique sur site industriel est donn par londe de
densit. Ce phnomne apparat sur les puits de ptrole activs par gas-lift.
La technique dactivation par gas-lift des puits de ptrole (reliant un rser-
voir situ en profondeur aux installations de surface) permet de produire des
hydrocarbures partir de champs matures. Au dbut de la production dun
puits la pression du rservoir sut frquemment propulser les hydrocarbures
jusqu la surface o le ptrole est rcupr. Cest une phase de production
dite naturelle qui, suivant les caractristiques du rservoir, peut durer de
quelques de nombreuses annes. Malheureusement en expulsant les euents
vers la surface, le rservoir tend se dpressuriser jusqu ntre plus capable
de contrebalancer le poids de la colonne de liquide dans le puits. Il faut alors
recourir des moyens dactivation. Le gaz est inject au fond du puits, il
peut alors tre utilis pour pousser le liquide ou pour sy mler de faon
diminuer la masse volumique moyenne. On peut se reporter la Figure 1.14
pour voir les dirents lments permettant la production (tubing, partie cen-
trale) et linjection de gaz (casing, partie annulaire). On a reprsent sur la
Figure 1.15 le cycle limite observ sur site. Ces oscillations nonlinaires font
sensiblement diminuer le dbit de production et donc la rentabilit du champs
ptrolier (elles concourent galement endommager les installations par les
-coups de pression coups de blier ds linhomognit de lcoulement).
44 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
E
vanne de production
arrive
de gaz
production
de gaz et d'huile
A
B
C vanne
d'injection
casing
D
tubing
dbit d'huile du rservoir
F
rservoir
fond de l'ocan
rservoir
d'hydrocarbures
Figure 1.14 Schma dun puits de ptrole activ par gas-lift.
Comme cela a t mentionn dans la Section 1.1, on constate en pratique une
parfaite rptabilit de ltablissement du cycle limite, et que sa forme (mais
pas sa phase) ne dpend pas des conditions initiales. Il sagit eectivement
dun cycle limite. On pourra se rfrer [65] pour plus de dtails.
Exemple 11 (Les systmes de Linard et leurs cycles limites). On appelle
systme de Linard les systmes de dimension 2 dtat (x,
d
dt
x)
T
d
2
dt
2
x + f(x)
d
dt
x + g(x) = 0
o f et g sont des fonctions C
1
satisfaisant les conditions suivantes
1. f est paire et g est impaire et strictement positive sur R
+
2. La primitive de f nulle en zro F(x) =
_
x
0
f(x)dx est ngative sur un
intervalle 0 < x < a, nulle en a, jamais dcroissante pour x > a et
tend vers + lorsque [x[ .
1.4. SYSTMES MULTI-CHELLES LENTS/RAPIDES 45
0 0.5 1 1.5 2 2.5 3 3.5
0
0.5
1
0 0.5 1 1.5 2 2.5 3 3.5
0
0.5
1
Figure 1.15 Onde de densit dans un puits activ en gas-lift. On peut clai-
rement observer un cycle limite suivi par la pression en tte de tubing (courbe
du haut) et une production par bouchons (courbe du bas) trs dommageable
pour le dbit dhuile produit (donnes normalises TOTAL 2006).
Ces systmes possdent une unique solution priodique. Ce rsultat est connu
sous le nom de thorme de Linard (on pourra se rfrer [12]). Un exemple
de tel systme est loscillateur de Van der Pol
d
2
dt
2
x + (x
2
1)
d
dt
x + x = 0
Ces quations reprsentent un circuit lectrique oscillant rsistance nga-
tive (telle quon peut les reproduire avec des lampes de puissance). Ce circuit
augmente naturellement lamplitude des faibles oscillations tandis quelle at-
tnue celle des oscillations trop fortes. On a reprsent sur la Figure 1.16
le portrait de phases dun oscillateur de Van der Pol. Pour > 0, le cycle
limite prvu par le thorme de Linard est attractif, tandis que lorigine est
un point dquilibre instable. Plus est grand plus les trajectoires convergent
rapidement vers ce cycle limite. La priode laquelle est parcourue de ma-
nire asymptotique le cycle limite est approximativement gale pour grand
(3 2 ln(2)).
1.4 Systmes multi-chelles lents/rapides
Toutes les analyses mathmatiques que nous proposons reposent sur un
modle de la physique du systme que nous avons tudier. Dans ce contexte,
46 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
-2 0 2
-5
-4
-3
-2
-1
0
1
2
3
4
5
Figure 1.16 Oscillations du systme de Van der Pol et attraction du cycle
limite.
toute simplication pralable des quations peut sembler la bienvenue, mais
on peut lgitimement se demander si ces simplications ne risquent pas de
remettre en cause la validit des conclusions quelles ont permis dtablir.
Le systme rel est en gnral nettement plus complexe que la modlisation
quon en fait. Une tendance naturelle est de proposer des modles de plus
en plus compliqus et de fait inextricables, ce qui est, en y rchissant bien
assez facile et ne mne pas trs loin dans la comprhension des phnomnes.
Par exemple, on ne peut pas en gnral mener danalyse thorique de stabi-
lit comme nous lavons fait sur un systme de grande dimension. Il est en
revanche nettement plus dicile de proposer un modle de complexit mini-
male compte tenu des phnomnes que lon souhaite comprendre et contrler.
Le but de cette section est de donner quelques rsultats gnraux sur les sys-
tmes multi-chelles et leur approximation, sous certaines hypothses, par
des systmes moins complexes et ne comportant essentiellement quune
seule chelle de temps. Cest une des voies possibles pour justier la per-
tinence de modles rduits sur lesquels on sait prouver mathmatiquement
des rsultats de stabilit et de robustesse. Les modles plus compliqus, plus
proches en quelque sorte de la ralit au sens platonicien du terme et trs
utile comme modles de simulation, sont alors vu comme des perturbations,
1.4. SYSTMES MULTI-CHELLES LENTS/RAPIDES 47
prenant en compte des dynamiques rapides et donc des phnomnes hautes
frquences, de modles plus simples, de petites dimensions et trs souvent
utiliss en contrle.
1.4.1 Perturbations singulires
Le premier outil que nous prsentons est la thorie des perturbations sin-
gulires. Cette thorie a pour origine ltude des phnomnes de couches
limites dans les coulements prs des parois dun uide avec une faible vis-
cosit. Certaines terminologies en sont directement inspires.
systme lent-rapide systme lent
perturbations
singulires
-
6
0

1
t
x

-
6
0

1
t
x
moyennisation
-
6
0

1
t
x

-
6
0

1
t
x
Figure 1.17 La thorie des perturbations consiste liminer les eets
court terme, t , quils soient asymptotiquement stables ou oscillants, an
de ne conserver que les eets long terme, t 1 (0 < 1).
La thorie des perturbations permet de relier les trajectoires de deux
systmes ayant des espaces dtat de dimensions direntes. Dans ce cadre,
le systme perturb possde un nombre dtats plus grand que le systme
rduit. Plus prcisment, cette thorie vise liminer les eets court terme
et ne conserver que les eets long terme. Cest un outil prcieux pour
la construction de modles rduits rsumant lessentiel des comportements
qualitatifs long terme.
De manire gnrale, on distingue deux cas illustrs par la Figure 1.17 :
premier cas : les eets rapides se stabilisent trs vite et on parle alors
de perturbations singulires, dapproximation quasi-statique, ou encore
dapproximation adiabatique ;
48 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Figure 1.18 Le champs des vitesses est quasi-vertical pour la forme nor-
male de Tikhonov (

).
second cas : les eets rapides ne sont pas asymptotiquement stables
mais restent damplitude borne ; ils sont donc oscillants et lon parle
alors indiremment de moyennisation ou dapproximation sculaire.
Seul le premier cas est abord ici. Le second est trait dans lAnnexe C
lorsque la dynamique rapide est priodique. Les cas plus gnraux o la
dynamique rapide nest pas priodique sont nettement plus diciles for-
maliser : il faut passer par la thorie ergodique des systmes dynamiques
pour obtenir la dynamique lente en prenant des moyennes faisant interve-
nir la mesure asymptotique du rapide : la dynamique rapide est alors vue
comme un bruit haute frquence dont il faut connatre la loi de probabilit
(la mesure asymptotique) qui dpend en gnral des variables lentes.
On considre les systmes continus du type
(

)
_

_
dx
dt
= f(x, z, )

dz
dt
= g(x, z, )
avec x R
n
, z R
p
, o 0 < 1 est un petit paramtre, f et g sont
des fonctions rgulires. Ltat partiel x correspond aux variables dont lvo-
lution est lente (variation signicative sur une dure en t de lordre 1) et z
correspond aux variables dont lvolution est rapide (variation signicative
sur une dure en t de lordre de ). On dit que t correspond lchelle
de temps rapide et t 1 lchelle de temps lente.
1.4. SYSTMES MULTI-CHELLES LENTS/RAPIDES 49
Considrons pour commencer lexemple suivant
11
_

_
d
dt
x = z

d
dt
z = x z
avec 0 < 1. Intuitivement, on voit que x est une variable lente (sa vitesse
est petite et dordre 1), tandis que z est une variable rapide (sa vitesse est
dordre 1/). On a donc envie de dire que z atteint rapidement son point
dquilibre z = x et que, par suite, x volue selon
d
dt
x = x. Cette ide est
fondamentalement correcte ds que les eets rapides sont asymptotiquement
stables.
La situation gomtrique est donne par la Figure 1.18 : pour > 0 assez
petit et localement autour de g(x, z, 0) = 0, les trajectoires du systme sont
quasi-verticales et convergent toutes vers le sous-ensemble de lespace dtat
(sous-varit) donn lordre 0 en par lquation g(x, z, 0) = 0.
Les rsultats ci-dessous justient alors, sous essentiellement lhypothse
de stabilit asymptotique x constant de la dynamique rapide en z,
d
dt
z =
g(x, z, 0), lapproximation des trajectoires du systme perturb (

) par celles
du systme lent (
0
) obtenu en faisant = 0 dans les quations
(
0
)
_
_
_
dx
dt
= f(x, z, 0)
0 = g(x, z, 0)
On nglige ainsi les convergences rapides vers la sous-varit donne approxi-
mativement par les quations statiques g(x, z, 0) = 0. Toute trajectoire du
systme (

) dmarrant en (x, z) est proche, aprs une dure en t de lordre


de , de la trajectoire du systme lent (
0
) dmarrant avec le mme x (pro-
jection selon la verticale, voir Figure 1.18).
Nous voyons que cette approximation saccompagne dune diminution de
la dimension de ltat. En fait, la rduction nest quune restriction une
sous-varit invariante attractive, les quations de cette sous-varit tant
approximativement donnes par g(x, z, 0) = 0. On a le premier rsultat g-
nral suivant (sa dmonstration gure dans [71])
Thorme 15 (Tikhonov). Soit le systme (

). Supposons que
11. Comme autre exemple caractristique citons la cintique chimique o les constantes
de vitesses de certaines ractions peuvent tre nettement plus grandes que dautres (cin-
tiques lentes et cintiques trs rapides).
50 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
H1 lquation g(x, z, 0) = 0 admet une solution, z = (x), avec fonction
rgulire de x telle que la matrice Jacobienne partielle
g
z
(x, (x), 0)
est une matrice dont toutes les valeurs propres sont partie relle stric-
tement ngative (Hurwitz) ; on dit alors que le systme est sous forme
standard ;
H2 le systme rduit
_
dx
dt
= f(x, (x), 0)
x
(t=0)
= x
0
(1.16)
admet une unique solution x
0
(t) pour t [0, T], 0 < T < +.
Alors, pour susamment proche de 0, le systme complet (

) admet une
unique solution (x

(t), z

(t)) sur [0, T] ds que la condition initiale z


0
appar-
tient au bassin dattraction du point dquilibre (x
0
) du sous-systme rapide

d
dt
= g(x
0
, , 0).
De plus on a
lim
0
+x

(t) = x
0
(t) et lim
0
+z

(t) = z
0
(t)
uniformment pour t dans tout intervalle ferm de la forme [a, T] avec a > 0.
Par le Thorme 4, lhypothse H1 implique que, x x, la dynamique
de

d
dt
= g(x, , 0).
est localement asymptotiquement stable autour du point dquilibre (x).
Remarquons aussi que (
0
) scrit ainsi
d
dt
x = f(x, (x), 0)
avec z = (x), la fonction x (x) tant dnie implicitement par g(x, , 0) =
0.
Sans hypothses supplmentaires, lapproximation du Thorme 15 nest
valable, en gnral, que sur des intervalles de temps t de longueur borne T.
Lhypothse supplmentaire, quil convient alors dutiliser pour avoir une
bonne approximation pour tous les temps positifs, concerne le comportement
asymptotique du systme rduit (1.16) : si ce dernier admet un point dqui-
libre dont le linaire tangent est asymptotiquement stable, lapproximation
est alors valable pour tous les temps positifs (pourvu que la condition initiale
x
0
soit dans le bassin dattraction de lquilibre de la dynamique lente).
1.4. SYSTMES MULTI-CHELLES LENTS/RAPIDES 51
Thorme 16 (Prservation de la stabilit). Supposons en plus des hypo-
thses du Thorme 15 que le systme rduit (1.16) admet un point dquilibre
x : f( x, ( x), 0) = 0 et que les valeurs propres de la matrice
_
f
x
+
f
z


x
_
( x,( x),0)
sont partie relle strictement ngative. Alors, pour tout 0 assez proche
de 0, le systme perturb (

) admet un point dquilibre proche de ( x, ( x))


et dont le linaire tangent est asymptotiquement stable.
Preuve Lexistence du point stationnaire pour le systme perturb est lais-
se en exercice (il sut dutiliser le thorme des fonctions implicites pour
g = 0 et ensuite pour f = 0). Quitte faire, pour chaque une translation,
nous supposons que (0, 0) est point stationnaire du systme perturb
f(0, 0, ) = 0, g(0, 0, ) = 0
Notons, pour x proche de 0, z =

(x), la solution proche de 0 de g(x, z, ) =


0. Suite la translation prcdente, on a

(0) = 0. Considrons le change-


ment de variables (x, z) (x, w = z

(x)). Dans les coordonnes (x, w),


le systme perturb admet (x, w) = (0, 0) comme point dquilibre et ses
quations ont la forme suivante
d
dt
x = F(x, w, ),
d
dt
w = G(x, w, )
avec
F(x, w, ) = f(x, w+

(x), ), G(x, w, ) = g(x, w+

(x), )

x
F(x, w, ).
Sa matrice Jacobien en (0, 0) est alors donne par
J

=
_
F
x
(0, 0, )
F
w
(0, 0, )
1

G
x
(0, 0, )
1

G
w
(0, 0, )
_
=
_
A

+ E

_
o
A

=
f
x
(0, 0, ) +
f
z
(0, 0, )

x
(0), B

=
f
z
(0, 0, ), C

x
(0),
D

=
g
z
(0, 0, ), E

x
(0)
f
z
(0, 0, )
On a utilis le fait que g(x, 0+

(x), ) 0 et que F(0, 0, ) = 0. Les matrices


A

, B

, C

, D

et E

dpendent rgulirement de et convergent vers A


0
, B
0
,
52 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
C
0
, D
0
et E
0
quand tend vers 0 avec, par hypothse A
0
et D
0
stables. On
va montrer que pour > 0 assez petit, J

est stable. Soit

et Y

une valeur
propre et vecteur propre de J

. On peut toujours supposer Y

de longueur
1 et que (

, Y

) est continue (les valeurs propres, vecteurs propres


dpendent continment des coecients de la matrice). On dcompose alors
Y

en (X

, W

) selon les coordonnes (x, w). On a alors


A

+ B

, C

+
_
1

+ E

_
W

.
Soit W
0
,= 0 est alors
0
est valeur propre de D
0
donc '(

) < 0 pour > 0


assez petit. Soit W
0
= 0 est alors X
0
,= 0 et avec A
0
X
0
=
_
lim
0
+

_
X
0
on
dduit aussi que pour > 0 assez petit, '(

) < 0.
Ainsi les valeurs propres de J

sont parties relles strictement ngatives


pour > 0 assez petit.
Cette preuve peut tre amliore pour montrer que lapproximation du
Thorme 15 devient valide, localement autour de ( x, ( x)) et pour tous
les temps t positifs, ds que est assez petit (le caractre local tant alors
indpendant de tendant vers zro).
1.4.2 Feedback sur un systme deux chelles de temps
En thorie des systmes, le Thorme 16 est utilis constamment
12
de
la manire suivante. Rajoutons une commande u (

) et supposons,
commande u xe, que les hypothses du Thorme 15 de Tikhonov soient
valables. Ainsi
_
_
_
dx
dt
= f(x, z, u, )

dz
dt
= g(x, z, u, )
(1.17)
avec (x, u) le point dquilibre asymptotiquement stable de la partie rapide
d
dt
= g(x, , u, 0). Le systme lent est alors
dx
dt
= f(x, (x, u), u, 0).
Supposons que nous ayons un retour dtat lent u = k(x) tel que le
systme lent boucl soit asymptotiquement stable autour du point dquilibre
( x, u = k( x)). Alors pour tout > 0 assez petit, le systme perturb (1.17)
avec le bouclage lent u = k(x), admet un point dquilibre hyperbolique proche
de ( x, z = ( x, u)). Cela veut simplement dire que lon peut, pour la synthse
dun bouclage, ignorer des dynamiques asymptotiquement stables et assez
rapides. On parle alors de robustesse par rapport aux dynamiques ngliges.
Noter que le retour dtat ne porte que sur la partie lente, x. Un bouclage
du type u = k(x, z) o z apparat directement est envisageable mais alors il
12. Cest un peu comme Monsieur Jourdain dans le Bourgeois Gentil-Homme de Molire
lorsquil ralise quil parle constamment en prose.
1.4. SYSTMES MULTI-CHELLES LENTS/RAPIDES 53
faut vrier que la dpendance en z de u ne dtruise pas la stabilit de la
dynamique rapide

d
dt
= g(x, , k(x, ), 0)
Cest toujours le cas lorsque g ne dpend pas de u :
g
u
= 0.
1.4.3 Modle de contrle et modle de simulation
Pour les besoins de simulation ou de conception dun rgulateur, on na
pas besoin dutiliser le mme modle. Ainsi il ny a pas de modle universel.
Pour petit il sut, pour concevoir le feedback u = k(x) de prendre par
exemple comme modle, lapproximation lente de (1.17)
d
dt
x = f(x, (x, u), u, 0).
Pour la simulation, il peut cependant tre utile de vrier que le feedback
u = k(x) inject dans les quations (1.17) donne des rsultats proches de
ceux que lon aurait avec le modle lent en boucle ferme
d
dt
x = f(x, (x, k(x)), k(x), 0)
Cela permet de vrier si est assez petit pour que le thorme soit ap-
plicable. En pratique, on remarque que na pas besoin dtre trs petit :
on constate quun rapport de 2 entre les constantes de temps de la dyna-
mique rapide et celles de la dynamique lente donne bien souvent une bonne
approximation. Cela veut dire que = 1/2 est dj petit.
Voyons en dtail la conception dun contrleur. On part dun modle
de contrle issu dune modlisation mme trs grossire du systme pour
dcrire les corrlations entre les entre (u, w) et les mesures y. Ce modle est
le modle dtat
d
dt
x = f(x, u, w, p), y = h(x)
dpendant des paramtres p. On labore partir de ce modle de contrle et
pour une valeur nominale des paramtres p, une loi de contrle sous la forme
dun retour dynamique de sortie (comme lest un contrleur PI )
d
dt
= a(y, , v), u =

k(y, , v)
o v est le nouveau contrle (pour le PI cest la consigne). On est alors sr
du comportement du systme boucl nominal
d
dt
x = f(x,

k(h(x), , v), w, p),


d
dt
= a(h(x), v)
54 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Par exemple, on sait que lorsque les perturbations w et le nouveau contrle
v sont constant, le systme est asymptotiquement stable.
On peut bien sr rsoudre numriquement le systme direntiel ci-dessus
pour vrier que nous ne nous sommes pas tromps dans les choix de

k et
a. On peut aussi, dans une seconde tape, simuler le systme prcdent mais
avec un paramtre p dirent de p, pour vrier que notre contrleur nest pas
trop sensible aux erreurs de paramtres et surtout pour quantier les erreurs
paramtriques au del desquelles le contrleur conduit des comportements
non acceptables. On quantie en simulation la robustesse paramtrique du
contrleur . On voit donc ici que nous avons encore deux modles : le modle
de contrle de paramtre p et le modle de simulation de paramtre p. Les
mthodes usuelles de contrle garantissent alors que pour p assez proche de
p, tout se passe bien : de petites erreurs de paramtres nengendrent que
de petits carts sur les trajectoires. En gnral, il nexiste pas de mthode
simple qui permet de quantier analytiquement les valeurs critiques de p au
del desquelles le systme change de comportement. Cest lobjet de la tho-
rie des bifurcations et des catastrophes, thories mathmatiquement assez
techniques (on pourra se reporter [30]).
Il convient aussi de faire quelques simulations pour quantier la robustesse
du contrleur par rapport des dynamiques ngliges. Le but est en autre de
vrier que les gains ne sont pas irralistes (en gnral trop grands) : pour
simplier, il ne faut pas que, dans les formules servant calculer

k et a, il y
ait de trop grands coecients et/ou de petits diviseurs.
Les dynamiques ngliges sont de trois ordres qualitativement : celles
lies au processus de mesure et donc aux capteurs donnant y ; celles lies au
processus de contrle et donc aux actionneurs assurant des valeurs arbitraires
pour u; celles lies au systme lui-mme, indpendamment des actionneurs
et des capteurs.
Par exemple, on peut associer y et u des premiers ordres avec des
petites chelles de temps
y
> 0 et
u
> 0 pour prendre en compte le fait que
la rponse des capteurs nest pas instantane et que les actionneurs ne sont
pas parfaits. On simule alors le systme tendu
_

_
d
dt
x = f(x, u
m
, w, p)
d
dt
= a(y
m
, v)

y
d
dt
y
m
= h(x) y
m

u
d
dt
u
m
=

k(y
m
, , v) u
m
1.5. CAS DTUDE 55
et on teste pour diverses valeurs
y
et
u
les performances en quantiant les
seuils critiques au del desquels les performances se dgradent notablement
pour conduire des instabilits
13
.
Si, par exemple, on saperoit que la constante de temps
y
que lon avait
nglige au dpart, est en fait trop grande compte tenu des performances
demandes au contrleur, alors il nous faut changer le modle de contrle et
lenrichir avec une partie de la dynamique du capteur. Cela signie quon a
pris comme modle de contrle de dpart, un modle trop grossier, compte
tenu des objectifs.
Il ne faudrait pas en conclure quil faille ds le dpart prendre le modle
le plus complet possible comme modle de contrle. Comme en physique,
il est en fait bien plus ecace de partir dune vision trop synthtique qui
sappuie sur des a priori trs forts mais dont on est conscient
14
. Den dduire
un modle simple et ultra-simpli, dont on sait pertinemment quil est faux
mais dont, si ncessaire, on identiera les faiblesses et que lon corrigera au
bout de quelques itrations de la mthodologie rsume ci-dessus. On aura
alors obtenu un modle de complexit rduite qui reprsentera lessentiel de
la dynamique que lon souhaite contrler.
Moralit : les choses sont dj assez compliques naturellement, gardons
nous de les rendre encore plus obscures et utilisons des modles de complexit
aussi rduite que possible compte tenu des objectifs atteindre.
1.5 Cas dtude : PI et thermostat
Lobjet de cette section est ltude dun rgulateur proportionnel-int-
gral (rgulateur PI ) sur un systme non linaire du premier ordre. On prend
en compte les contraintes sur le contrle u par une gestion du terme int-
gral grce un algorithme danti-emballement (anti-windup en anglais).
Limmense majorit des systmes industriels de contrle sont construits
partir de tels rgulateurs PI lmentaires. Il est donc naturel de les tudier
en dtails.
13. Une autre faon de prendre en compte des dynamiques rapides ngliges consiste
introduire un petit retard de lordre de > 0 en posant, par exemple, y
m
(t) = y(t ).
Comme y
m
= e

d
dt
y on voit que lon est aussi en face dun phnomne de perturbation
singulire (petit paramtre positif multipliant
d
dt
) mais cette fois en dimension innie
dtat. Avec lapproximation e

d
dt

1
1+
d
dt
, y
m
= e

d
dt
y devient y
m
=
1
1+
d
dt
y et on
retrouve le ltre du premier ordre y = y
m
+
d
dt
y
m
.
14. Citons lexemple des calculs perturbatifs de trajectoires spatiales pour lesquels on
remet en cause les hypothses simplicatrices au fur et mesure : trajectoire plane puis
dans lespace, anomalie des potentiels de gravit, non-sphricit des plantes, eets atmo-
sphriques en altitude basse,...
56 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Figure 1.19 Rgulation PI de la temprature sa consigne

avec une
vanne trois voies de position u [0, 1].
Ce cas dtude est aussi loccasion dutiliser un grand nombre des notions
importantes issues de la thorie des quations direntielles ordinaires que
nous avons prsente dans ce chapitre : stabilit asymptotique (voir Dni-
tion 2), relations entre la stabilit et les valeurs propres du systme linaire
tangent autour dun point dquilibre (voir Thorme 10), systmes avec des
chelles de temps trs direntes (voir la Section 1.4), liens avec les cascades
de rgulateurs et robustesse par rapport aux dynamiques ngliges. Nous
ferons aussi appel aux rsultats fondamentaux de Poincar et de Bendixon
(voir Thormes 12 et 13) sur les systmes stationnaires dans le plan. Enn,
nous montrerons lintrt de rajouter la rtro-action PI (feedback) de la
pr-compensation (feedforward) pour anticiper et ainsi mieux grer des tran-
sitoires importants en particulier ceux lis aux changements de consignes.
1.5.1 Prsentation du systme
Considrons un btiment quip dune chaudire. Notre objectif est dajus-
ter la marche de la chaudire en fonction dune consigne de temprature

(librement choisie par un habitant) et dune mesure en temps rel de la tem-


prature ambiante lintrieur du btiment. Intuitivement, si lcart

est positif il convient de baisser la chaudire, dans le cas contraire il convient


de laugmenter. An daranchir lhabitant des incessants ajustements nces-
saires pour que la temprature reste le plus proche possible de la consigne
1.5. CAS DTUDE 57

, une question intressante est : comment faire cela de faon automatique


et able ?
1.5.2 Un rgulateur PI
Comme lillustre la Figure 1.19, lalgorithme usuellement utilis avec une
vanne proportionnelle 3 voies est le suivant. La marche de la chaudire est di-
rectement relie la position de la vanne trois voies note u : pour u = 0, leau
qui arrive des radiateurs ne passe pas par la chaudire et repart directement
avec la mme temprature ; pour u = 1, toute leau arrivant des radiateurs
passe par la chaudire et ressort la temprature de la chaudire
ch
(tem-
prature constante), temprature bien sr nettement plus haute que

; pour
les valeurs intermdiaires de u ]0, 1[, leau qui arrive des radiateurs nest
que partiellement rchaue et repart avec une temprature intermdiaire.
Le rgulateur (thermostat) lectronique qui se trouve dans une pice de vie,
comporte une sonde de temprature . Lhabitant peut xer une temprature
de consigne

. Le rgulateur pilote, via un signal lectrique, la position de la
vanne u.
Lalgorithme usuellement rencontr dans ce type de dquipement est celui
dun rgulateur proportionnel/intgral, rgulateur dit PI, qui scrit, entre
deux instants spars par t > 0,
u
k+1
= K
p
(


k
) + I
k
o u
k+1
est la nouvelle position de la vanne, linstant (k + 1)t, calcule
en fonction de la temprature
k
, de la consigne

et de la valeur dun terme
intgral I
k
linstant kt. La priode dchantillonnage t est de lordre
de la seconde. Le gain proportionnel K
p
est un paramtre positif. Enn, le
terme intgral I
k
se calcule par une rcurrence
I
k+1
= I
k
+ t K
i
(


k
)
o K
i
est le gain intgral . Contrairement u, le terme I est donc gard en
mmoire entre deux calculs successifs. Cest une valeur interne au contrleur
(tat).
En somme, la commande u est calcule rcursivement par lalgorithme
u
k+1
= K
p
(


k
) + I
k
I
k+1
= I
k
+ t K
i
(


k
)
o, en mme temps quon calcule u
k+1
, on met jour le terme intgral I
k+1
pour le calcul suivant (celui de u
k+2
). Tel quel, cet algorithme ne marche pas.
58 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
La raison est brutale mais imparable : u doit rester entre 0 et 1. Or un tel
algorithme ne garantit nullement ces conditions. Pour prendre en compte ces
limitations, on sature u et on obtient lalgorithme modi suivant
u
k+1
= S
at
_
K
p
(


k
) + I
k
_
I
k+1
= I
k
+ t K
i
(


k
)
o S
at
(x) = x si x [0, 1], S
at
(x) = 0 pour x < 0 et S
at
(x) = 1 pour x > 1.
Un tel algorithme ne marche pas non plus. La raison est en plus sophistique.
Imaginons que nous soyons lt par temps de canicule. Dans ce cas sera
toujours nettement suprieur

(une chaudire nest pas un climatiseur) et
donc le terme intgral I deviendra au cours du temps de plus en plus ngatif,
on parle demballement ou windup, u restera du fait de la fonction S
at
0.
la n de lt I aura une valeur ngative trs grande en valeur absolue.
Lorsque les premiers froids arrivent, I sera tellement ngatif que, mme si
descend largement en dessous de la consigne, u restera toujours zro.
Il faudra attendre que I remonte au dessus de K
p
(

) pour avoir enn


un peu de chauage. Cela peut prendre des semaines. On comprend donc
quil faut modier aussi la faon dont on met jour I. On va rajouter un
terme tmoignant de la saturation de la commande. Si u
k+1
ne sature pas,
ce terme sera nul, sinon ce terme cherchera sopposer lemballement dont
on vient de parler. Cest le mcanisme danti-emballement (ou anti-windup)
qui conduit lalgorithme suivant
u
k+1
= S
at
_
K
p
(


k
) + I
k
_
I
k+1
= I
k
+ t
_
K
i
(


k
) + K
s
(u
k+1
K
p
(


k
) I
k
)
(1.18)
avec un gain K
s
choisit assez grand de faon avoir K
s
K
p
> K
i
. Tout rgu-
lateur industriel PI comporte un tel mcanisme danti-windup pour prendre
en compte les contraintes sur le contrle u. Cette version est la bonne, nous
allons ltudier en dtails.
Dans un premier temps, demandons-nous quoi sert le terme (intgral) I
et pourquoi navons nous pas tout simplement considr le rgulateur pro-
portionnel P
u
k+1
= S
at
(K
p
(


k
))
Comme on pourrait le voir par exemple avec des simulations (et conform-
ment lintuition) un tel algorithme a tendance limiter les variations de
temprature . Cependant, en rgime stabilis, il ny a aucune raison pour
que soit gal sa consigne

. Cet algorithme est incapable dassurer, en
rgime stationnaire le fait que rejoigne sa consigne

. En eet si =

alors
u = 0 et donc il ne faut pas chauage : ce qui est certes trs conomique mais
1.5. CAS DTUDE 59
assez inconfortable et compltement idiot. Rapidement, on va sloigner de
ce point qui ne correspond pas une situation dquilibre. En revanche avec
le PI, en rgime stabilis o u reste constant et lintrieur (non strict) des
contraintes 0 et 1 (et o et

restent eux aussi constants) on voit trs simple-
ment que I ne peut tre que constant. En eet, la seconde quation de (1.18)
implique ncessairement =

. Comme on le voit, le terme I garantit que,
si on atteint un quilibre, cest =

. Le terme I annule lerreur statique.
1.5.3 Une modlisation simplie
Si on relve les signaux t u(t) et t (t) sur une priode de temps
assez longue (par exemple une journe), on saperoit quils sont fortement
corrls. La modlisation consiste tablir ces corrlations. On peut par-
tir de telles mesures identier un modle. On peut aussi utiliser les lois de
conservation de la physique. Bien sr, il nest pas question ici dcrire un mo-
dle dtaill prenant en compte un maximum de phnomnes. Notre objectif
consiste rguler une temprature moyenne, telle que mesure par une seule
sonde, en utilisant un seul actionneur (la chaudire). Si, en revanche, on sin-
tresse la temprature en dirents points, son inhomognit spatiale,
on aura recours des modles plus sophistiqus tels que ceux utiliss pour
la simulation ne des transferts thermiques.
Dans notre situation, nous avons besoin dun modle minimal nous per-
mettant de comprendre pourquoi un rgulateur PI fonctionne
15
, et ce sans
avoir besoin de rgler de faon trs pointue les gains K
p
et K
i
. Ce modle
sera bien-sr grossier et donc faux. En dautres termes, il ne reprsentera
quune vision en rduction de la ralit physique. Il ne prendra en compte
que des eets moyens en espace et en temps, moyennes relatives aux chelles
qui nous intressent. Ici lchelle spatiale est dnie par la taille du btiment,
alors que lintervalle temporel le plus court pris en considration est la demi-
heure. Un tel modle simpli a limmense avantage dclaircir lanalyse :
de bien cerner les congurations pour lesquelles lalgorithme PI fonctionne ;
de bien cerner aussi les cas o des instabilits (oscillations, pompages, ...)
peuvent apparatre pour donner des pistes de solutions et ainsi traiter ces
dicults.
15. Il faut savoir que pour limmense majorit des installations domestiques, un algo-
rithme PI pilotant une vanne 3 voies donne entirement satisfaction avec quelques rglages
standards pour K
p
et K
i
choisis selon la taille et linertie thermique de linstallation.
60 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Figure 1.20 Modlisation simplie avec un seul compartiment de temp-
rature uniforme qui change de la chaleur avec lextrieur de temprature

ext
et avec les radiateurs de temprature
rad
dont une fraction de leau
u [0, 1] passe par la chaudire et ressort la temprature sortie chaudire

ch
.
1.5.4 Passage en temps continu
Nous allons raisonner en temps continu pour suivre la formulation habi-
tuelle des lois de conservation de la physique.
Avec
d
dt
I

k

I
k+1
I
k
t
, on obtient la version en temps continu de (1.18)
_
_
_
u(t) = S
at
(K
p
(

(t)) + I(t))
d
dt
I(t) = K
i
(

(t)) + K
s
(u(t) K
p
(

(t)) I(t)).
(1.19)
Pour construire un modle reliant la position de la vanne u et la temp-
rature , nous allons faire, en accord avec notre choix des chelles de temps
et despace, les hypothses simplicatrices illustres sur la Figure 1.20.
On suppose le btiment homogne en temprature . Il change des ca-
lories avec les radiateurs de temprature uniforme
rad
, et avec lextrieur
dont la temprature est
ext
. En notant
rad
> 0 et
ext
> 0, les coe-
cients dchanges thermiques avec les radiateurs et lextrieur, le bilan global
dnergie donne le modle suivant
MC
p
d
dt
=
rad
(
rad
) +
ext
(
ext
)
o M est la masse du btiment, C
p
sa capacit calorique spcique (J/kg/K).
Nous pouvons faire un bilan thermique stationnaire autour des radiateurs en
supposant que le ux de chaleur perdue par les radiateurs
rad
(
rad
) est
instantanment compens par la chaudire via la fraction du dbit deau des
radiateurs qui passe par la chaudire et en ressort la temprature
ch
. Cela
1.5. CAS DTUDE 61
donne la relation statique suivante
u(
ch

rad
) =
rad
(
rad
)
o > 0 est un coecient donn.
On peut alors calculer
rad
comme barycentre de
ch
et , avec des coef-
cients tant fonction de u

rad
=
u
u +
rad

ch
+

rad
u +
rad

Ainsi, nous obtenons le modle suivant


MC
p
d
dt
=
u
rad
u +
rad
(
ch
) +
ext
(
ext
) (1.20)
1.5.5 Simulations en boucle ouverte et en boucle ferme
On va utiliser les notations qui suivent
x est ltat du systme, i.e. les grandeurs satisfaisant des quations
direntielles. Ici x = .
y = h(x) est la partie de ltat qui est mesure (sortie), ici y = x, on
mesure tout ltat.
u reprsente les contrles (commandes), i.e., les variables dentre quon
peut choisir comme on le souhaite.
w dsigne les perturbations, i.e., les variables dentre quon ne peut
pas choisir car elles sont imposes par lenvironnement ; ici w =
ext
(t).
p est un ensemble de paramtres constants apparaissant dans le modle
(ce sont des entres particulires qui sont des constantes) : ici p =
(,
rad
,
ext
, MC
p
).
Ces notations nous permettent dcrire le modle sous la forme dtat
d
dt
x = f(x, u, w, p), y = h(x)
o f et h sont des fonctions issues de la modlisation; ici
f(x, u, w, p) =
u
rad
(MC
p
)(u +
rad
)
(
ch
) +

ext
MC
p
(
ext
), h(x) = x
La simulation dun tel systme consiste rsoudre numriquement lqua-
tion direntielle
d
dt
x = f(x, u, w, p) partir dune condition initiale x(0) =
x
0
, dun scnario de perturbations t w(t) donn lavance et de certaines
valeurs des paramtres p. Les valeurs du contrle sont galement requises.
62 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Lorsque le contrle est une loi horaire donne lavance t u(t), on parle
de simulation en boucle ouverte. Lorsque le contrle u est au contraire calcul
en fonction de x ou de y (i.e. par bouclage dtat ou de sortie), on parle de
simulation en boucle ferme.
Le contrle u donn par (1.19) fait apparatre une quation direntielle
avec un tat I, cest un bouclage dynamique. Pour calculer lvolution de
la temprature, il faut aussi xer la condition initiale I
0
sur ltat suppl-
mentaire I. Enn, pour simuler, il faut aussi se donner le scnario pour la
consigne de temprature t

(t) et connatre les paramtres K
p
, K
i
et K
s
de rglage du rgulateur.
Considrons une simulation en boucle ferme. Le modle correspondant
est
_
_
_
d
dt
(t) =
u(t)
rad
(MC
p
)(u(t)+
rad
)
(
ch
(t)) +

ext
MC
p
(
ext
(t))
d
dt
I(t) = K
i
(

(t)) + K
s
(u(t) K
p
(

(t)) I(t))
avec u(t) = S
at
(K
p
(



(t) + I(t))
(1.21)
avec w = (
ext
,
ch
) constant. Si on choisit des gains K
p
> 0, K
i
> 0 et
K
s
> 0 tels que K
s
K
p
> K
i
, on constate que les trajectoires t ((t), I(t))
convergent toutes vers le mme point, indpendamment de leur condition
initiale. Ce point est donc globalement asymptotiquement stable. Le contrle
u(t) converge vers une valeur u dans [0, 1]. De plus, si 0 < u < 1 alors
ncessairement la limite de (t) est la consigne

.
Avec ces rglages, on na pas besoin de connatre prcisment les valeurs
des coecients dchanges thermiques ni celles de linertie thermique du b-
timent ni la valeur de la temprature extrieure. Par ces simulations, on se
rend donc compte quavec un algorithme de contrle lmentaire de type
PI, il est possible de contrler la temprature dune trs large gamme de
btiments dont les transitoires thermiques peuvent tre dcrits de faon ap-
proximative par une quation bilan du type de celle construite ci-dessus. En
fait, nous allons voir que cette constatation exprimentale correspond un
rsultat gnral.
Considrons un systme avec un tat de dimension 1. Il sut que
d
dt
x =
f(x, u, w, p) soit une fonction dcroissante de x = et croissante de u pour
quun tel rgulateur fonctionne.
1.5. CAS DTUDE 63
1.5.6 Un rsultat gnral : rgulateur PI sur un systme
non linaire du premier ordre
Rsultat
On considre le systme (mono-dimensionnel) du premier ordre
d
dt
x = f(x, u) (1.22)
dtat x(t) R avec le contrle scalaire u(t) R soumis aux contraintes
u [u
min
, u
max
] (u
min
< u
max
). On suppose que R [u
min
, u
max
] (x, u)
f(x, u) R est une fonction continue et drivable par morceaux. Les seules
informations que nous avons sur notre modle, i.e. sur f, sont de nature
qualitative : pour tout (x, u) R [u
min
, u
max
],
f
x
(x, u) 0 et
f
u
(x, u) > 0
On suppose en outre quil existe un rgime stationnaire respectant stricte-
ment les contraintes sur le contrle : il existe ( x, u) R]u
min
, u
max
[ tel que
f( x, u) = 0.
Nous allons montrer que le rgulateur PI avec anti-emballement
u = S
at
[K
p
( x x) + I] ,
d
dt
I = K
i
( xx)+K
s
(u K
p
( x x) I) (1.23)
o la fonction saturation S
at
est dnie par
R u S
at
(u) =
_
_
_
u
min
, si u u
min
;
u, si u
min
u u
max
;
u
max
, si u
max
u.
(1.24)
rend le point dquilibre ( x, u) globalement asymptotiquement stable pour le
systme dtat tendu (x, I) ds que ses gains, K
p
le gain proportionnel, K
i
le gain intgral et K
s
le gain danti-emballement, vrient
K
p
> 0, K
i
> 0, K
s
> 0, et K
s
K
p
K
i
Dynamique tudier
Nous cherchons montrer la stabilit asymptotique globale du point
dquilibre ( x, u). Nous cherchons donc tablir que, pour toute condition
initiale (x
0
, I
0
), la solution t (x(t), I(t)) du systme boucl
d
dt
x = f (x, S
at
[K
p
( x x) + I])
d
dt
I = K
i
( x x) + K
s
(S
at
[K
p
( x x) + I] K
p
( x x) I)
(1.25)
64 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Figure 1.21 Le rectangle R

est positivement invariant car le champs de


vecteurs X F(X) pointe vers lintrieur lorsque X = (x, I) parcourt le
bord de R

.
existe pour tout temps t 0 et que sa limite quand t tend vers +est ( x, u).
Dans tout ce qui suit, nous considrons ltat tendu X = (x, I) et r-
crivons (1.25) sous la forme
d
dt
X = F(X). La fonction F : R
2
R
2
est une
fonction continue et drivable par morceaux de X. On note aussi

X = ( x, u)
le point dquilibre de F : F(

X) = 0.
Les trajectoires sont bornes
Nous allons montrer que les trajectoires du systme (1.25) restent bornes
pour t > 0. Elles seront donc automatiquement dnies pour tout temps t >
0. Pour cela nous allons considrer le plan de phases X = (x, I) et construire
une famille de rectangles embots les uns dans les autres. Chacun de ces
rectangles est positivement invariant par la dynamique (voir Dnition 22) :
si la condition initiale appartient lintrieur dun de ces rectangles alors il
est impossible la trajectoire den sortir. Pour tablir ce point, il sut de
regarder la direction du vecteur vitesse F(X) quand X parcourt le bord du
rectangle : si F(X) pointe constamment vers lintrieur, alors il est impossible
de sortir du rectangle en intgrant selon les temps positifs. Lexistence de ces
ensembles repose sur les hypothses dj voques K
p
> 0, K
i
> 0, K
s
> 0,
K
s
K
p
K
i
, f croissante par rapport u et dcroissante par rapport x.
La fonction S
at
qui intervient dans (1.24) conduit un dcoupage en trois
zones du plan de phases (x, I) (voir Figure 1.21) selon la position de K
p
( x
1.5. CAS DTUDE 65
x)+I par rapport u
min
et u
max
: les deux zones satures K
p
( xx)+I u
max
et K
p
( xx)+I u
min
et la zone sans saturation u
min
K
p
( xx)+I u
max
.
Posons L = max(u
max
u, u u
min
) > 0. Comme reprsent sur la Fi-
gure 1.21, considrons, pour L, le rectangle R

de centre ( x, u), de cots


parallles aux axes et coupant laxe des x en x/K
p
et laxe des I en u.
tudions maintenant, en dtaillant ses composantes F
x
et F
I
, la direction,
pour (x, I) sur le bord de R

, du vecteur tangent la trajectoire


F(x, I) =
_
F
x
(x, I) = f (x, S
at
[K
p
( x x) + I])
F
I
(x, I) = K
i
( x x) + K
s
(S
at
[K
p
( x x) + I] K
p
( x x) I)
_
(cot horizontal suprieur) pour I = u+ et x [ x/K
p
, x+/K
p
],
on voit que F
I
(x, u + ) 0 ; en eet si x [ x /K
p
, x] on a
F
I
=
0
..
(K
i
K
s
K
p
)
0
..
( x x) +K
s
0
..
(u
max
u ) 0;
si x [ x, x + ( u + u
max
)/K
p
] on a
F
I
= K
i
0
..
( x x) +K
s
0
..
(u
max
u K
p
( x x)) 0;
si x [ x + ( u + u
max
)/K
p
, x + /K
p
] on a
F
I
= K
i
0
..
( x x) 0
Ainsi, le vecteur F =
_
F
x
F
I
_
pointe vers le bas le long du cot hori-
zontal suprieur.
(cot vertical droit) pour x = x+/K
p
et I [ u, u+] on voit que
F
x
( x + /K
p
, I) 0;
en eet si I [ u , u
min
+ ] on a
F
x
= f( x + /K
p
, u
min
) f( x, u
min
) f( x, u) = 0
car
f
x
0 et
f
u
> 0 ; si I [u
min
+ , u + ] on a de mme
F
x
= f( x + /K
p
, I ) f( x, I ) f( x, u) = 0
Ainsi, le vecteur F pointe vers la gauche le long du cot vertical droit.
66 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
On dmontre, de la mme faon, que F pointe vers le haut le long du cot
horizontal infrieur et pointe vers la droite le long du cot vertical gauche.
En conclusion, pour tout L, le vecteur tangent la trajectoire F(X)
pointe vers lintrieur du rectangle R

. Cet ensemble est donc positivement


invariant.
Prenons maintenant une condition initiale X
0
= (x
0
, I
0
) arbitraire. Il
existe toujours au moins un
0
(il sut de le prendre assez grand en fait)
pour que X
0
soit lintrieur de R

0. Ainsi, la solution de
d
dt
X = F(X) avec
X(0) = X
0
reste dans R

0 pour tout temps positif : elle est donc dnie pour


tout temps t > 0 et reste borne.
Stabilit asymptotique
Nous cherchons maintenant tudier la convergence des trajectoires. On
suppose que lquilibre ( x,

I) rside strictement lintrieur des contraintes,
c.--d.
u
min
<

I = u < u
max
Pour (x, I) autour de ( x,

I), le systme scrit
_

_
d
dt
x = f (x, K
p
( x x) + I)
d
dt
I = K
i
( x x)
(1.26)
Le calcul du linaire tangent fait apparatre la matrice Jacobienne suivante
_
f
x

( x, u)
K
p
f
u

( x, u)
f
u

( x, u)
K
i
0
_
(1.27)
La trace de cette matrice 2 2 est strictement ngative car K
p
> 0, K
i
> 0,
f
x
0 et
f
u
> 0 par hypothse. Son dterminant est strictement positif
pour les mmes raisons. Donc ses deux valeurs propres sont partie relle
strictement ngative. Ainsi, quels que soient les choix de K
p
> 0 et K
i
> 0, le
linaire tangent est toujours localement asymptotiquement stable (voir par
exemple la Section 1.2.3).
Cest bien un systme continu et stationnaire dans le plan. On peut donc
utiliser le Thorme 12 de Poincar. Nous avons vu que les trajectoires restent
bornes. Donc, les trajectoires convergent soit vers un quilibre, soit vers une
courbe ferme du plan qui dlimite un domaine born.
Or, il nexiste pas dautre quilibre que lquilibre ( x,

I = u) dont on
a suppos lexistence lintrieur strict des contraintes. En eet, ( x,

I) est
1.5. CAS DTUDE 67
lunique solution de
_
f (x, S
at
[K
p
( x x) + I]) = 0
K
i
( x x) + K
s
(S
at
[K
p
( x x) + I] K
p
( x x) I) = 0
Lunicit rsulte du raisonnement suivant
Si u
min
K
p
( x x) +I u
max
, on a x = x par la seconde quation, et
alors la premire quation donne I comme solution de f( x, I) = 0. Or,
f est strictement croissante par rapport son second argument, donc
I =

I.
Si K
p
( x x) + I > u
max
, la premire quation f(x, u
max
) = 0 implique
que x > x, car f( x, u
max
) > 0 et f est dcroissante par rapport x. La
seconde quation donne alors K
i
(x x) = K
s
(u
max
(K
p
( xx)+I)) < 0,
car K
s
> 0 par hypothse. Ceci contredit le fait que x est plus grand
que x.
Si K
p
( x x) + I < u
min
, la premire quation f(x, u
min
) = 0 implique
que x < x et la seconde le contraire.
Pour montrer la convergence globale vers lunique quilibre ( x,

I) de (1.25),
il sut de montrer quil nexiste pas de courbe ferme du plan, forme par-
tir de trajectoires du systme. Il ne restera que la convergence vers lunique
quilibre comme rgime asymptotique possible.
Pour montrer quil nexiste pas de telles courbes fermes, nous procdons
par contradiction. Admettons qu partir des trajectoires de (1.25), on puisse
former par raccordement une courbe ferme du plan. On note lintrieur
de cette courbe ferme. Calculons lintgrale de la divergence du champ F
sur le domaine born . Cette intgrale est gale lintgrale sur le bord
de son ux sortant
16
. Avec < ., . > le produit scalaire usuel, il vient
_ _

divF =
_

< F, n > ds
o n est la normale extrieure. Par construction, le champs de vecteur associ
(1.25)
F =
_
f (x, S
at
[K
p
( x x) + I])
K
i
( x x) + K
s
(S
at
[K
p
( x x) + I] K
p
( x x) I)
_
est tangent au bord de : son ux sortant est donc nul. Pourtant, on
remarque que sa divergence (trace de la matrice Jacobienne) est toujours
strictement ngative
f
x
K
p
f
u
(S
at
)

+ K
s
((S
at
)

1) < 0
16. Il sagit du thorme de Gauss souvent utilis en lectrostatique.
68 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
car (S
at
)

vaut soit 0 soit 1. On obtient la contradiction recherche. En conclu-


sion, il nexiste pas de telle courbe ferme, et le point dquilibre ( x,

I) est
globalement asymptotiquement stable.
En fait nous avons montr le point no 1 du rsultat suivant :
Thorme 17 (PI avec anti-emballement sur un premier ordre non-linaire
et stable). Soit le systme du premier ordre non-linaire
d
dt
x = f(x, u) avec,
x R, u [u
min
, u
max
], f continue, drivable par morceau vriant
f
x
(x, u)
0,
f
u
(x, u) > 0 pour tout avec (x, u) R [u
min
, u
max
].
Soit le rgulateur PI avec anti-emballement de consigne x R :
u = S
at
[K
p
( x x) + I] ,
d
dt
I = K
i
( x x) + K
s
(u K
p
( x x) I)
avec K
p
, K
i
> 0, K
s
K
p
> K
i
et S
at
() max(u
min
, min(u
max
, )). Alors on a
les deux cas suivants :
1. soit il existe u ]u
min
, u
max
[ tel que f( x, u) = 0 et alors lquilibre
(x, I) = ( x, u) du systme boucl est unique et globalement asympto-
tiquement stable au sens de Lyapounov
2. sinon :
soit [u
min
, u
max
], f( x, ) < 0 (resp. > 0) alors lim
t+
u(t) =
u
max
(resp. u
min
) et lim
t+
x(t) existe, est ventuellement innie
dans [, x[ (resp. ] x, +])
soit f( x, u
max
) = 0 (resp. f( x, u
min
) = 0) alors lim
t+
u(t) = u
max
(resp. u
min
) et lim
t+
x(t) existe, est nie dans ] , x[ (resp.
] x, +[).
Le point no 2 signie simplement que, compte tenu des contraintes, le
rgulateur PI fait au mieux, i.e., tente de rapprocher au maximum x de sa
consigne x. La preuve de ce point est laisse en exercice.
1.5.7 Dynamiques ngliges : rle du contrle dans lap-
proximation
Les simulations en boucle ferme du thermostat que nous pouvons d-
duire du modle (1.21) ne sont quune reprsentation approximative de la
ralit. Cela est d, entre autres, lcriture par un modle continu (1.19)
du rgulateur PI qui est lorigine rgi par des quations discrtes (1.18).
Si la priode dchantillonnage t est petite nous ne faisons quune petite
erreur. Dautres erreurs proviennent des nombreux phnomnes dynamiques
ngligs comme par exemple lhtrognit des tempratures et
rad
, les
uctuations de la chaudire dues sa propre rgulation de temprature, ...
1.5. CAS DTUDE 69
Bref, nous avons implicitement suppos, en accord avec les rsultats de la
Section 1.4, que si dautres phnomnes transitoires existent, ils sont rapides
et stables. En consquence, notre modle de simulation ne prend en compte
que les dynamiques les plus lentes (disons celles qui sont plus lentes que 30
minutes).
Est-ce gnant en pratique ? Bien quen thorie nous avons montr que
lquilibre de (1.21) est globalement asymptotiquement stable pour tout gain
K
p
, K
i
et K
s
positifs vriant K
s
K
p
> K
i
, il apparat, lorsquon passe aux
exprimentations, un phnomne qui semble contredire ce rsultat. Le rsum
des direntes expriences quon peut raliser est quil nest pas possible de
choisir ces gains aussi grands que nous le souhaiterions. Lorsque les gains
sont petits on constate un bon accord entre la thorie propose et la pratique.
Lorsque les gains sont grands, on constate des carts importants, voire des
instabilits.
Ceci est en fait en accord avec la thorie, si on en revient aux hypo-
thses que nous avons formules plus ou moins explicitement. Lexplication
est que des gains trs grands rendent le systme (1.21) trs rapide. Pour sen
convaincre il sut de voir que les valeurs propres du systme linaire tangent
autour de lquilibre ( x,

I) sont celles de la matrice Jacobienne (1.27). Au
moins une des valeurs propres de cette matrice tend vers linni (en module)
quand K
p
et/ou K
i
tendent vers +. Sil est possible, en thorie, de rendre
le systme (1.21) aussi rapide quon le dsire grce un rgulateur PI avec
des grand gains, en pratique, les gains du rgulateur sont limits par lappari-
tion dinstabilits lies toutes les dynamiques rapides ngliges et qui sont
alors excites par le contrle. Les hypothses dapplication des thormes
dapproximation ne sont plus vries. Par exemple, lapproximation du PI
discret par un PI continu nest plus valable, si on prend K
p
et K
i
tels que
le temps intgral T
i
= K
p
/K
i
est du mme ordre de grandeur que la priode
dchantillonnage t. On va se concentrer sur un des possibles problmes
qui est caractristique de ce phnomne : la dynamique nglige de la sonde
thermique.
Exemple : le rle de la sonde Rajoutons au modle de simulation en
boucle ferme (1.21), la dynamique de la sonde de temprature. Le modle
le plus simple ayant une base physique vidente est une dynamique linaire
stable du premier ordre (ltre passe-bas) avec une constante de temps trs
petite car la sonde a trs peu dinertie thermique et donc rpond trs rapide-
ment (en quelques secondes pour xer lordre de grandeur) aux changements
de la temprature de lair ambiant. Ce modle est vriable exprimenta-
lement, par analyse de la rponse transitoire de la sonde thermique des
70 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
signaux dexcitation type chelon. En notant > 0 cette petite constante
de temps, la temprature quon peut utiliser pour le calcul de u nest plus
mais sa mesure note
m
relie via le ltre du premier ordre suivant
d
dt

m
=

m

Cette dynamique supplmentaire complte le modle en boucle ferme tu-


dier. Celui-ci est alors
_

_
d
dt
(t) =
u(t)
rad
(MC
p
)(u(t)+
rad
)
(
ch
(t)) +

ext
MC
p
(
ext
(t))
d
dt
I(t) = K
i
(


m
(t)) + K
s
(u(t) K
p
(


m
(t)) I(t))

d
dt

m
(t) = (t)
m
(t)
avec u(t) = S
at
(K
p
(


m
(t) + I(t))
(1.28)
En posant X = (, I) et Z =
m
, ce modle admet la structure suivante
d
dt
X = F(X, Z),
d
dt
Z = G(X, Z),
alors que le modle initial (1.21) correspond en fait = 0
d
dt
X = F(X, Z), 0 = G(X, Z).
En application du Thorme 15 de Tikhonov, si les valeurs propres de
G
Z
(X, Z)
pour (X, Z) vriant G(X, Z) = 0 sont toutes partie relle ngative (ce qui
est trivialement le cas ici), alors, pour > 0 assez petit, les trajectoires
des deux modles sont trs proches. Autrement dit, si la dynamique de la
sonde thermique est stable et rapide devant les autres dynamiques, on peut
la ngliger.
On comprend galement pourquoi on ne peut pas choisir les gains K
p
et/ou K
i
trop grands. Si tel est le cas, K
p
et/ou K
i
sont alors du mme
ordre de grandeur que
1

. Donc
d
dt
X comportera des termes en
1

. Lcriture
sous la forme
d
dt
X = F(X, Z) avec
d
dt
Z = G(X, Z) nest plus valable et
lapproximation prcdente peut tre mise en dfaut. On ne sait plus dduire
de la stabilit de (1.21) une information sur celle de (1.28). Dans ce cas, la
dynamique de la sonde, bien que stable isolment, nest plus rapide devant
les autres dynamiques. Lapproximation nest pas valable.
1.5.8 Intrt de la pr-compensation (feedforward)
Pour amliorer les performances de la rgulation de temprature (et donc
le confort), on peut complter le rgulateur prcdent en utilisant les tech-
niques de pr-compensation et de feedforward.
1.5. CAS DTUDE 71
Trs souvent, on utilise aussi pour ajuster la position de la vanne trois
voies, u, la temprature extrieure,
ext
. Ainsi, u ne dpend pas seulement de
la temprature intrieure et de sa consigne

, mais aussi de
ext
. Souvent,
on substitue alors aux quations (1.19) les quations suivantes
_
_
_
u(t) = S
at
(K
p
(



(t)) + I(t) K
ext

ext
)
d
dt
I(t) = K
i
(

(t)) + K
s
(u(t) K
p
(

(t)) I(t) + K
ext

ext
)
avec K
ext
un coecient positif. Ainsi, mme si =

, lorsque la tempra-
ture extrieure baisse, u a tendance augmenter pour anticiper la prochaine
baisse de . Le rajout de
ext
permet danticiper les variations de temprature
extrieure. Cest le terme de pr-compensation.
Une autre amlioration un peu plus subtile est celle quon utilise lors
de changement de la consigne

. Il est assez frquent de programmer une
consigne de temprature

un peu plus basse dans la journe, pendant les
heures o les habitants sont absents, et un peu plus haute en dbut et en
n de journe. Ainsi

est une fonction constante par morceaux. Il est clair
que la temprature ne peut pas suivre

chacune de ses discontinuits : la
rponse de notre systme nest pas instantane ; notre modle (1.20) implique
que est une fonction drivable de t et dont la drive est borne. Notons

max
> 0 cette borne

d
dt
(t)

max
Il est naturel de modier localement la fonction

(t) pour la transformer en
une fonction continue drivable par morceaux
r
(t) : l o

est constante,

r
est aussi constante ; l o

admet un saut, alors
r
est la fonction ane
par morceau de pente infrieure en module

max
( 1) qui remplace le
saut par une rampe comme illustr sur la Figure (1.22). Ainsi,
r
(t) est une
approximation continue de

(t), drivable par morceaux et dont la drive
reste toujours plus petite que

max
en valeur absolue. En quelque sorte,
r
(t)
est une consigne de temprature variable dans le temps, proche de

tout en
tant rellement ralisable par le systme. On parle de ltrage de consigne.
Il est facile de calculer en temps rel la fonction
r
(t) qui lisse la consigne
brute

(t).
Avec
r
(t) au lieu de

(t), on rajoute alors au PI (1.19) la drive

r
_
_
_
u(t) = S
at
(K
p
(
r
(t) (t)) + I(t) + K
r

r
(t))
d
dt
I(t) = K
i
(
r
(t) (t)) + K
s
(u(t) K
p
(
r
(t) (t)) I(t) K
r

r
(t))
avec K
r
un coecient positif. Leet de ce terme est le suivant. Supposons
que pour t < 0, =
r
. partir de t = 0,
r
commence une rampe de pente
72 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Figure 1.22 Approximation de la consigne brute t

(t), fonction
constante par morceaux impossible suivre cause des discontinuits, par
la rfrence t
r
(t), fonction continue et drivable par morceaux corres-
pondant une trajectoire ralisable par le systme.
constante positive rsultant dune augmentation de la consigne brute

en
t = 0. Alors, le terme en

r
, dit de feedforward aura tendance booster le
contrle u avec un surplus de chauage pour compenser linertie thermique
du btiment et ainsi avoir une temprature qui suivra mieux la rfrence
ralisable. Il sagit dune anticipation sur la rampe de monte. De mme,
la n de la rampe de monte pour
r
,

r
retourne 0 et alors, le contrle u
aura un saut vers le bas, une sorte de freinage pour viter que ne dpasse
en n de monte la valeur de
r
(vite lover-shoot). Cest le feedforward.
La combinaison de ses deux types danticipation, lune sur la perturbation
mesure
ext
, lautre sur la consigne variable

, conduit lalgorithme PI avec
anticipation suivant
_

_
u(t) =S
at
_
K
p
(
r
(t) (t)) + I(t) + K
r

r
(t) K
ext

ext
_
d
dt
I(t) =K
i
(
r
(t) (t))
+ K
s
_
u(t) K
p
(
r
(t) (t)) I(t) K
r

r
(t) + K
ext

ext
_
(1.29)
Des versions plus ou moins sophistiques de cet algorithme sont utilises dans
les thermostats vendus dans le commerce.
1.5.9 Pr-compensation et suivi de trajectoires sur un
systme linaire du premier ordre
Pour comprendre de faon plus formelle et plus prcise le rle de ces
deux types danticipation, prenons comme modle de contrle, le modle
linaire tangent autour dun quilibre (

, u,

ext
). On note et u les carts
lquilibre. La premire variation de (1.20) autour de lquilibre

et u, donne
un systme du premier ordre stable. On va la calculer. Le modle (1.20) est
1.5. CAS DTUDE 73
de la forme
d
dt
= f(, u,
ext
) avec f fonction rgulire de ces arguments et
f(

, u,

ext
) = 0. Il est dusage de noter par y, u par u et
ext
par w.
d
dt
y = ay + bu + dw (1.30)
avec
a =
f

, u,

ext
, b =
f
u

, u,

ext
, d =
f

ext

, u,

ext
On remarque que a > 0, b > 0 et d > 0. Ainsi, le systme est asymptotique-
ment stable en boucle ouverte. On peut interprter la temprature y comme
la sortie dun ltre du premier ordre de constante de temps = 1/a, excit
par le signal (bu + dw) en notant
d
dt
y =
1

(bu + dw y)
Pour simplier, nous considrons ici : u
min
= et u
max
= +.
Supposons quon souhaite suivre une rfrence t y
r
(t) continue et
drivable par morceaux tout en connaissant chaque instant la pertur-
bation w(t). On dnit le contrle de rfrence comme tant la fonction
t u
r
(t) continue par morceaux et telle que
d
dt
y
r
= ay
r
+ bu
r
+ dw, cest
dire
u
r
(t) =
y
r
(t) + ay
r
(t) dw(t)
b
Pour obtenir u, on rajoute alors u
r
une correction de type PI sur lerreur
de suivi, e = y y
r
u(t) = u
r
(t) + K
p
(y
r
(t) y(t)) + I(t),
d
dt
I(t) = K
i
(y
r
(t) y(t))
La partie anticipation (feedforward) correspond u
r
: elle compense, de
faon cohrente avec le modle, les eets transitoires dus aux variations de
y
r
et w. On obtient ainsi en boucle ferme un systme direntiel autonome
pour les variables e = y y
r
et I
d
dt
e = (bK
p
+ a) e + bI,
d
dt
I = K
i
e
Ce systme scrit alors sous la forme dun systme du second ordre
d
2
dt
2
e = 2
0
d
dt
e (
0
)
2
e (1.31)
avec les notations usuelles
2
0
= (bK
p
+ a) , (
0
)
2
= bK
i
74 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
o
0
> 0 est la pulsation de coupure et > 0, le facteur damortisse-
ment. Ainsi, mme si w et y
r
varient au cours du temps, leurs variations sont
pr-compenses par u
r
qui est une combinaison linaire de y
r
, y
r
et w. On
comprend mieux lintrt des termes K
r
y
r
et K
ext
w dans (1.29).
En pratique, les coecients a, b et d ne sont connus quavec une certaine
approximation. Si lon note
a
,
b
et
d
les carts entre leurs vraies valeurs
(celles du modle (1.30)) et celles utilises pour le calcul de u
r
par y
r
=
(a
a
)y
r
+(b
b
)u
r
+(d
d
)w, alors la dynamique de lerreur e devient
d
2
dt
2
e = 2
0
d
dt
e (
0
)
2
e +
b
u
r
+
d
w +
a
y
r
En absence de terme de feedforward, le simple contrleur PI
u = K
p
(y
r
y) + I,
d
dt
I = K
i
(y
r
y)
conduit un systme du second ordre similaire pour e = y y
r
d
2
dt
2
e = 2
0
d
dt
e (
0
)
2
e
d
2
dt
2
y
r
+ d w + a y
r
(1.32)
mais avec un terme source
d
2
dt
2
y
r
+ d w a y
r
a priori beaucoup plus grand
que
b
u
r
+
d
w +
a
y
r
dans (1.31), puisque les erreurs paramtriques sont
supposes peu importantes. Ainsi, mme avec des erreurs de modlisation, le
rajout de u
r
conduit en gnral une amlioration notable du suivi : e reste
plus prs de 0.
En labsence de feedforward, on voit que la partie rtro-action, le feed-
back, doit alors corriger aprs coup les variations de la rfrence y
r
et les
perturbations w. Il en rsulte une moins bonne prcision dans le suivi de la
rfrence y
r
et des performances dgrades car on demande au feedback de
compenser non seulement les erreurs de modle, ce qui est son rle premier,
mais aussi les variations de y
r
et w, ce qui est mieux ralis par le contrle
feedforward u
r
.
1.6 Cas dtude : contrle hirarchis et rgu-
lateurs en cascade
La thorie des systmes lents/rapides (en particulier le Thorme 15 de
Tikhonov) permet de justier une pratique courante pour la synthse de
boucle de rgulation : le contrle hirarchis qui consiste imbriquer les r-
gulateurs. Un exemple sura pour comprendre ce dont il sagit. Cet exemple
1.6. CAS DTUDE 75
est non trivial car il sagit dun systme du second ordre avec dynamique
inconnue et des contraintes la fois sur ltat et sur le contrle. La synthse
dun contrleur prenant explicitement les contraintes dtat est un problme
largement ouvert et pour lequel on ne dispose pas, lheure actuelle, de so-
lution systmatique et simple. Des solutions plus numriques fondes sur les
techniques de commande prdictive peuvent tre considres mais elles sont
coteuses en temps de calculs et peuvent poser problme en particulier en
ce qui concerne lexistence de solutions et la convergence numrique
17
. Le
contrleur que nous proposons ci-dessus sappuie sur le paradigme des sys-
tmes lents/rapides, sa structure est facile comprendre. Le rglage des gains
est simple et seectue partir des contraintes. Nous donnons des formules
explicites qui peuvent tre utilises.
Considrons un systme du second ordre de la forme suivante
d
2
dt
2
x = f(x,
d
dt
x) + u
o x et u sont dans R. De tels modles se rencontrent naturellement pour les
systmes mcaniques (par formulation variationnelle) : il sagit par exemple
de lquation de Newton qui relie lacclration aux forces extrieures parmi
lesquelles se trouve le contrle u. On suppose quon ne connat pas bien
f(x,
d
dt
x).
Il est possible de se ramener, au moins approximativement, au cas de deux
systmes du premier ordre. Le principe de la stratgie de contrle hirarchis
comporte deux tapes : un premier rgulateur proportionnel (rgulateur P)
assure la convergence rapide de la vitesse v =
d
dt
x vers une consigne v. Un
second rgulateur PI cherche stabiliser la position x x et, pour ce faire,
met lentement jour la consigne du rgulateur de vitesse v. Comme nous
allons le voir, il est assez ais de prendre en compte des contraintes sur la
vitesse v et le contrle u.
crivons lquation du second ordre sous la forme dun systme de deux
17. La technique MPC (Model Predictive Control) propose une slection optimale, au
sens dun critre choisi par lutilisateur, parmi des trajectoires satisfaisant des contraintes.
Elle suppose lexistence de telles trajectoires et lunicit dun optimum caractrisable nu-
mriquement. Ce sont ces hypothses qui sont bien souvent diciles garantir sur des
exemples concrets gnraux. Si ces hypothses sont vries, la technique MPC consiste
en la rsolution itre du problme doptimisation avec mise jour chaque nouvelle
priode dchantillonnage de la condition initiale. La fonction cot optimal est alors une
fonction de Lyapounov, elle garantit la stabilit.
76 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
quations du premier ordre
_

_
d
dt
x = v
d
dt
v = f(x, v) + u
(1.33)
Les contraintes sont u [u
max
, u
max
] et v [v
max
, v
max
] (u
max
, v
max
> 0). On
considre un rgime stationnaire caractris par un tat admissible ( x, v = 0)
et un contrle admissible u; soit [ u[ < u
max
et f( x, 0)+ u = 0. On cherche par
un bouclage u stabiliser (x, v) en ( x, u), en respectant les contraintes sur u
et aussi sur v. Prcisment, si la vitesse initiale v
0
appartient [v
max
, v
max
]
alors on souhaite que pour t > 0 la vitesse v(t) du systme en boucle ferme
reste aussi dans [v
max
, v
max
]. Cet objectif doit tre atteint de manire robuste
aux incertitudes sur la fonction f(x, v).
Sans hypothse supplmentaire sur f, il est dicile de donner une rponse
un peu gnrale ce problme. Nous allons supposer quil existe 0 < < 1
tel que pour tout (x, v),
[f(x, v)[ u
max
(1.34)
Cela veut dire que pour toute valeur de (x, v), on peut choisir un contrle
u qui domine f(x, v) et ainsi imposer le signe de
d
2
dt
2
x. Cette hypothse est
essentielle.
La cascade de deux rgulateurs, voque ci-dessus, donne lalgorithme de
contrle suivant
_

_
d
dt
I = K
i
( x x) + K
s
( v K
p
( x x) I)
v = S
at
v
[K
p
( x x) + I]
u = S
at
u
[K
p
( v v)/]
(1.35)
avec K
p
> 0, K
i
> 0, K
s
> 0, K
s
K
p
> K
i
, et un paramtre positif. Les
fonctions S
at
v
et S
at
u
sont les fonctions de saturation usuelles (telles que celle
utilise en (1.24)) associe aux contraintes sur v et u (projections sur les
convexes [v
max
, v
max
] et [u
max
, u
max
]).
La dynamique en boucle ferme est le systme de trois quations di-
rentielles non linaires suivant
_

_
d
dt
x = v
d
dt
v = f(x, v) + S
at
u
[K
p
(S
at
v
[K
p
( x x) + I] v)/]
d
dt
I = K
i
( x x) + K
s
(S
at
v
[K
p
( x x) + I] K
p
( x x) I)
1.6. CAS DTUDE 77
Pour (x, v, I) proche de ( x, 0, u), les contraintes ne sont pas actives et donc
les fonctions S
at
v
et S
at
u
sont les fonctions identits. Ainsi, le systme boucl
ci-dessus devient
_

_
d
dt
x = v

d
dt
v = f(x, v) + K
p
(K
p
( x x) + I) v)
d
dt
I = K
i
( x x)
Ce systme est bien sous la forme standard du thorme 15 de Tikhonov :
ltat lent est (x, I), ltat rapide v, et la dynamique rapide est bien asymp-
totiquement stable. Le systme lent
d
dt
x = v,
d
dt
I = K
i
( x x)
est bien asymptotiquement stable. On conclut la stabilit via le tho-
rme 16. En labsence de contraintes, la preuve de la stabilit repose uni-
quement sur le fait que est susamment petit.
Pour garantir la stabilit avec la prise en compte des eets non linaires
dus aux fonctions de saturation S
at
u
et S
at
v
, il convient de ne pas choisir K
p
et K
i
nimporte comment. Intuitivement, si notre raisonnement par chelles
de temps est correct, il faut que le systme rapide soit en mesure de suivre
sa consigne v = S
at
v
[K
p
( x x) + I] mme si cette dernire varie au cours du
temps : cela entrane qualitativement que
d
dt
v doit respecter les contraintes
sur u, tout au moins sur la partie de u qui reste disponible aprs avoir domin
la dynamique f(x, v). Cela veut dire approximativement que le module de
d
dt
v ne doit pas dpasser (1 )u
max
. Il nous faut maintenant avoir une ide
de lordre de grandeur de
d
dt
v : pour cela on drive dans le cas non satur v
et on nglige la variation de I. Cela nous donne comme estimation de
d
dt
v :
K
p
v. Ainsi, il est naturel dimposer K
p

v
max
(1)u
max
.
On constate, avec des simulations numriques quavec
K
p
=
v
max
(1 )u
max
, K
i
=
K
2
p
5
, K
s
=
2K
p
5
, = 3,
le contrleur (1.35) est bien stabilisant tout en respectant les contraintes sur
u et approximativement les contraintes sur v.
Ce qui prcde nest pas une preuve formelle mais plutt une illustration
de la dmarche fonde sur la thorie des perturbations pour concevoir un
rgulateur simple pour un systme du second ordre dont le modle comporte
dimportantes incertitudes que lon peut dominer par un contrle born. De
plus ce rgulateur (1.35) prend en compte la contrainte dtat [v[ v
max
.
78 CHAPITRE 1. SYSTMES DYNAMIQUES ET RGULATEURS
Chapitre 2
Fonctions de transfert
Les rsultats du Chapitre 1 sont essentiellement de nature qualitative.
La stabilit dun systme est garantie sous lhypothse quun paramtre
soit susamment petit. Dans ces conditions, on peut alors raisonner sur un
systme simpli (nominal). La question de la robustesse a t traite de
manire perturbative : si le systme nominal en boucle ferme ou en boucle
ouverte admet un quilibre asymptotiquement stable, alors le systme perturb
(rgulirement et/ou singulirement)
1
admet un quilibre voisin de celui du
systme nominal, quilibre qui est lui aussi asymptotiquement stable.
La question de savoir partir de quelle valeur critique de il y a perte
de stabilit est importante, notamment dun point de vue pratique. Comme
nous allons le voir dans ce chapitre, une rponse est lie aux notions de
marges de robustesse que nous allons dnir. On notera que, dun point de
vue formel, ltude des changements qualitatifs de comportement dun sys-
tme dynamique en fonction de paramtres intervenant dans les quations
est lobjet de la thorie des bifurcations et des catastrophes [21]. Cette thorie
dpasse largement le cadre de ce cours.
Les marges de robustesse sont des notions diciles aborder de faon
gnrale pour un systme non linaire. Cependant, il est possible, une fois de
plus, dobtenir des informations prcieuses en considrant le systme linaris
tangent autour de lquilibre.
1. On parle de perturbations rgulires lorsque apparat dans les membres de droite
des quations direntielles, comme par exemple,
d
dt
x = f(x, z, ) et
d
dt
z = g(x, z, ). On
parle de perturbations singulires lorsque apparat gauche devant une drive en temps,
comme par exemple
d
dt
x = f(x, z) et
d
dt
z = g(x, z). Ainsi le systme
d
dt
x = f(x, z, ) et

d
dt
z = g(x, z, ) est la fois rgulirement et singulirement perturb. Ses solutions sont
alors proches de celles du systme nominal (obtenu en faisant = 0,
d
dt
x = f(x, z, 0) et
0 = g(x, z, 0)) sous certaines hypothses comme celles du thorme 15.
79
80 CHAPITRE 2. FONCTIONS DE TRANSFERT
On utilise sur ce systme linaire le calcul symbolique
2
, i.e. on remplace
loprateur
d
dt
par la variable de Laplace s C (en utilisant la transforme
de Laplace voir [53]). Grce ce formalisme
3
, on peut faire des calculs alg-
briques pour aboutir une quation reliant entre et sortie. Le systme est
alors reprsent par une fonction de la variable complexe s (note aussi p et
correspondant enn en thorie des circuits). Cette fonction est appele
fonction de transfert. Lanalyse complexe fournit une rponse directe (par le
Thorme de Cauchy) la dnition des marges de robustesse.
2.1 Passage la fonction de transfert
Nous allons considrer lexemple (1.30) de la n du chapitre prcdent
d
dt
y(t) = ay(t) + bu(t) + dw(t) (2.1)
avec a, b et d positifs et constants. Ce systme est linaire. Le contrle est u, la
perturbation w et la mesure y. On a vu, toujours dans le chapitre prcdent,
quun simple
4
rgulateur PI
u = K
p
(y
r
y) + I,
d
dt
I = K
i
(y
r
y) (2.2)
avec K
p
, K
i
> 0 assure la convergence asymptotique de y(t) vers la consigne
(rfrence) y
r
suppose constante, pour peu que la perturbation w soit cons-
tante. Rappelons quon na pas besoin de connatre cette constante pour
prouver que de manire asymptotique y = y
r
.
2.1.1 Questions de robustesse
tant donn le systme en boucle ferme (2.1)-(2.2), nous souhaitons
tudier les trois points suivants
1. Que se passe-t-il si la mesure de y nest pas instantane mais est eec-
tue avec un certain temps de retard ? Dans une telle conguration,
linstant t, on connat la valeur de y(t ). La valeur y(t) nest dis-
ponible, pour calculer u, qu linstant t +. Ce retard est par exemple
2. Le calcul symbolique est aussi dnomm calcul oprationnel [73, 22] en rfrence
la thorie des oprateurs linaires [43].
3. Nous laissons de ct les problmes de convergence des transformes de Laplace qui
sont relativement hors-sujet ici et qui sont abords dans les cours [52, 53]. On pourra aussi
se reporter [15] pour un expos mettant en lumire le rle des bandes de convergence
dans le plan complexe.
4. Nous ne prenons pas en compte les contraintes sur u ici.
2.1. PASSAGE LA FONCTION DE TRANSFERT 81
imputable la dynamique du capteur, la chane informatique temps-
rel, des dlais dchantillonnage de certains capteurs, ou des dlais
de communication de linformation.
2. Que se passe-t-il si la perturbation non mesure w nest plus constante
mais sinusodale de la forme w(t) = cos(t) avec constant. Ne peut-il
pas y avoir propagation de ces oscillations ? Est-ce gnant ?
3. Que se passe-t-il si lon superpose les deux points prcdents, un retard
de mesure et une perturbation sinusodale ?
2.1.2 Principe des calculs
De manire prliminaire, nous montrons ici comment obtenir la fonc-
tion de transfert dun systme. Le principe des calculs est trs simple : il
sut de remplacer loprateur
d
dt
par s. Par abus de notation et soucis de
simplicit, on note ici y(s) la transforme de Laplace de t y(t) : ainsi
y(s) =
_
+
0
e
st
y(t)dt. Sauf indication contraire, on travaille toujours en La-
place unilatral par rfrence des problmes de Cauchy avec des conditions
initiales nulles en t = 0. Dans ce cas, loprateur retard devient e
s
o
est le retard
5
Considrons le systme boucl avec y
r
et w variables et un retard sur
la mesure de y
_

_
d
dt
y(t) = ay(t) + bu(t) + dw(t)
u(t) = K
p
(y
r
(t) y(t )) + I(t)
d
dt
I(t) = K
i
(y
r
(t) y(t ))
5. On peut dabord utiliser le calcul
_
+
0
e
st
y(t )dt =
_
+
0
e
s(+)
y()d = e
s
y(s)
o y doit tre nulle pour les temps t ngatifs. On a aussi formellement (sans chercher
le justier) le dveloppement en srie y(t ) =

+
k=0
()
k
k!
y
(k)
(t). Comme y
(k)
=
d
k
dt
k
y = s
k
y, on voit naturellement apparatre la srie

+
k=0
()
k
k!
s
k
qui nest autre que
e
s
. Ainsi, en calcul symbolique, loprateur qui la fonction y associe la fonction y
retarde de nest autre quune multiplication par e
s
. On trouvera toutes les formules
ncessaires des calculs oprationnels plus compliqus dans [22].
82 CHAPITRE 2. FONCTIONS DE TRANSFERT
On obtient alors (dans le domaine des transformes de Laplace)
_

_
sy = ay + bu + dw
u = K
p
(y
r
e
s
y) + I
sI = K
i
(y
r
e
s
y)
On peut alors calculer algbriquement y, u, et I en fonction de y
r
et w. Il
sut de rsoudre ces quations par rapport aux variables recherches. La
sortie y est une combinaison linaire de y
r
et w, les coecients tant des
fractions rationnelles en s et e
s
. Tout calcul fait, on obtient
y =
b(K
i
+ sK
p
)
s(s + a) + b(K
i
+ sK
p
)e
s
y
r
+
sd
s(s + a) + b(K
i
+ sK
p
)e
s
w
La stabilit se dduit des zros des dnominateurs (nomms ples), i.e., les
valeurs s C pour lesquelles la formule ci-dessus donnant y nest pas dnie.
Nous reviendrons sur ce point dans la Dnition 5 et la Proposition 3.
Sil existe > 0, tel que les valeurs de s pour lesquelles la fonction de
la variable complexe (cest une fonction dite entire car elle est dnie pour
toute valeur de s C)
D(s) = s(s + a) + b(K
i
+ sK
p
)e
s
(2.3)
sannule, sont toutes dans le demi plan '(s) , alors le systme est
asymptotiquement stable en boucle ferme. En revanche, si un des zros est
partie relle strictement positive, le systme est instable et la sortie y(t)
nest pas borne lorsque t +.
Cette caractrisation est une gnralisation naturelle de celle que nous
avons dj vue pour les systmes linaires (voir Thorme 4) sous forme
dtat
d
dt
x = A(x x) : pour ce dernier systme, le point dquilibre x est
asymptotiquement stable en boucle ouverte lorsque les zros de det(sI
A) sont tous partie relle strictement ngative. La formule donnant la
transforme de Laplace de x explicitement partir de celle de x ( conditions
initiales nulles)
x = (sI A)
1
A x
nest pas dnie pour les valeurs de s appartenant au spectre de A. Comme
det(sI A) est un polynme, il ne possde quun nombre ni de zros do
lexistence de > 0.
Pour des fonctions de s plus compliques comme les polynmes en s et
e
s
(appels quasi-polynmes [31]), on a un nombre inni de zros en g-
nral. La localisation des zros de la fonction entire D(s), dnie par (2.3),
2.1. PASSAGE LA FONCTION DE TRANSFERT 83
est un problme ardu et non compltement rsolu lheure actuelle (voir [29]
pour un expos complet et la Section 2.4.1 pour un exemple de rsultats
quon peut obtenir).
Pour = 0, D(s) = s
2
+ (bK
p
+a)s +bK
i
na que deux zros et ils sont
partie relle strictement ngative (sous lhypothse K
p
, K
i
, b > 0 et a 0).
Nous verrons comment il est possible de calculer le retard critique

partir
duquel D(s) admet ncessairement des zros instables rendant le systme en
boucle ferme instable.
2.1.3 Rgime asymptotique forc
Lorsquun systme est asymptotiquement stable en boucle ferme, on peut
tudier comment il ragit des perturbations (on dit aussi excitations) sinu-
sodales w . Comme le prcise la Proposition 4, un systme asymptotiquement
stable soumis une telle excitation, converge, aprs un transitoire, vers un
rgime priodique de mme priode. Le systme oublie sa condition initiale
(de manire asymptotique), comme discut la Section 1.1.3.
Pour une excitation priodique w = cos(t), on passe en complexes en
notant w = exp(t) et on cherche la solution (y, u, I), pour y
r
= 0, des
quations
_

_
d
dt
y(t) = ay(t) + bu(t) + d exp(t)
u(t) = K
p
(y
r
(t) y(t )) + I(t)
d
dt
I(t) = K
i
(y
r
(t) y(t ))
sous la forme y(t) = exp(t), u(t) = | exp(t) et I(t) = 1 exp(t). Cela
revient faire exactement les mmes manipulations que celles faites la
Section 2.1.2 en remplaant
d
dt
par s et le retard par e
s
, mais avec s = .
On obtient
=
sd
s(s + a) + b(K
i
+ sK
p
)e
s

s=
Ce nombre complexe peut scrire sous la forme
sd
s(s + a) + b(K
i
+ sK
p
)e
s

s=
= G() exp(())
o G() 0 est le gain et () [, [, la phase. Il sut alors de prendre
la partie relle de la formule
y(t) = G() exp((t + ()))
84 CHAPITRE 2. FONCTIONS DE TRANSFERT
pour avoir le rgime forc y. La solution priodique du systme en boucle
ferme, avec y
r
= 0 et w = cos(t), est
y(t) = G() cos(t + ())
On reprsente sur deux graphiques, appels diagrammes de Bode
6
, le gain
G() en fonction de et le dphasage () en fonction de . Une grande
variation locale de G en fonction de est la signature de rsonances, dont les
frquences caractristiques sont donnes approximativement par les maxima
locaux de G (les pics de rsonance). Le diagramme de Bode peut sobtenir
exprimentalement (jusqu une certaine frquence au del de laquelle les
instruments sont inutilisables) avec un analyseur de frquence si le systme
est eectivement asymptotiquement stable.
2.1.4 Simplications ples-zros
Il y a une distinction entre la stabilit dun systme reprsent sous forme
dtat
d
dt
x = Ax + Bu, y = Cx, et celle de la relation entre-sortie y(s) =
H(s)u(s).
Il peut y avoir des simplications de ples avec des zros. En dautres
termes, il se peut quon ait une racine commune entre le numrateur et le d-
nominateur de H(s). Ainsi, H(s) peut ne possder que des ples stables alors
que A peut avoir des valeurs propres instables. On verra que la Dnition 5
et la Proposition 3 tiennent compte de ce phnomne.
Prenons un exemple trs simple qui fera bien comprendre le problme.
Supposons que nous ayons le systme suivant
d
2
dt
2
y y =
d
dt
u u (2.4)
Le calcul symbolique dj utilis prcdemment donne (s
2
1)y = (s 1)u,
soit
y =
s 1
s
2
1
u =
1
s + 1
u
On pourrait en conclure que le systme est asymptotiquement stable car la
relation entre-sortie ne fait apparatre quun seul ple s = 1 partie relle
ngative. Ceci est faux : le systme est du second ordre, il admet une autre
valeur propre. Cette dernire est instable et vaut 1. Pour comprendre lorigine
du problme engendr par la simplication par le facteur commun s1 entre
6. En gnral, on trace, sur le premier graphique 20 log
10
(G()) (dcibels comme chelle
des ordonnes) en fonction de log
10
() (log
10
comme chelle en abscisse), sur le second
() en fonction de log
10
().
2.1. PASSAGE LA FONCTION DE TRANSFERT 85
le numrateur et le dnominateur de la fonction de transfert, il faut reprendre
la transformation de Laplace (voir [52]) et bien noter que, si on ne nglige
plus la condition initiale, la transformation de Laplace de
d
dt
y donne en fait
sy y(0) au lieu de sy comme nous lavons fait, pour simplier les calculs.
Ainsi, tous nos calculs sont corrects si t = 0 tout est lquilibre et tout
est nul, c.--d. y
0
= 0, y
0
= 0 et u
0
= 0. Si tel nest pas le cas, il faut utiliser
les formules o les valeurs en t = 0 de (y, y) et de u apparaissent
y(s) = s
2
y(s) sy
0
y
0
, u(s) = su(s) u
0
.
Elles se dmontrent avec deux intgrations par partie pour
_
+
0
e
st
y(t)dt et
une pour
_
+
0
e
st
u(t)dt et en supposant que y(t) et u(t) sont continus par
rapport t et que les intgrales sont absolument convergentes. Ainsi on a
(s
2
1)y sy
0
y
0
= (s 1)u u
0
o y
0
, y
0
et u
0
sont les valeurs t = 0 de y,
d
dt
y et u. En eet on a
Dans ce cas, on obtient le calcul complet
y(s) =
1
s + 1
u +
sy
0
+ y
0
u
0
s
2
1
Cette quation rvle le transfert de u y et celui des conditions initiales
y. La simplication initialement envisage nest plus possible, sauf pour des
valeurs trs particulire de y
0
, y
0
, et u
0
. Le second terme dans la fonction de
transfert correspond une fonction qui diverge lorsque t +. Il est nul
si et seulement si on a y(0) = y(0) u(0) = 0. En gnral, cette condition
nest pas satisfaite, le systme est instable cause du ple en s = 1 qui ne
disparat plus.
Dans la suite du chapitre, nous supposerons quil ny a pas de canular de ce
type. En pratique, ce genre de simplication se voit trs vite en inspectant les
quations. Il sut de modier un tout petit peu les coecients, par exemple
prendre u 0.999u pour casser cette simplication et revoir apparatre le
ple instable qui avait disparu. Ce type de simplication est surtout gnant
quand des ples instables sont en jeu. Pour des ples stables, cest moins
embtant et ce dautant plus sils ont des parties relles fortement ngatives.
Les termes correspondants convergent de toutes faons trs rapidement vers
zro lorsque t +.
2.1.5 Formalisme
Dans ce qui suit, on sattache donner des lments prcis (dnitions et
proprits) concernant les fonctions de transfert que nous avons introduites
86 CHAPITRE 2. FONCTIONS DE TRANSFERT
partir dexemples simples dans les Sections 2.1.2, 2.1.3 et 2.1.4. On considre
un systme avec m 1 entres u et p 1 sorties y sous forme dtat
d
dt
x = Ax + Bu, y = Cx (2.5)
o A est une matrice n n coecients constants, B est une matrice (dans
le cas o on a plusieurs entres, sinon cest un vecteur colonne) de taille nm
coecients constants, et C est une matrice (dans le cas o on a plusieurs
sorties, sinon cest un vecteur ligne) de taille p n coecients constants.
La notion de stabilit dont nous avons parl pour les fonctions de transfert
correspond en fait la dnition suivante.
Dnition 5 (Stabilit Entre-Borne-Sortie-Borne). Un systme de
la forme (2.5) est stable Entre-Borne-Sortie-Borne (on dit EBSB), si pour
toute entre borne t u(t) la sortie t y(t) reste borne.
Dnition 6 (Matrice et fonction de transfert). On appelle matrice de
transfert du systme (2.5) la matrice dpendant de la variable complexe
C s H(s) = C(sI A)
1
B
. Les lments de cette matrice sont des fractions rationnelles en s strictement
propres. Lorsque p = m = 1 (systme une entre et une sortie) H(s) est
une simple fraction rationnelle en s et on parle alors de fonction de transfert.
Une fraction rationnelle
P(s)
Q(s)
est dite causale ou propre quand le degr du
numrateur P(s) est plus petit que (ou gal ) celui du dnominateur Q(s).
Lorsque lingalit est stricte on dit que la fraction rationnelle est strictement
causale ou strictement propre.
Dnition 7 (Ples et zros dune fonction de transfert). On appelle
zro dune fonction de transfert (scalaire) H(s) les racines de son numra-
teur. On appelle ples les racines de son dnominateur.
Il est facile de montrer le rsultat suivant partir de la formule de varia-
tion des constantes (1.14), page 27, donnant les solutions de (2.5) (prendre
b(t) = Bu(t)).
Proposition 3. Si les valeurs propres de A sont toutes partie relle stric-
tement ngative, alors le systme (2.5) est stable EBSB.
Ainsi la stabilit asymptotique de
d
dt
x = Ax implique la stabilit EBSB
mais linverse est faux comme on peut sen convaincre simplement avec le
systme o n = 2 et m = p = 1 :
d
dt
x
1
= x
1
+ u,
d
dt
x
2
= x
2
+ u, y = x
2
.
2.1. PASSAGE LA FONCTION DE TRANSFERT 87
Ce systme est bien EBSB mais pour > 0, la matrice A est exponentiel-
lement instable. Un simple calcul de H(s) = C(sI A)
1
B montre que le
facteur (s ) apparaissant dans les dnominateurs de (sI A)
1
disparat
du transfert entre y et u. Plus gnralement, la rciproque de la proposition 3
est fausse cause de simplications ples-zros dans le calcul de la fonction
de transfert C(sI A)
1
B. Ces cas pathologiques sont dus au fait que ltat
x peut ne pas tre observable partir de la sortie y (cf thorme 28) et
aussi au fait que ltat x peut ne pas tre commandable avec lentre u (cf
thorme 23)
On a, de manire gnrale, la proprit suivante qui permet de caractriser
la rponse asymptotique dun systme stable EBSB une entre sinusodale.
Proposition 4 (Rponse asymptotique dun systme stable EBSB une
entre sinusodale). Considrons le systme (2.5) avec m = p = 1 et suppo-
sons le stable EBSB. Notons H(s) sa fonction de transfert. Si on excite ce
systme par un signal dentre u(t) = cos(t +) de pulsation et de phase
constantes, alors, de manire asymptotique lorsque t +, la sortie y(t)
converge vers le signal '
_
H()e
(t+)
_
= [H()[ cos(t ++arg H(i)).
On notera ainsi que les pulsations correspondant aux zros de R
H() sont asymptotiquement rejetes. Si H(s) a un zro en zro (cest sou-
vent le cas lorsquon recoure un contrleur PI ), alors les entres constantes
sont rejetes. On a rejet de lerreur statique.
2.1.6 Du transfert vers ltat : ralisation
La donne dun transfert rationnel H(s) est quivalente la donne dune
forme dtat canonique minimale que nous allons dnir. Cest ce quon ap-
pelle la ralisation sous forme dtat dun transfert rationnel .
De manire prliminaire, nous allons traiter un cas particulier qui permet
de comprendre lalgorithme gnral de construction du systme dtat.
Exemple 12 (Ralisation dun systme dordre 2). Supposons que nous dis-
posions du transfert suivant entre y et u
y(s) =
b
1
s + b
0
s
2
+ a
1
s + a
0
u(s)
o (a
0
, a
1
, b
0
, b
1
) sont des paramtres. Ce transfert correspond lquation
direntielle du second ordre suivante
d
2
dt
2
y + a
1
d
dt
y + a
0
y = b
1
d
dt
u + b
0
u
88 CHAPITRE 2. FONCTIONS DE TRANSFERT
On pose z = (z
1
, z
2
) = (y,
d
dt
y) pour obtenir
d
dt
z
1
= z
2
,
d
dt
z
2
= a
0
z
1
a
1
z
2
+ b
1
d
dt
u + b
0
u
On regroupe les drives dans la seconde quation en une seule variable x
2
=
z
2
b
1
u au lieu de z
2
. Avec les variables (x
1
= z
1
, x
2
) au lieu des variables
(z
1
, z
2
), on a la ralisation dtat souhaite
d
dt
x
1
= x
2
+ b
1
u,
d
dt
x
2
= a
0
x
1
a
1
x
2
+ (b
0
a
1
b
1
)u, y = x
1
On notera les matrices
A =
_
0 1
a
0
a
1
_
, B =
_
b
1
b
0
a
1
b
1
_
, C = (1 0) (2.6)
On voit que lastuce est de faire disparatre par des changements astucieux
sur ltat, les drives de u.
Supposons maintenant que nous ayons eu un degr de plus au numrateur
y(s) =
b
2
s
2
+ b
1
s + b
0
s
2
+ a
1
s + a
0
u(s)
Alors, en reprenant les calculs prcdents, on a avec z = (y,
d
dt
y)
d
dt
z
1
= z
2
,
d
dt
z
2
= a
0
z
1
a
1
z
2
+ b
2
d
2
dt
2
u + b
1
d
dt
u + b
0
u
On pose z
2
= z
2
b
2
d
dt
u. Avec les variables (z
1
, z
2
), la plus haute drive de
u,
d
2
dt
2
u, disparat
d
dt
z
1
= z
2
+ b
2
d
dt
u,
d
dt
z
2
= a
0
z
1
a
1
z
2
+ (b
1
a
1
b
2
)
d
dt
u + b
0
u
On regroupe les drives dans les deux variables suivantes :
x
1
= z
1
b
2
u, x
2
= z
2
(b
1
a
1
b
2
)u
On obtient alors la forme dtat souhaite (avec une loi de sortie qui dpend
directement de u)
d
dt
x
1
= x
2
+(b
1
a
1
b
2
)u,
d
dt
x
2
= a
0
x
1
a
1
x
2
+(b
0
a
0
b
2
a
1
(b
1
a
1
b
2
))u
car y = x
1
+ b
2
u.
2.1. PASSAGE LA FONCTION DE TRANSFERT 89
Daprs lexemple prcdent, on comprend ainsi que, par liminations
successives des plus hautes drives de u en rajoutant des drives de u
dans les composantes de ltat, il est toujours possible, lorsque la fraction
rationnelle y(s)/u(s) = G(s) est propre, dobtenir la forme dtat suivante
d
dt
x = Ax + Bu, y = Cx + Du
o dim(x) est gal au degr du dnominateur de G(s)
G(s) = (C(sI A)
1
B + D)u
Cette mthode de ralisation se gnralise aux systmes multi-variables avec
m > 1 entres u et p > 1 sorties y, le transfert entre u et y tant donn
(en accord avec la Dnition 6), par une matrice dont les lments sont des
fractions rationnelles en s. Un lecteur intress par un expos plus formel de
la thorie de la ralisation pourra consulter [38].
Plusieurs ralisation direntes peuvent conduire au mme transfert. Une
ralisation dirente de celle propose par (2.6) peut tre obtenue avec le
schma gnral de la Figure 2.1 qui fournit une ralisation dune fonction de
transfert strictement propre
b
n1
s
n1
+ ... + b
0
s
n
+ a
n1
s
n1
+ ... + a
0
ainsi que les formes canoniques
x = Ax + Bu, y = Cx
1. (A
1
, B
1
, C
1
) avec
A
1
=
_
_
_
_
_
_
0 1 0 ... 0
0 0 1 ... ...
... ... ... ...
0 ... 0 0 1
a
0
a
1
... ... a
n1
_
_
_
_
_
_
, B
1
=
_
_
_
_
0
0
...
1
_
_
_
_
C
1
=
_
b
0
... b
n1
_
2. (A
2
, B
2
, C
2
) avec
A
2
=
_
_
_
_
0 ... 0 a
0
1 0 ... ...
... ... ... ...
0 ... 1 a
n1
_
_
_
_
, B
2
=
_
_
b
0
...
b
n1
_
_
C
2
=
_
0 ... 0 1
_
90 CHAPITRE 2. FONCTIONS DE TRANSFERT
Figure 2.1 Ralisation dune fonction de transfert strictement propre.
2.2 Schmas blocs et fonctions de transfert
Les schmas blocs sont un langage relativement universel. Ils permettent
dexprimer laction sur un systme des commandes, des perturbations, et
dexpliciter des schmas de rgulation. On prsente ici, pour une structure
trs gnrale de contrle (voir Figure 2.5), les fonctions de transfert en boucle
ferme.
2.2.1 De la forme dtat vers le transfert
Figure 2.2 Le schma blocs de type fonctionnel pour le systme en boucle
ouverte avec comme contrle u, comme perturbation w et comme sortie (me-
sure) y.
Reprenons les notations dun systme non linaire telles que nous les
avons vues la Section 1.4.3. On considre un systme tout fait gnral
dcrit par
d
dt
x = f(x, u, w, p), R
n
x y = h(x) R
m<n
o p reprsente des paramtres, u reprsente des commandes et w reprsente
des perturbations. On dispose de capteurs qui fournissent chaque instant la
2.2. SCHMAS BLOCS ET FONCTIONS DE TRANSFERT 91
Figure 2.3 Le schma blocs de type fonctionnel pour le systme en boucle
ferme o le nouveau contrle est v (typiquement la consigne que y doit
suivre).
valeur y (en gnral dim(y) < dim(x) c.--d. que ltat du systme nest pas
compltement mesur). Les dimensions de x, u, w et y sont ici arbitraires.
Ce systme est reprsent par le schma blocs de la Figure 2.2.
On labore une loi de contrle sous la forme dun retour dynamique de
sortie, c.--d. un systme dynamique (comme lest un rgulateur PI)
d
dt
= a(y, , v), u =

k(y, , v)
o v est le nouveau contrle. On complte alors le schma blocs en boucle
ouverte de la Figure 2.2 par une boucle de rtro-action en montrant bien que
les informations issues de la sortie y, sont utilises de manire causale pour
ajuster le contrle u de faon atteindre un objectif prcis. Typiquement, le
nouveau contrle v sera la consigne que devra suivre y (lorsque v et y ont la
mme dimension) et u sera calcul de faon ce que y suive v. On obtient
ainsi le schma en boucle ferme de la Figure 2.3.
Supposons que lon soit proche dun point dquilibre ( x, y, u, w,

, v). On
peut linariser toutes les quations ci-dessus, celle du systme et celle du
contrleur, et ainsi tudier de faon plus formelle et approfondie la dynamique
du systme en boucle ouverte et/ou en boucle ferme. On supposera ici pour
simplier que dim(u) = 1, dim(y) = 1 et que v = y
r
est la consigne que
doit suivre y (problme de rgulation mono-variable). On notera, par souci
de simplicit, (x, y, u, w, , v) les carts lquilibre ( x, y
r
, u, w,

, v).
92 CHAPITRE 2. FONCTIONS DE TRANSFERT
Figure 2.4 Le schma blocs en boucle ouverte.
2.2.2 Transfert avec perturbation et bouclage
Les quations du systme linaris tangent scrivent
_

_
d
dt
x = Ax + Bu + Dw
y = Cx
u = Ly + M + Nv
d
dt
= F + Gy + Hv
o les matrices A, B, D, C, L, M, N, F, G, et H sobtiennent partir des
drives partielles de f, h,

k et a. Par le calcul symbolique, on remplace
d
dt
par s pour obtenir le systme dquations algbriques suivant
_

_
sx = Ax + Bu + Dw
y = Cx
u = Ly + M + Nv
s = F + Gy + Hv
On rsoud simplement x = (sI A)
1
(Bu + Dw) et on forme alors
y = G(s)u + G
w
(s)w
avec G(s) et G
w
(s) les fractions rationnelles suivantes
G(s) = C(sI A)
1
B, G
w
= C(sI A)
1
D
Ceci nous donne le schma blocs du transfert en boucle ouverte de la Fi-
gure 2.4. Comme = (sI F)
1
(Gy + Hv), on a
u =
_
L + M(sI F)
1
G

y +
_
N + M(sI F)
1
H

v
2.2. SCHMAS BLOCS ET FONCTIONS DE TRANSFERT 93
r
Figure 2.5 Le schma blocs en boucle ferme ; conguration normale dune
boucle dasservissement.
Pour un problme de rgulation on note
v = y
r
et on choisit L = N et G = H. On a donc
u = K(s)(y
r
y) = K(s)e
avec K(s) la fraction rationnelle
K(s) = N + M(sI F)
1
H
On en dduit le schma blocs de la boucle ferme de la Figure 2.5. On notera
les indications de signe . Lintrt de ces schmas blocs rside surtout dans
leur cot fonctionnel et visuel. Ils permettent de mieux comprendre les liens
de cause eet.
Pour rsumer, on a obtenu de faon directe les relations entre les entres
w et y
r
et certaines variables comme y et e = y
r
y
y =
GK
1 + GK
y
r
+
G
w
1 + GK
w, (2.7)
e =
1
1 + GK
y
r

G
w
1 + GK
w (2.8)
Il est alors usuel de xer le cahier des charges dun asservissement K(s) en
donnant les gabarits pour les diagrammes de Bode (surtout celui relatif au
gain en fonction de la pulsation ) des transferts en boucle ferme entre y et
y
r
(performances du suivi de consigne) et entre e et w (performances en rejet
de perturbation). Nous renvoyons aux ouvrages classiques [70] et au cours de
SI des classes prparatoires.
94 CHAPITRE 2. FONCTIONS DE TRANSFERT
2.3 Marge de robustesse
2.3.1 Critre de Nyquist
Revenons au problme que nous avons voqu en introduction dans la
Section 2.1.1. tant donns le systme (2.1) et le rgulateur PI (2.2), on
cherche calculer le retard critique

au del duquel le systme en boucle


ferme devient instable. Le schma blocs en boucle ferme correspond celui
de la Figure 2.5 avec ici les transferts suivants
G(s) =
b
s + a
, G
w
(s) =
d
s + a
, K(s) =
_
K
p
+
K
i
s
_
e
s
Comme prcis dans lquation (2.7), on a
y =
GK
1 + GK
y
r
+
G
w
1 + GK
w
Ici, G(s) et K(s) sont les quotients de fonctions de s globalement dnies sur
le plan complexe.
Les objets que nous allons devoir manipuler sont des fonctions mro-
morphes sur le plan complexe C : une fonction mromorphe F(s) de la va-
riable complexe est en fait (voir par exemple [15]) le quotient P(s)/Q(s) de
deux fonctions entires P(s) et Q(s), la fonction Q tant non identiquement
nulle. Une fonction entire est la fonction associe une srie dont le rayon
de convergence est innie. Ainsi, F est mromorphe sur C si et seulement si
F(s) =

+
n=0
a
n
s
n

+
n=0
b
n
s
n
avec a
n
et b
n
deux suites de nombres complexes
7
telles que les sries associes
ont un rayon de convergence inni, c.--d. pour tout r > 0, lim
n+
a
n
r
n
=
lim
n+
b
n
r
n
= 0. Ainsi e
s
, cosh(

s), sin(s)/s sont des fonctions entires


et
cos(s)
sin(s)
, 1/s,
sin(s
2
)
cos(s
3
)
sont des fonctions mromorphes sur C. En revanche,
exp(1/s) nest ni une fonction entire, ni une fonction mromorphe sur C.
En eet, elle admet en 0 une singularit de degr inni. Pour une fonction
mromorphe
8
F =
P
Q
, les zros de P sont les zros de F et les zros de Q sont
les ples de F. De manire informelle, les fonctions entires peuvent tre vues
comme des polynmes de degr inni et les fonctions mromorphes comme
7. Il faut quau moins lun de b
n
soit dirent de 0.
8. On peut toujours choisir les fonctions entires P et Q pour quelles naient aucun
zro en commun.
2.3. MARGE DE ROBUSTESSE 95
lanalogue des fractions rationnelles en remplaant les polynmes par des
fonctions entires. Autour dun ple z
0
, fonctions mromorphes et fractions
rationnelles ont des dveloppements limits gnraliss trs similaires de la
forme
+

n=n
0
a
n
(z z
0
)
n
avec n
0
> 0 (a
n
0
,= 0) tant la multiplicit du ple.
Dans notre cas, on a les fonctions mromorphes G et K qui suivent
G(s) =
N
G
(s)
D
G
(s)
, K(s) =
N
K
(s)
D
K
(s)
avec
9
N
G
= b, D
G
= s + a, N
K
= (sK
p
+ K
i
)e
s
, D
K
= s
et on doit considrer dans le transfert en boucle ferme, la fonction mro-
morphe T
T =
GK
1 + GK
=
N(s)
D(s)
=
N
G
N
K
D
G
D
K
+ N
G
N
K
avec
N(s) = b(sK
p
+ K
i
)e
s
, D(s) = s(s + a) + b(sK
p
+ K
i
)e
s
La valeur critique

est la valeur de partir de laquelle D(s) admet au


moins un zro dans le demi plan '(s) 0, i.e., un zro instable. Ce zro sera
un ple instable de T (il sera galement un ple instable du transfert depuis
la perturbation
G
w
1+GK
).
Comme a 0, b, K
p
, K
i
> 0, il est clair que les zros instables de D(s),
correspondent aux zros instables de 1+GK = 1+b
sK
p
+K
i
s(s+a)
e
s
. La fonction
s 1 + GK(s) est ici dnie pour s dirent de 0 et a < 0.
On va maintenant utiliser un rsultat important danalyse complexe qui
relie le nombre de zros et de ples dune fonction mromorphe F(s) dnie
sur un domaine du plan complexe, la variation de son argument lorsque
lon parcourt le bord du domaine dans le sens direct. On suppose, pour
que largument de F(s) soit dni sur le bord du domaine, que F est bien
dnie sur le bord (pas de ple sur le bord) et aussi quelle ne sannule pas
(pas de zro sur le bord). Comme on eectue une boucle, il est clair que la
variation totale de largument est ncessairement un multiple de 2, disons,
2N o N est alors le nombre de tours autour de 0 que fait le point daxe
9. On remarque que N
G
et D
G
ne sannulent pas en mme temps, ni N
K
et D
K
. Cest
important : il faut prendre ici les fractions irrductibles pour G et K.
96 CHAPITRE 2. FONCTIONS DE TRANSFERT
0
Figure 2.6 Le thorme de Cauchy pour une fonction mromorphe F(s)
de s C et un domaine C dlimit par la courbe ferme note (
s
; F(s)
dcrit une courbe ferme note (
F
lorsque s parcourt (
s
dans le sens direct.
Alors, le nombre de tours N que fait (
F
autour de 0 est reli aux nombres de
ples P et de zros Z de F(s) dans par N = Z P. Ici Z = 4 et P = 2,
donc F(s) fait deux fois le tour de 0 dans le sens direct, i.e., N = 2.
complexe F(s) lorsque s parcourt le bord dans le sens direct une seule fois. Le
Thorme 18 de Cauchy illustr sur la Figure 2.6, dit alors que N = Z P,
o Z est le nombre de zros et P le nombre de ples lintrieur du domaine.
Les zros et les ples sont compts avec leur multiplicit. On en donne ici
un nonc plus formel dont la preuve complte sappuie sur le thorme des
rsidus appliqu la fonction F

/F (voir [53]).
Thorme 18 (Cauchy). Soient (
s
une courbe ferme simple dans le plan
complexe C oriente dans le sens direct, et F(s) une fonction mromorphe
nayant ni ples ni zros sur (
s
. Soit (
F
la courbe ferme du plan complexe
dcrite par F(s) lorsque s parcourt (
s
dans le sens direct. Notons N le nombre
de tours (compts dans le sens direct) que fait (
F
autour de 0, et P et Z
respectivement le nombre de ples et de zros contenus lintrieur de (
s
.
Alors on a lgalit suivante
N = Z P
Dmonstration. Sur le domaine dlimit par (
s
on peut toujours crire F(z) =
R(z)
Q(z)
avec
R(z) =
Z

k=1
(z r
k
)

R(z), Q(z) =
P

k=1
(z q
k
)

Q(z)
o les z
k
sont les Z zros et les q
k
les P ples (apparaissant plusieurs fois
sils sont multiples) et o les fonctions analytiques

R et

Q ne sannulent ni
2.3. MARGE DE ROBUSTESSE 97
Figure 2.7 La boucle que doit faire s pour englober tout le demi plan
partie relle positive tout en vitant le ple de GK(s) = b
sK
p
+K
i
s(s+a)
e
s
en
s = 0 ; R > 0 est grand et > 0 est petit.
sur la courbe ferme (
s
ni sur le domaine quelle entoure. Largument de F
est la partie imaginaire de log F :
log F(z) =
Z

k=1
log(z r
k
)
P

k=1
log(z q
k
) + log

R(z) log

Q(z)
Ainsi la variation de largument de F lorsque z dcrit (
s
est la somme de trois
termes : les variations des arguments des log(zr
k
), les opposs des variations
des arguments des log(zq
k
) et la variation de largument de log(

R(z)/

Q(z)).
Or la variation de largument de log(z r
k
) ou de log(z q
k
) est 2 car r
k
et q
k
sont entours par (
s
. Comme

R(z)/

Q(z) ne sannule pas, la variation
de son argument vaut 0 lorsque z parcours une fois (
s
10
. Ainsi la variation
de largument de F est bien Z P.
Dans notre cas, F = 1+GK = 1+b
sK
p
+K
i
s(s+a)
e
s
admet un ple simple en 0.
Prenons de la forme dun demi-disque comme illustr sur la Figure 2.7 avec
R > 0 grand et > 0 petit. On note (
R,
le bord de . On voit que si 1+GK
admet un zro dans le demi-plan '(s) 0, il doit faire partie ncessairement
dun tel pour un R assez grand et un assez petit. Maintenant, il faut
10. Pour sen convaincre, il sut de dformer la courbe ferme (
s
en la rduisant conti-
nment en un point, intrieur au domaine initialement entour par (
s
. Au cours de cette
dformation (homotopie),

R(z)/

Q(z) ne sannule jamais, son argument est donc bien dni


et sa variation sur un tour de la courbe dforme est un multiple de 2. la n de la
dformation, la courbe ferme suivie par z est rduite un point et donc la variation de
largument de

R(z)/

Q(z) est nulle. Au cours de la dformation, la variation ne peut pas


sauter brusquement dun multiple non nul de 2 0 pour cause de continuit. Ainsi cette
variation doit tre nulle ds le dpart.
98 CHAPITRE 2. FONCTIONS DE TRANSFERT
compter le nombre de tour que fait F = 1 + GK autour de 0 lorsquon
parcoure (
R,
: cest ncessairement dans le sens positif car ici 1 + GK, na
pas de ple dans , c.--d. P = 0.
Maintenant, pourquoi considrer F = 1 + GK au lieu de D = N
G
N
K
+
D
G
D
K
la place de F. On viterait le ple en s = 0 quon est oblig de
contourner avec le petit demi-cercle de rayon . Cela vient du fait que sur la
partie de (
R,
loin de lorigine (bref sur le grand demi cercle de rayon R) GK
est trs petit et reste donc trs proche de 0. Sur cette partie, F reste ainsi trs
proche de +1 et ne tourne donc pas autour de 0. Le fait que GK soit petit
pour les s de (
R,
loin de lorigine vient du fait que les transferts G et K sont
des transferts causaux : GK(s) = b
sK
p
+K
i
s(s+a)
e
s
tend vers 0 lorsque s tend
vers linni tout en restant partie relle positive. On voit que > 0 est
capital ici pour avoir cette proprit et que ce nest plus vrai pour s tendant
vers linni avec une partie relle ngative.
Compter le nombre de tours de 1 + GK autour de 0 revient compter
le nombre de tours de GK autour de 1. Ainsi, si la courbe ferme du plan
complexe dcrite par GK(s) avec s dcrivant le contour de la Figure 2.7
nentoure pas 1, alors, F = 1 + GK nentoure pas 0. On a donc N = 0, or
P = 0 donc, daprs le Thorme de Cauchy 18, on dduit Z = 0, F nadmet
pas de zro dans le demi plan '(s) > 0. On vient de retrouver ici le critre
du revers (connu en classes prparatoires).
r
Figure 2.8 Exemple de systme pour ltude du Thorme de Cauchy.
Exemple 13 (Illustration du Thorme de Cauchy pour dirents contours).
Soit le systme de fonction de transfert
1
s+2
boucl par un contrleur PI de
fonction de transfert K
P
+
K
I
s
= 3 +
40
s
. Pour ltude du systme en boucle
ferme reprsent sur la Figure 2.8, on doit tudier lannulation de la fonction
de transfert
1 +
sK
p
+ K
I
s(s + 2)
=
s
2
+ 5s + 40
s(s + 2)
Ce transfert possde deux ples (0 et 2) et deux zros complexes conjugus
53i

15
2
. On peut, en utilisant dirents contours comme on la fait sur la
Figure 2.9, vrier la formule N = Z P du Thorme 18 de Cauchy.
2.3. MARGE DE ROBUSTESSE 99
-50 0 50
-50
0
50
Z=0, P=0
-200 0 200 400 600 800
-1000
0
1000
-2 -1 0 1 2
-2
0
2
N=0
-50 0 50
-50
0
50
Z=2, P=2
-200 0 200 400 600 800
-1000
0
1000
-2 -1 0 1 2
-2
0
2
N=0
-50 0 50
-50
0
50
Z=2, P=1
-800 -600 -400 -200 0 200
-1000
0
1000
-2 -1 0 1 2
-2
0
2
N=1
-50 0 50
-50
0
50
Z=0, P=1
-800 -600 -400 -200 0 200
-1000
0
1000
-2 -1 0 1 2
-2
0
2
N=-1
Figure 2.9 Illustrations du Thorme 18 de Cauchy. Gauche : courbe
ferme parcourue par s. Milieu : lieu de 1 +
sK
p
+K
I
s(s+2)
. Droite : agrandissement
du lieu autour de 0.
Des considrations ci-dessus on dduit sans peine le critre de Nyquist
pour les systmes boucls de la Figure 2.5.
Dnition 8 (Lieu de Nyquist). tant donne une fonction de transfert
en boucle ouverte G(s) strictement causale et un transfert de contrleur K(s)
galement strictement causal
11
. On suppose que, sil y a des simplications
par des facteurs du type (s s
0
) dans le produit G(s)K(s), elles ne portent
pas sur des s
0
partie relle strictement positive. On appelle lieu de Nyquist
la courbe dcrite dans le plan complexe par G()K() lorsque parcourt
+ vers .
Thorme 19 (Critre de Nyquist). Avec les notations de la Dnition 8,
11. Par strictement causal, on signie ici que G(s) et K(s) sont des fonctions mro-
morphes qui tendent vers zro quand s tend vers linni dans le demi plan complexe
partie relle positive. Cest le cas pour des fractions rationnelles dont le degr du numra-
teur est strictement infrieur celui du dnominateur.
100 CHAPITRE 2. FONCTIONS DE TRANSFERT
le systme en boucle ferme de transfert
GK
1 + GK
est asymptotiquement stable si et seulement si le lieu de Nyquist ne passe
pas par 1 et sil entoure le point 1 dans le sens indirect autant de fois que
GK admet de ples partie relle strictement positive (les ples sont compts
avec leur multiplicit).
Exemple 14 (Stabilisation avec retard). Considrons le systme de fonction
de transfert avec retard
G(s) = exp
_

s
2
_
s
2
+ 4s + 2
s
2
1
(2.9)
On boucle ce systme avec un contrleur P proportionnel de gain k, pour
obtenir le schma en boucle ferme reprsent sur la Figure 2.10. On se
r
Figure 2.10 Bouclage dun systme retard.
demande sous quelle condition sur k, le paramtre de rglage du contrleur, on
obtient la stabilit en boucle ferme. Pour rpondre cette question, il sut de
tracer le lieu de Nyquist de kG(s), quon a reprsent sur la Figure 2.11 (pour
k = 1). Le transfert G(s) comporte un unique ple partie relle positive.
Daprs le Thorme 19, pour que le systme en boucle ferme reprsent sur
la Figure 2.10 soit asymptotiquement stable, il faut et il sut que le lieu de
Nyquist entoure une seule fois (dans le sens indirect) le point 1. Ce nest
pas le cas avec k = 1, comme on peut le constater sur la Figure 2.11. Le
paramtre k agit comme une homothtie. Pour k ]
1
2
,
1
1.1845
[, le systme est
asymptotiquement stable, il est instable sinon.
Si, GK admet des ples sur laxe imaginaire, alors le lieu de Nyquist
admet des branches innies. Il convient alors pour compter correctement le
nombre tours de modier lgrement le contour le long de laxe imaginaire
descendant comme on la fait auparavant pour le ple en s = 0 (voir Fi-
gure 2.7) : on contourne chaque ple imaginaire avec un petit demi-cercle,
centr sur ce ple imaginaire et qui passe du cot de '(s) > 0.
2.3. MARGE DE ROBUSTESSE 101
-2 -1. 5 -1 -0. 5 0 0.5 1
-1. 5
-1
-0. 5
0
0.5
1
1.5
-1.1845
Figure 2.11 Lieu de Nyquist de kG(s) donn par (2.9) avec k = 1.
Noter enn que, en toute gnralit, pour que le critre de Nyquist im-
plique la stabilit asymptotique, il faut quil existe > 0 tel que,
lim
[s[ +
'(s)
G(s)K(s) = 0
ce qui est le cas pour les fractions rationnelles et les fractions de quasi-
polynmes tels que ceux que nous avons considrs. En eet si GK vrie
les conditions du critre de Nyquist, alors pour un parcours en s lgrement
dcal vers la gauche, s = + , allant de + vers et 0 <
trs petit a priori, on aura un lieu de Nyquist, GK( + ) lgrement
dplac et qui entourera le point 1 avec le mme nombre de tours que
celui pour lequel = 0. Ainsi, on est sr que les zros de 1 +GK et donc de
D = N
G
N
K
+D
G
D
K
sont tous partie relle infrieure . Nous dtaillons
ces conditions ici car nous souhaitons prendre en compte des retards. Donc
on ne peut pas se contenter de prendre G et K dans la classe des fractions
rationnelles en s uniquement. On souhaite aussi traiter des fractions en s
et e
s
.
102 CHAPITRE 2. FONCTIONS DE TRANSFERT
2.3.2 Marge de phase
Revenons lexemple G(s)K(s) = b
sK
p
+K
i
s(s+a)
e
s
. Nous allons calculer ex-
plicitement le retard critique

> 0 partir duquel, le lieu de Nyquist


commence entourer 1. Il est donn par ce que lon appelle la marge de
phase.
On commence par une normalisation en posant
s =
s
a
, k = abK
p
, =
K
i
K
p
a
, = a
Alors
G(s)K(s) = G( s)K( s) = ke
s
s +
s( s + 1)
Ainsi, quitte changer lchelle de temps, on peut toujours supposer a = 1,
on confond dans la suite s et s et on crit
G(s)K(s) = ke
s
s +
s(s + 1)
Sur la Figure 2.12, on a trac le lieu de G(s)K(s) pour s suivant le
parcours de la Figure 2.7. Le point 1 est lextrieur du domaine entour
par le lieu de Nyquist. En gnral, on ne reprsente pas le grand demi-cercle
du demi plan droit. On ne trace que la gure simplie qui est droite. On
sait alors quil faut refermer cette courbe en partant de la branche innie du
bas = lorsque = 0
+
vers celle du haut = + lorsque = 0

en
passant linni par le demi plan droit ' > 0.
On trouvera sur la Figure 2.13, les dformations successives quon observe
lorsque le paramtre grandit, c.--d. lorsquon change les rglage du contr-
leur. On se convaincra sans dicult que lorsque = 0, le lieu de Nyquist de
G(s)K(s) nentoure jamais 1 quels que soient k et > 0. Noter que lorsque
= 0, la stabilit est donne par les racines dun polynme de degr deux et
on a dj vu, au premier chapitre, quun rgulateur PI sur un premier ordre
est toujours asymptotiquement stable. Mais ce nest pas pour retrouver ce
fait trivial que lon a fait tout cela. Cest pour voir ce qui se passe lorsque le
retard est non nul.
Pour les mmes k et , quelle relation y-a-t-il entre le lieu de Nyquist
de G(s)K(s) lorsque = 0 et > 0 ? Pour s = , G()K() subit une
rotation de (multiplication par e

). Comme lillustre la Figure 2.14,


la valeur critique

partir de laquelle 1 rentre lintrieur du domaine


entour par le lieu de Nyquist, est directement lie aux points dintersection
du lieu de Nyquist pour = 0 avec le cercle unit. Pour chaque k et , on note
les deux valeurs de pulsation qui correspondent aux points dintersection
2.3. MARGE DE ROBUSTESSE 103
Figure 2.12 Le lieu de Nyquist de G(s)K(s) = ke
s s+
s(s+1)
avec k = 1,
= 0 et = 0.5. ; la courbe ferme du plan complexe dcrite par G(s)K(s)
lorsque s dcrit la courbe (
R,
de la Figure 2.7 pour R 1 et 0 < 1.
Figure 2.13 Le lieu de Nyquist de G(s)K(s) = ke
s s+
s(s+1)
avec k = 1,
= 0 et diverses valeurs de .
104 CHAPITRE 2. FONCTIONS DE TRANSFERT
Figure 2.14 La marge de phase pour G(s)K(s) = k
s+
s(s+1)
avec k = 1,
= 0.5.
avec le cercle unit. Un simple calcul faisant intervenir une quation bi-carre
traduisant le fait que le complexe k
(+)
(+1)
est de module 1, donne
=

(1 k
2
) +
_
(1 k
2
)
2
+ 4k
2

2
2
On note [0, [ largument suivant (noter le signe au second membre)
e

= k
( + )
( + 1)
cest la marge de phase. Alors,

est le retard critique au del duquel des instabilits apparaissent. La marge


de phase na pas vraiment de sens intrinsque. Seul compte en fait le retard
critique

qui sen dduit : si, par exemple, la pulsation critique est trs
petit alors le retard critique

est grand ds que nest pas proche de 0.


Pour k = 1 et = 0.5, la Figure 2.15 montre la perte progressive de
stabilit lorsque grandit, la valeur critique tant autour de 2.7, daprs
les formules ci-dessus. De ce graphique on tire aussi linformation suivante :
lorsque franchit le seuil

, deux ples complexes


12
conjugus traversent en
12. Ce sont les ples en boucle ferme, pas ceux de GK mais ceux de 1/(1 +GK).
2.3. MARGE DE ROBUSTESSE 105
Figure 2.15 Lieu de Nyquist pour G(s)K(s) = ke
s s+
s(s+1)
avec k = 1,
= 0.5 et diverses valeurs du retard .
mme temps laxe imaginaire en venant de la partie stable. On sait cela car
juste aprs

, 1 est entour deux fois donc on a exactement deux racines


partie relle strictement positive : un peu avant

, le systme est trs oscillant


mais les oscillations sont lentement amorties ; un peu aprs

, le systme est
toujours trs oscillant mais les oscillations sont lentement amplies.
2.3.3 Marge de gain
La marge de gain permet de quantier la prservation de la stabilit,
quand sur le modle
d
dt
y = ay + bu + dw
on connat mal le coecient b devant u (on connat son signe cependant),
c.--d. quon connat mal le gain de la commande. Cette incertitude revient
multiplier le bloc contrle K(s) par un coecient k > 0, en thorie proche
de 1.
1
1+G(s)K(s)
tant stable, on cherche savoir partir de quelle valeur
106 CHAPITRE 2. FONCTIONS DE TRANSFERT
de k (en partant de 1), le transfert
1
1+kG(s)K(s)
devient instable. Les valeurs
maximales et minimales admissibles de k sont appeles marges de gain.
Reprenons lexemple G(s)K(s) = e
s s+
s(s+1)
. On considre tout dabord
= 0. On voit daprs les divers lieux de Nyquist tracs sur la Figure 2.13 que,
quelle que soit lhomothtie de rapport k positif, ce dernier ne passe jamais
par 1. Ainsi, on a une marge de gain innie dans ce cas. Cest une faon
indirecte de retrouver le rsultat du Chapitre 1 qui dit quun rgulateur PI
sur un 1er ordre stable est toujours asymptotiquement stable pourvu quon
connaisse le signe du gain sur le contrle.
Cependant, supposons que nous ayons un petit retard, par exemple =
0.25 pour = 0.5. Alors on voit sur la Figure 2.15 que ce petit retard ne
modie sensiblement le lieu de Nyquist quautour de 0, l o les pulsations
sont grandes en valeurs absolues. Plus est grand, plus la multiplication par
exp() aura tendance enrouler le lieu de Nyquist autour de 0. Aussi, il
est vident que, quelle que soit la taille du retard > 0, mme trs petit, on
trouvera toujours une dilatation du lieu de Nyquist, qui lamne passer par
1. Bien-sr, plus le retard sera petit, plus la dilatation k devra tre grande
pour introduire une instabilit.
On retrouve ainsi ce que nous avons vu dj au chapitre prcdent sur les
dynamiques ngliges : les gains K
p
et K
i
ne peuvent pas tre pris arbitrai-
rement grands. Ici, un petit retard = > 0 correspond une dynamique
rapide nglige. Il est intressant de remarquer que le Thorme de Tikho-
nov 15 porte sur des systmes singulirement perturbs, cest dire avec un
petit paramtre positif devant d/dt. Cest formellement et aussi fondamen-
talement la mme chose pour un retard dordre : dans loprateur e
s
on
retrouve bien le mme petit paramtre devant s = d/dt.
2.3.4 Lecture des marges sur le diagramme de Bode
Il sut de prendre un exemple pour comprendre comment on fait. Sur la
gure 2.16 on a trac le diagramme de Bode pour G(s)K(s) = e
s
s+
1
2
s(s+1)
qui
nadmet aucun ple partie relle strictement positive. Ainsi on voit que
la marge de gain k

est gale linverse du module de GK() pour


la pulsation =
k
o largument de GK passe la premire fois par
(sur le diagramme cela correspond au premier saut de 180 +180
degrs).
La marge de phase

correspond lcart entre la phase de GK()


et pour la pulsation =

correspondant au premier passage du


module de GK par 1 (sur le diagramme cela correspond dont 0 en
dcibel (20 log
10
)).
2.3. MARGE DE ROBUSTESSE 107
10
2
10
1
10
0
10
1
30
20
10
10
20
30
40
g
a
i
n
:

m
o
d
u
l
e

d
e

G
K

e
n


d
B
(rad/s)
10
2
10
1
10
0
10
1
150
100
50
0
50
100
150
p
h
a
s
e
:

a
r
g
u
m
e
n
t

d
e

G
K

e
n

d
e
g
r

(rad/s)
0
Figure 2.16 Visualisation sur le diagramme de Bode des marges de gains
k

et de phase

lorsque G(s)K(s) = e
s
s+
1
2
s(s+1)
.
Alors la marge de retard, qui seule une signication physique, est donne
par

. Dans cette formule lunit dangle pour

et

doit tre la
mme (il est conseill prendre des radians pour ne pas se tromper).
2.3.5 Ples dominants
Supposons, comme nous lavons fait dans le chapitre prcdent, que le
capteur qui fournit y nest pas instantan mais a une petite dynamique que
lon peut reprsenter comme un ltre rapide de transfert
1
1+s
. Ainsi G(s)
est remplac par G

= G(s)R

(s). Supposons 1/(1 +G(s)K(s)) stable. Alors


pour > 0, susamment petit, 1/(1 + G

(s)K(s)) reste stable.


Pour assez petit, leet sur le lieu de Nyquist de G(s)K(s) de la multipli-
cation par
1
1+s
, nest notable que pour des s = assez grands en module. Or,
pour de tels de lordre de 1/, G()K() est dj trs petit et donc seule
la partie du lieu qui est proche de lorigine est modie. Donc le nombre de
tour autour du point 1 ne change pas, et donc le transfert 1/(1+G

(s)K(s))
108 CHAPITRE 2. FONCTIONS DE TRANSFERT
est lui aussi stable. Aussi, il est lgitime de faire brutalement = 0 dans le
transfert G

pour ne garder que G. On dit alors que G(s) ne conserve que


les ples dominants : il est ainsi lgitime dliminer les ples trs rapides et
stables.
En rsum, ne conserver que les ples dominants dans le transfert G
est identique au fait de prendre comme modle de contrle la partie lente
du systme, la partie rapide tant stable : lapproximation, dcrite dans la
Section 1.4.1 du systme lent/rapide (

) par le systme lent (


0
) est de
mme nature que celle de G

par G = G
0
.
2.4 Complments
2.4.1 Calcul de tous les contrleurs PID stabilisant un
systme du premier ordre retard
Comme on la vu, le contrleur PI et plus gnralement le contrleur
PID (D pour drive) est extrmement ecace et utilisable dans un nombre
important de situations. On a vu que le transfert K dun PI est K(s) =
k
P
+
k
I
s
avec k
P
et k
I
les gains proportionnel et intgral. Le rgulateur PID
a simplement le transfert
K(s) = k
P
+
k
I
s
+ k
D
s
o k
D
est le gain driv. Ainsi, rgler un PID revient trouver les bons gains,
quand cest possible, k
P
, k
I
et k
D
, pour avoir un transfert en boucle ferme
GK/(1 + GK) au minimum stable.
On a vu comment tester sa robustesse, notamment au retard. On propose
ici quelques rsultats thoriques importants qui donnent des conditions n-
cessaires et susantes pour obtenir la stabilit en boucle ferme en utilisant
un tel contrleur. Ces rsultats se limitent aux systmes du premier ordre (on
se rfrera [64], pour direntes extensions aboutissant des noncs beau-
coup plus indirects), leur dmonstration fait appel des rsultats danalyse
complexe permettant de qualier la ngativit des racines dun polynme
sans les calculer. De tels critres (critre de Routh, ou de Hermite-Biehler
noncs dans les Thormes 7 et 6) sont souvent utiliss car numriquement
trs simples.
On considre un systme du premier ordre retard dont la fonction de
transfert est
G(s) =
k
1 + s
e
s
(2.10)
2.4. COMPLMENTS 109
o k R
+
, R

, R
+
. Dans un premier temps, on considre quon
utilise seulement un contrleur proportionnel
K(s) = k
P
(2.11)
et quon lutilise tel que reprsent sur la Figure 2.17.
Figure 2.17 Bouclage dun systme du premier ordre retard.
Deux cas sont alors considrer. Soit le systme est stable (cas du Tho-
rme 20) en boucle ouverte, et on cherche juste amliorer ses performances
par un contrleur en boucle ferme, soit le systme est instable (cas du Tho-
rme 21) et cest la boucle ferme de le stabiliser.
Thorme 20 ([64]). On suppose > 0, alors lensemble des contrleurs
proportionnels prservant la stabilit du systme (2.10) est dni par les va-
leurs admissibles suivantes

1
k
< k
P
<
1
k cos z
1
o z
1
est lunique racine sur ]/2, [ de lquation
tan(z) =

z
On notera de plus que la borne suprieure sur k
P
dans cet nonc est une
fonction dcroissante du retard . Dans le cas instable, on souhaite en gnral
que le contrleur stabilise galement le systme en labsence de retard. On
aboutit alors lnonc suivant.
Thorme 21 ([64]). On suppose < 0. Une condition ncessaire pour
que le contrleur proportionnel (2.11) stabilise la fois le systme (2.10) et
ce mme systme en labsence de retard est que < [[. On suppose cette
condition vrie, alors lensemble des contrleurs proportionnels assurant la
stabilit du systme (2.10) est dni par les valeurs admissibles suivantes

z
2
1
+
_

_
2
< k
P
<
1
k
o z
1
est lunique racine sur ]0, /2[ de lquation
tan(z) =

z
110 CHAPITRE 2. FONCTIONS DE TRANSFERT
La preuve de ces thormes utilise lextension du Thorme 6 de Hermite-
Biehler pour les quasi-polynmes (i.e. des polynmes en s avec coecients en
e
s
comme on en rencontre dans les fonctions de transferts des systmes
retard boucls).
Le cas de la stabilisation par un PID
K(s) = k
P
+
k
I
s
+ k
D
s (2.12)
est trait dans lnonc suivant (un peu compliqu premire vue mais simple
mettre en uvre). Seul le cas des systmes stables en boucle ouverte est
trait ici. On se reportera [64] pour un expos concernant le cas des systmes
instables en boucle ouverte.
Thorme 22 ([64]). On suppose > 0, alors lensemble des contrleurs
PID (2.12) prservant la stabilit du systme (2.10) est dni par les valeurs
admissibles suivantes

1
k
< k
P
<
1
k
_

1
sin(
1
) cos(
1
)
_
o
1
est lunique racine sur ]0, [ de lquation
tan() =

+

Pour k
p
en dehors de ces bornes, il nexiste pas de contrleur PID (2.12)
stabilisant (2.10). Une fois choisi k
p
dans ces bornes, il faut et il sut pour
stabiliser (2.10) de choisir (k
I
, k
D
) comme suit.
Soient z
1
, z
2
les deux racines relles (ordonnes) sur ]0, 2[ de lquation
kk
P
+ cos z

z sin z = 0
On note m(z) =

2
z
2
, b(z) =

kz
_
sin z +

z cos z
_
, et m
i
= m(z
i
), b
i
= b(z
i
),
i = 1, 2.
1. si k
P
]
1
k
,
1
k
[, alors (k
I
, k
D
) doit tre choisi de telle sorte que

k
<
k
d
<

k
, k
i
> 0 et k
d
> m
1
k
I
+ b
1
2. si k
P
=
1
k
, alors (k
I
, k
D
) doit tre choisi de telle sorte que k
d
<

k
,
k
i
> 0 et k
d
> m
1
k
I
+ b
1
3. si k
P
]
1
k
,
1
k
_

1
sin(
1
) cos(
1
)
_
[, alors (k
I
, k
D
) doit tre choisi de
telle sorte que m
1
k
I
+ b
1
< k
d
< min(m
2
k
I
+ b
2
,

k
), et k
i
> 0
On pourra remarquer la similitude apparente entre les noncs des Tho-
rmes 22 et 20. Les bornes suprieures sur le gain proportionnels sont di-
rentes. En eet, lnonc 22 ncessite bien souvent lusage eectif du terme
intgral et du terme driv car le point (k
I
, k
D
) = (0, 0) peut tre exclu de
ladhrence des contraintes (dans le cas 3, on peut avoir b
2
> b
1
> 0).
2.4. COMPLMENTS 111
2.4.2 Mthodes de rglage de Ziegler-Nichols
Il existe plusieurs mthodes systmatiques de rglage des rgulateurs PID.
Ces mthodes sont souvent utilises en pratique comme heuristiques, sans
justication. On propose de les re-situer dans le cadre danalyse de stabi-
lit que nous avons prsent, notamment la Section 2.4.1. Ces rgles sont
trs nombreuses et dirent par les performances quon peut en atteindre
en terme de temps de convergence, dpassement prvu, robustesse, etc. His-
toriquement, ce sont les rgles de Ziegler-Nichols [74, 75] qui sont apparues
les premires, elles sont toujours parmi les plus utilises. On trouve aussi
les rgles de Cohen-Coon [18], Chien-Hrones-Reswick [17], ou Lee-Park-Lee-
Brosilow [45].
Premire mthode de Ziegler-Nichols
Pour concevoir un rgulateur PID pour un process donn G(s), on ralise
lexprience boucle-ouverte suivante. On enregistre la rponse du systme
un chelon dentre et on relve les paramtres a et construits partir de
la ligne de plus grande pente de la rponse. On note galement et k tels que
reprsents sur la Figure 2.18, construits partir de la valeur asymptotique
estime et du temps de rponse 1 e
1
= 0.63
13
.
Figure 2.18 Dtermination dun modle du premier ordre retard partir
de la rponse un chelon donn par y(t) = k(1 e
t

)I
t
.
Les rglages heuristiques de Ziegler-Nichols sont reports dans le ta-
bleau 2.1. Ils permettent de rgler au choix un contrleur P, un PI ou un
13. Un modle du premier ordre atteint environ 63% de sa valeur nale en un temps
gal 1 fois sa constante de temps
112 CHAPITRE 2. FONCTIONS DE TRANSFERT
PID.
Contrleur k
P
k
I
k
D
P 1/a
PI 0.9/a 0.3/(a)
PID 1.2/a 0.6/(a) 0.6/a
Table 2.1 Rglages de Ziegler-Nichols premire mthode.
Seconde mthode de Ziegler-Nichols
La seconde mthode de Ziegler-Nichols ncessite une exprimentation en
boucle ferme avec un contrleur dj install dont il sut de modier les
gains. On boucle le systme avec un rgulateur P (en mettant le gain intgral
et le gain driv 0) dont on fait progressivement augmenter le gain jusqu
atteindre un rgime oscillatoire entretenu. Autrement dit, on atteint la limite
de stabilit. Une fois ce rgime obtenu, on note k
u
le gain proportionnel
ultime et la priode des oscillations T
u
lui correspondant et on rgle alors
le contrleur comme expliqu sur le tableau 2.2.
Contrleur k
P
k
I
k
D
P 0.5k
u
PI 0.4k
u
0.5k
u
/T
u
PID 0.6k
u
1.2k
u
/T
u
0.075k
u
T
u
Table 2.2 Rglages de Ziegler-Nichols seconde mthode.
Bien que trs simple utiliser, ce mode opratoire de rglage de contr-
leur a le dsavantage de ncessiter la presque dstabilisation de linstallation
quon souhaite contrler. Cet inconvnient peut tre vit. On pourra se re-
porter [70] pour une prsentation dune mthode de rglage aboutissant aux
coecients de la seconde mthode de Ziegler-Nichols, sans risque de dsta-
bilisation. Cette mthode, qui utilise un bloc relai en boucle ferme, consiste
faire apparatre un cycle limite dont on analyse les caractristiques pour
retrouver les paramtres du systme contrler.
Liens avec les rsultats de stabilisation
Il est assez simple de faire un lien entre la seconde mthode de Ziegler-
Nichols et le Thorme 20 si on suppose que le systme quon cherche
2.4. COMPLMENTS 113
contrler est eectivement un systme du premier ordre retard stable de la
forme (2.10). Ce thorme montre quil existe une valeur dstabilisante du
gain proportionnel. Cest cette valeur k
u
que lexprience en boucle ferme
permet destimer sans connaissance des paramtres du modle. Ensuite, la
mthode de Ziegler-Nichols du tableau 2.2 propose de rduire ce gain et donc
de se retrouver avec un contrleur proportionnel stabilisant.
Les coecients proposs par la premire mthode de Ziegler-Nichols sont
en pratique trs proches de ceux de la deuxime mthode. Nanmoins, cest
de ces derniers que nous allons prouver une proprit trs intressante. Dans
le cas o le systme contrler est eectivement un systme du premier ordre
retard stable de la forme (2.10), un calcul direct montre que le paramtre
a tel que dni sur la Figure 2.18 vaut
a = k

Notons = /. Avec cette valeur, les gains proposs dans le tableau 2.1
sont
k
P
=
1.2
k
, k
I
=
0.6
k
2

, k
D
=
0.6
k
(2.13)
Considrons en premier lieu le gain proportionnel suggr. Nous allons mon-
trer quil est toujours acceptable, en dautres termes, quil satisfait toujours
les hypothse du Thorme 22. Pour notre systme stable, le gain propos
satisfait k
P
> 0 >
1
k
. En ce qui concerne la borne suprieure indique dans
le Thorme 22, on peut la rcrire
k
max
=
1
k
_
1

1
sin
1
cos
1
_
o
1
est lunique solution sur ]0, [ de tan
1
=
1
1+

1
. En liminant en
fonction de
1
dans cette dernire quation, on peut tablir que
k
max
k
P
=
1
k
(
1
sin
1
cos
1
1.2)
=
1
k
_
cos
1
+

1
sin
1
1.2
_
Par construction,
1
]0, [. On vrie alors k
max
k
P
> 0. Par consquent,
le gain proportionnel suggr par la premire mthode de Ziegler-Nichols sa-
tisfait toujours les hypothses du Thorme 22 de stabilisation par un PID
pour un systme du premier ordre retard. Cest une importante justica-
tion de cette mthode heuristique. En outre, on peut montrer par une tude
114 CHAPITRE 2. FONCTIONS DE TRANSFERT
dtaille (on se reportera [64]) que les gains k
I
et k
D
dni dans (2.13)
par cette mme mthode satisfont galement les hypothses les concernant
de ce mme thorme. Plus prcisment, on peut tablir quils les satisfont
mais de manire possiblement non robuste lorsque devient grand (lorsque
le retard devient grand devant la constante de temps ), i.e. ils sont prs
des frontires des domaines dcrits dans le Thorme 22. Cest galement un
phnomne connu et observ en pratique qui engage souvent modier un
peu les gains au prix de performances moindres.
2.4.3 Prdicteur de Smith
Le prdicteur de Smith est un outil de rgulation pour les systmes
asymptotiquement stables en boucle ouverte retards mono-variables (pro-
pos dans [66]). Des gnralisations aux cas multi-variables et pour les sys-
tmes instables sont possibles mais alors il nest plus possible de raliser le
bouclage avec un transfert rationnel. On utilise alors des bouclages retards
rpartis faisant apparatre des fractions rationnelles en s et e
s
. Nous ne
prsentons ici que la version historique publie par Smith.
Dans ce contexte, un retard sur lentre ou la sortie est quivalent. En
eet les formes dtat suivantes possdent la mme fonction de transfert
x(t) = Ax(t) + Bu(t ), y(t) = Cx(t)
x(t) = Ax(t) + Bu(t), y(t) = Cx(t )
o x R
n
, u R et y R. Cette fonction de transfert est un produit dune
fraction rationnelle propre et dun oprateur retard
G(s) G
0
(s)e
s
= C(sI A)
1
Be
s
Lintrt du prdicteur de Smith est de permettre dutiliser un contrleur
Figure 2.19 Le prdicteur de Smith (zone grise).
K
0
conu pour le systme sans retard G
0
(s) en linsrant dans le schma
2.4. COMPLMENTS 115
gnral de la Figure 2.19. Les blocs additionnels

G
0
et

G(s) reprsentent la
connaissance du systme. Idalement, on a

G
0
= G
0
et

G = G. On suppose
donc le transfert G
0
stable.
Cest sous cette hypothse quon comprend le fonctionnement du prdic-
teur de Smith. Grce la boucle interne au prdicteur (dans la zone grise
de la Figure 2.19), le signal entrant dans le contrleur K
0
est
e
2
= y
r
G(s)u (G
0
(s) G(s))u = y
r
G
0
(s)u
Ce terme est la dirence entre la rfrence et la prdiction de la valeur de
sortie du systme lhorizon .
Figure 2.20 Forme quivalente du systme boucl avec prdicteur de
Smith.
Le comportement entre-sortie du systme boucl par le prdicteur de
Smith est quivalent celui du systme donn sur la Figure 2.20. Articiel-
lement, on a russi intercepter le signal de mesure avant le bloc retard et
donc nous ramener un problme de rgulation dun systme sans retard.
On notera toutefois que le retard est toujours prsent sur la sortie. Il na pas
disparu du problme mais il ninterfre pas avec la rgulation.
Figure 2.21 Implmentation du prdicteur de Smith avec ltre additionnel
de robustesse.
En pratique, le prdicteur de Smith soure dun manque de robustesse par
rapport une incertitude sur le retard, alors que la robustesse par rapport
aux paramtres est moins problmatique. En ce cas,

G et G sont dirents,
de mme que

G
0
et

G. Il ne sut pas toujours de calculer un contrleur K
0
procurant de bonnes marges de stabilit au systme G
0
boucl (on pourra
se reporter [47, Chap 10.8] pour de nombreux contre-exemples). Certaines
116 CHAPITRE 2. FONCTIONS DE TRANSFERT
conditions susantes de robustesse sont exposes dans [60] ; elles portent
sur le choix du contrleur K
0
mais sont diciles mettre en uvre. Il est
indispensable de lutiliser dans la conguration propose sur la Figure 2.21.
On a rajout dans la boucle externe un ltre de robustesse quon peut
ajuster pour dgrader les performances mais assurer une stabilit en boucle
ferme en dpit dune incertitude sur le retard. Lorsque ce ltre F(s) vaut 1
on retrouve le prdicteur de Smith des Figures 2.19 et 2.20.
2.4.4 Systmes non minimum de phase
Le transfert rationnel G(s) =
N(s)
D(s)
o N(s) et D(s) sont deux polynmes
premiers entre eux (i.e., pas de racine commune dans C) est dit non mi-
nimum de phase si lun de ses zros (i.e. lune des racines de N(s)) est
partie relle strictement positive. On parle alors de zro instable. Ce type de
systmes est rput dicile contrler. Ces systmes sont souvent associs
une rponse inverse lors dune variation en chelon de lentre
14
.
Pour comprendre la dicult, rien ne vaut un petit exemple. Considrons
le second ordre suivant
G(s) =
1 s
s
2
.
Ce transfert correspond, sous forme dtat, un double intgrateur, typique-
ment un systme mcanique rgi par la loi de Newton,
d
dt
x
1
= x
2
,
d
dt
x
2
= u
o la mesure y est une combinaison "contradictoire" de la position x
1
et la
vitesse x
2
:
y = x
1
x
2
.
En partant de lquilibre x
1
= x
2
= y = u = 0 pour les t 0, considrons
la rponse un chelon unitaire u = 1 pour t > 0. Un calcul simple donne
y(t) =
t
2
2
t pour t > 0. Ainsi au tout dbut y commence par tre ngatif
pour terme devenir positif. Si au lieu de 1 s on avait eu 1 + s, nous
naurions pas eu cette rponse inverse. Ainsi, pour rguler y, un contrleur
proportionnel ne sait pas dans quelle direction partir. Le bouclage u = K
p
y
conduit toujours une boucle ferme instable quelque soit le gain K
p
choisi.
En eet le systme boucl,
d
dt
x
1
= x
2
,
d
dt
x
2
= K
p
x
1
+ K
p
x
2
,
14. Cette rponse inverse nest pas cependant une caractrisation mathmatique du fait
quun zro soit instable.
2.4. COMPLMENTS 117
est instable ds que K
p
,= 0 : la matrice
_
0 1
K
p
K
p
_
est toujours instable
avec une trace et un dterminant de mme signe (voir le critre de Routh,
condition 1.12). En transfert, on retrouve ce rsultat en regardant les zros
de 1+GK avec K(s) = K
p
, soit 1+K
p
1s
s
2
= 0 qui donne s
2
K
p
s+K
p
= 0.
Avec un correcteur PI de transfert K(s) = K
p
+
K
i
s
(K
p
gain proportionnel
et K
i
gain intgral) la situation est identique : 1 + GK = 0 scrit 1 +
1s
s
2
_
K
p
+
K
i
s
_
= 0 soit
s
3
K
p
s
2
+ (K
p
K
i
)s + K
i
= 0.
Le critre de Routh (conditions 1.13) donne ici les conditions de stabilit
K
p
> 0, K
p
K
i
> 0, K
i
> 0, K
p
(K
p
K
i
) > K
i
qui sont impossibles satisfaire quelques soient les valeurs de K
p
et K
i
.
Il est possible, pour stabiliser, de remplacer le terme "intgral" par un
terme "driv"
K(s) = K
p
+ K
d
s
de gain K
d
. Maintenant, 1 + GK = 0 donne lquation dordre 2 suivante :
(1 K
d
)s
2
+ (K
d
K
p
)s + K
p
= 0
Ces racines sont stables si, et seulement si,
K
d
K
p
1 K
d
> 0,
K
p
1 K
d
> 0.
Un raisonnement simple montre que ces conditions de stabilit sont quiva-
lentes
0 < K
d
< 1, 0 < K
p
< K
d
,
Ces deux ingalits dnissent un triangle. Le fait que ce domaine de stabilit
soit si peu tendu dans le plan (K
p
, K
d
) est une indication de petites marges
de robustesse. Pour sen convaincre, il sut de tracer le lieu de Nyquist avec
K
d
= 1/2 et K
p
= 1/4, par exemple. De plus un terme "driv" amplie
notablement les bruits de mesure et donc il vaut mieux prendre K
d
petit.
Pour les systmes dordre plus lev, une telle analyse avec Routh nest
pas trs commode. Il est alors utile de tracer le lieu de Nyquist de GK pour
certaines valeurs des paramtres du correcteur K et danalyser les marges de
gain et de retard.
118 CHAPITRE 2. FONCTIONS DE TRANSFERT
Chapitre 3
Commandabilit, stabilisation,
feedback
Un systme command
d
dt
x = f(x, u) est un systme sous-dtermin.
La dirence entre le nombre dquations (indpendantes) et le nombre de
variables donne le nombre de commandes indpendantes m = dimu. Il faut
noter que le degr de sous-dtermination est ici inni car on ne manipule
pas des scalaires mais des fonctions du temps. Ltude des systmes sous-
dtermins dquations direntielles ordinaires est dune nature dirente de
celle des systmes dtermins qui ont t lobjet du Chapitre 1. Nanmoins,
toutes les notions que nous y avons vues vont nous tre utiles.
La particularit de ces systmes sous-dtermins est quon peut utiliser la
commande pour agir sur eux. En pratique, deux problmes nous intressent :
la planication et le suivi de trajectoires.
La notion clef de ces problmes est la commandabilit. Dans ce chapitre,
aprs une rapide dnition de cette proprit dans le cas non linaire gnral
(voir Dnition 10), nous tudions en dtails les systmes linaires
d
dt
x =
Ax + Bu. Leur commandabilit est caractrise par le critre de Kalman
(voir Thorme 23). Nous prsentons alors deux mthodes pour rsoudre les
problmes qui nous proccupent.
La premire mthode utilise la forme normale dite de Brunovsky. Lcri-
ture sous cette forme met en lumire un paramtrage explicite de toutes les
trajectoires en fonctions de m fonctions scalaires arbitraires t y(t) et dun
nombre ni de leurs drives. Ces quantits y, dites sorties de Brunovsky,
sont des combinaisons linaires de x. Elles permettent de calculer trs simple-
ment des commandes u faisant transiter le systme dun tat vers un autre.
Le problme de planication de trajectoire est ainsi rsolu. Ce point est d-
taill la Section 3.3.4. Les sorties de Brunovsky permettent galement de
construire le bouclage (feedback) qui assure le suivi asymptotique dune tra-
119
120 CHAPITRE 3. COMMANDABILIT, STABILISATION
Figure 3.1 Deux pendules accrochs au mme chariot dabscisse u, le
contrle.
jectoire de rfrence arbitraire. La convergence est obtenue par la technique
de placement de ples. On se reportera au Thorme 25.
La seconde mthode sattache optimiser les trajectoires. On caractrise
le contrle en boucle ouverte permettant daller dun tat vers un autre tout
en minimisant un critre quadratique. On calcule galement la commande
minimisant lcart quadratique entre la trajectoire de rfrence et la trajec-
toire relle. On montre que la solution optimale est donne par un feedback
dont les gains sont calculs partir dune quation matricielle de Riccati.
Cest la commande linaire quadratique. Cette technique est dtaille la
Section 3.4.
3.1 Un exemple de planication et de suivi de
trajectoires
Nous considrons un systme de deux oscillateurs de frquences di-
rentes soumis en parallle un mme contrle. Comme nous le verrons dans
lExemple 15, ce modle est dune porte assez gnrale. Il correspond, une
rcriture prs, la dynamique linarise dun systme quantique trois ni-
veaux dont les transitions entre le niveau fondamental et les deux niveaux
excits (dnergies direntes) sont contrles par la lumire dun laser.
3.1.1 Modlisation de deux oscillateurs en parallle
On considre deux pendules ponctuels accrochs un mme chariot de
position u (la commande), tels que reprsents sur la Figure 3.1. On note
i
3.1. UNEXEMPLE DE PLANIFICATIONET DE SUIVI DE TRAJECTOIRES121
et x
i
, linclinaison et labscisse
1
de la masse du pendule numro i, i = 1, 2.
Autour de lquilibre stable, les quations de Newton linarises sont
d
2
dt
2
x
1
= a
1
(x
1
u),
d
2
dt
2
x
2
= a
2
(x
2
u) (3.1)
o a
1
= g/l
1
et a
2
= g/l
2
sont deux paramtres positifs correspondant aux
carrs des pulsations (l
1
et l
2
correspondant aux longueurs supposes di-
rentes des pendules l
1
,= l
2
).
3.1.2 Planication de trajectoires
Soit T > 0 et un dplacement dsir D. On souhaite trouver un contrle
en boucle ouverte qui amne le systme de lquilibre en x
1
= x
2
= u = 0
t = 0 vers lquilibre x
1
= x
2
= u = D en t = T.
Pour trouver de telles trajectoires, le plus simple est dintroduire la nou-
velle variable
z =
x
1
a
1

x
2
a
2
Des calculs lmentaires donnent alors les relations suivantes
_

_
z =
x
1
a
1

x
2
a
2
z
(2)
= x
2
x
1
z
(4)
= (a
1
a
2
)u + a
1
x
1
a
2
x
2
(3.2)
o x
1
, x
2
et u sexpriment explicitement en fonction de z, z
(2)
et z
(4)
ds que
a
1
,= a
2
. Les deux quations (3.1), qui ne font intervenir que les trois variables
(x
1
, x
2
, u), sobtiennent en liminant z des trois quations prcdentes. Ainsi,
elles sont bien contenues dans les trois quations ci-dessus. En fait (3.2) est
une description quivalente de la dynamique du systme dcrit initialement
par (3.1) mais avec une quation de plus et une variable de plus z.
Lintrt de rajouter z vient du fait que si lon calcule x
1
, x
2
et u avec
les formules (3.2), alors les fonctions du temps x
1
(t), x
2
(t) et u(t) vrient
automatiquement les quations direntielles (3.1). Rciproquement, si les
fonctions du temps x
1
(t), x
2
(t) et u(t) vrient (3.1) alors en posant z =
a
2
x
1
a
1
x
2
, on obtient encore x
1
, x
2
et u via (3.2). Ainsi, on paramtrise
via z qui est une fonction arbitraire du temps, drivable au moins 4 fois,
toutes les solutions de (3.1). Le raisonnement prcdent montre clairement
1. En fait les vraies abscisses sont x
1
+ c
1
et x
2
+ c
2
, c
1
et c
2
constantes, au lieu de
x
1
et x
2
. u + c
1
et u + c
2
sont les abscisses des points auxquels sont suspendus les deux
pendules. Cependant les constants c
i
disparaissent dans les quations de Newton.
122 CHAPITRE 3. COMMANDABILIT, STABILISATION
que nous nen manquons aucune en les dcrivant comme des combinaisons
linaires de z, z
(2)
et z
(4)
.
Les trois conditions dquilibre en t = 0, x
1
= x
2
= u = 0, imposent la
valeur 0 z et ses drives jusqu lordre 3 (ordre 4 si on ne tolre pas de
discontinuits sur u) : z
(i)
(0) = 0 pour i = 0, 1, 2, 3, 4. De mme en t = T,
on a z(T) =
_
1
a
1

1
a
2
_
D et z
(i)
(T) = 0 pour i = 1, 2, 3, 4. Pour t ,= 0, T,
z(t) est libre. Il faut cependant respecter la continuit pour z et ses drives
jusqu lordre 4 (ou 3 si tolre des saut sur le contrle u). Une des fonctions
les plus simples z(t) qui respectent ces conditions est la suivante
z(t) =
_
1
a
1

1
a
2
_
D
_
t
T
_
(3.3)
o est la fonction C
4
croissante de R dans [0, 1] dnie par
() =
_
_
_
0, si 0 ;

5
+(1)
5
, si 0 1 ;
1, si 1
Nous avons obtenu explicitement une trajectoire allant de lquilibre dabs-
cisse 0 lquilibre dabscisse D en temps ni T arbitraire. Si on utilise le
contrle en boucle ouverte (z(t) est donne par (3.3))
u(t) =
z(t) +
_
1
a
1

1
a
2
_
z
(2)
(t) +
1
a
1
a
2
z
(4)
(t)
1
a
1

1
a
2
alors la solution de (3.1) qui passe en t = 0 par lquilibre x
1
= x
2
= 0,
d
dt
x
1
=
d
dt
x
2
= 0, passe en t = T par lquilibre x
1
= x
2
= D,
d
dt
x
1
=
d
dt
x
2
= 0.
On connat mme explicitement cette solution avec
x
1
(t) =
z(t) +
1
a
2
z
(2)
(t)
1
a
1

1
a
2
x
2
(t) =
z(t) +
1
a
1
z
(2)
(t)
1
a
1

1
a
2
Nous avons rsolu le problme de planication de trajectoires.
3.1.3 Stabilisation et suivi de trajectoires
Supposons donne une trajectoire de rfrence (par exemple issue de la
construction prcdente) note t (x
1,r
(t), x
2,r
(t), u
r
(t)) solution de (3.1).
3.1. UNEXEMPLE DE PLANIFICATIONET DE SUIVI DE TRAJECTOIRES123
On cherche un feedback qui assure le suivi asymptotique de cette trajectoire.
En dautres termes, nous cherchons des corrections sur le contrle en boucle
ouverte u
r
(t) pour compenser les dviations entre la trajectoire relle et la
trajectoire de rfrence. Ici, ltat du systme est form par les positions
(x
1
, x
2
) et les vitesses (v
1
, v
2
) (v
i
=
d
dt
x
i
, i = 1, 2). On note x
i
= x
i
x
i,r
et v
i
= v
i
v
i,r
les dviations en position et en vitesse par rapport la
rfrence (i = 1, 2). On cherche u en fonction des x
i
et v
i
. Le contrle
en boucle ferme u quon appliquera sera u
r
+u. Dans le cas particulier o
la trajectoire de rfrence correspond un point dquilibre, on parle alors
de stabilisation plutt que de suivi.
Comme les quations du systme sont linaires, un calcul direct montre
que x
i
et u vrient les mmes quations que x
i
et u
d
2
dt
2
x
1
= a
1
(x
1
u),
d
2
dt
2
x
2
= a
2
(x
2
u)
Aussi, il sut de rsoudre le problme de la stabilisation pour obtenir une
solution au suivi . Supposons donc que la trajectoire de rfrence est nulle
x
1,r
= x
2,r
= u
r
= 0. La faon la plus simple de concevoir le feedback
stabilisant est alors dutiliser une mthode de Lyapounov. Utilisons comme
fonction candidate tre de Lyapounov lnergie du systme. Pour u = 0,
lnergie du systme,
V =
1
2
(v
1
)
2
+
a
1
2
(x
1
)
2
+
1
2
(v
2
)
2
+
a
2
2
(x
1
)
2
,
reste constante les longs des trajectoires. Donc, comme les quations sont
linaires par rapport u, la drive de V le long des trajectoires est le produit
de deux termes : le premier facteur est u et le second est une fonction des
positions et vitesses uniquement. Il sut alors de prendre u du signe oppos
au second facteur (ce qui est facile comme nous allons le voir) pour faire
dcrotre cette nergie. On conclut alors par le Thorme 11 de LaSalle.
Faisons ici les calculs. On a
d
dt
V = (a
1
v
1
+ a
2
v
2
)u
Avec k paramtre strictement positif, on considre le feedback suivant
u = K(v
1
, v
2
) =
_
_
_
u
min
, si k(a
1
v
1
+ a
2
v
2
) u
min
;
k(a
1
v
1
+ a
2
v
2
), si u
min
k(a
1
v
1
+ a
2
v
2
) u
max
;
u
max
, si u
max
k(a
1
v
1
+ a
2
v
2
)
(3.4)
On suppose bien sr que les contraintes sur u sont telles que u
min
< 0 < u
max
.
124 CHAPITRE 3. COMMANDABILIT, STABILISATION
Figure 3.2 Un atome trois niveaux en interaction avec une lumire laser
polarise linairement et associe au champ lectrique c R, le contrle.
Avec le feedback prcdent, la fonction V est toujours positive, innie
linni et maintenant elle dcrot le long des trajectoires. On peut donc
appliquer le Thorme 11 de LaSalle, qui caractrise lensemble vers lequel
tendent les trajectoires : les solutions du systme en boucle ferme avec le
contrle 3.4 qui vrient en plus
d
dt
V = 0 c.--d. a
1
v
1
+a
2
v
2
= 0. Dans ce cas
u = 0 et donc
a
1
d
dt
v
1
+ a
2
d
dt
v
2
= (a
1
)
2
x
1
(a
2
)
2
x
2
= 0
En drivant encore deux fois, on a
(a
1
)
4
x
1
(a
2
)
4
x
2
= 0
Comme a
1
,= a
2
et a
1
, a
2
> 0, on dduit que, ncessairement, x
1
= x
2
= 0 et
donc tout est nul. Les trajectoires convergent toutes vers 0. Notre feedback
stabilise globalement asymptotiquement le systme en 0.
Daprs ce qui prcde, le contrle complet avec suivi de trajectoire scrit
trs simplement. On peut grer trs simplement des contraintes sur u : il sut
de prendre une trajectoire de rfrence donnant un contrle u
r
qui ne passe
par trop prs des bornes. Cette hypothse est vrie sil existe > 0 tel que
pour tout temps t, u
r
(t) [u
min
+, u
max
]. Dans ces conditions, le contrle
u = u
r
+
_
_
_
, si k(a
1
v
1
+ a
2
v
2
) ;
k(a
1
v
1
+ a
2
v
2
), si k(a
1
v
1
+ a
2
v
2
) ;
, si k(a
1
v
1
+ a
2
v
2
).
est chaque instant dans [u
min
, u
max
] et de plus assure la convergence asymp-
totique vers la trajectoire de rfrence.
3.1.4 Autres exemples
Exemple 15 (Un atome trois niveaux). La fonction donde de latome
trois niveaux schmatis sur la Figure 3.2 obit, sous lapproximation di-
3.1. UNEXEMPLE DE PLANIFICATIONET DE SUIVI DE TRAJECTOIRES125
polaire lectrique et dans un champ lectrique c(t) polaris linairement,
lquation de Schrdinger

d
dt
= (H
0
+c(t)H
1
)
o C
3
est la fonction donde appartenant lespace de Hilbert C
3
et o
H
0
et H
1
sont les oprateurs auto-adjoints dcrits par les matrices
H
0
=
_
_
0 0 0
0
1
0
0 0
2
_
_
, H
1
=
_
_
0
0 0
0 0
_
_
o
1
,
2
et sont des paramtres rels et strictement positifs. Avec les
notations usuelles en mcanique quantique
[0) =
_
_
1
0
0
_
_
, [1) =
_
_
0
1
0
_
_
, [2) =
_
_
0
0
1
_
_
on voit que [0) est ltat dnergie E
0
= 0, [1) celui dnergie E
1
=
1
et [2)
celui dnergie E
2
=
2
, = h/(2) tant la constante de Plank. Les pulsa-
tions de transitions (les raies atomiques donc) entre le niveau fondamental
[0) et les deux niveaux excits [1) et [2) ont pour pulsations
1
et
2
.
On a donc =
0
[0) +
1
[1) +
2
[2) avec
0
,
1
et
2
trois nombres
complexes dont le carr du module reprsente la probabilit pour que latome
soit dans le niveau [0), [1) ou [2), respectivement. Lquation de Schrdinger
pour ce systme scrit

d
dt

0
=

c(
1
+
2
)

d
dt

1
=
1

1
+

c
0

d
dt

2
=
2

2
+

c
0
On constate que
0
= 1,
1
=
2
= 0 et c = 0 est un rgime dquilibre (tat
fondamental, laser teint). Linarisons les quations autour de cet quilibre.
En notant
i
, i = 0, 1, 2, et c les petits carts, on obtient les quations
linarises

d
dt

0
= 0,
d
dt

1
=
1

1
+

c,
d
dt

2
=
2

2
+

c.
Il ne faut pas oublier que les
i
sont des complexes. Au premier ordre
0
est constant. Cest une partie de ltat qui nest pas inuence par le contrle
126 CHAPITRE 3. COMMANDABILIT, STABILISATION
(au moins au premier ordre). Cette partie est non commandable (au premier
ordre). Elle ne nous gne pas, elle correspond au fait que le module de
vaut 1 (conservation de la probabilit). Nous allons loublier ici. On a donc
le systme dans C
2
, cest dire dans R
4
suivant

d
dt

1
=
1

1
+

c,
d
dt

2
=
2

2
+

c
En posant

1
=

1
x
1
+
d
dt
x
1
_
(
1
)
2
,
2
=

2
x
2
+
d
dt
x
2
_
(
2
)
2
, c = u
on obtient exactement les quations des deux pendules (3.1) pour x
1
, x
2
et u
avec a
1
= (
1
)
2
et a
2
= (
2
)
2
. Il sagit en fait du mme systme. Le carr
du module de
i
, [
i
[
2
correspond alors, une constante prs, lnergie
mcanique du pendule numro i :
a
i
2
(x
i
)
2
+
_
d
dt
x
i
_
2
.
Il est possible de reprendre les calculs de transitoires faits pour les deux
pendules et de les adapter pour traiter le problme suivant. On part de ltat
fondamental [0) en t = 0. On cherche la forme de limpulsion laser c(t) qui
assure le transfert en t = T dune petite fraction 0 < p
1
1 de la probabilit
sur ltat [1) en gardant, au nal, nulle celle de ltat [2)
2
. Ce problme se
traduit de la faon suivante : en t = 0 on part de
1
=
2
= 0 avec c = 0.
En t = T, on souhaite arriver en
1
=

p
1
,
2
= 0 avec c = 0. Cela se
traduit dans les variables x
1
et x
2
par des conditions suivantes. En t = 0,
tout est nul. En t = T, on doit avoir
x
1
= x
1
=

p
1

, v
1
= x
2
= v
2
= u = 0
Sur la variable z cela donne comme condition en t = 0 (voir (3.3))
z = z
(1)
= z
(2)
= z
(3)
= z
(4)
= 0
et en t = T,
z =
x
1
a
1
, z
(1)
= z
(3)
= 0, z
(2)
= x
1
, z
(4)
= a
1
x
1
Il sut alors de prendre
z(t) = x
1
_
1
a
1

(t T)
2
2
+
a
1
(t T)
4
4!
_

_
t
T
_
2. Lintrt ventuel dun transfert dans ces conditions vient du fait que nous ne sup-
posons pas le contrle rsonnant comme il est usuel de le faire. Nous nutilisons pas ici
lapproximation du champ tournant et les oscillations de Rabi.
3.1. UNEXEMPLE DE PLANIFICATIONET DE SUIVI DE TRAJECTOIRES127
et de calculer le contrle en boucle ouverte par la formule
c(t) =
z(t) +
_
1
a
1

1
a
2
_
z
(2)
(t) +
1
a
1
a
2
z
(4)
(t)
1
a
1

1
a
2
Comme p
1
<< 1, il est facile de garantir en prenant un temps T assez
grand que [
1
(t)[ et [
2
(t)[ restent petits devant 1 tout au long du transfert.
Cest important pour que notre modle linaris reste valable et que le calcul
prcdent ait un sens.
Nous ne traiterons pas le problme du suivi de trajectoire car la notion de
feedback pour un tel systme est trs obscure lheure actuelle, mme si, en
thorie, elle serait trs sduisante pour construire un calculateur quantique et
rendre les qubits insensibles la dcohrence due au couplage avec lenviron-
nement. vrai dire, on se demande mme si la notion de feedback a un sens
de telles chelles. Pour un systme quantique la notion de rtro-action et
de feedback se heurtent au problme de la mesure. On ne peut pas supposer
que lon connat chaque instant
1
et
2
. En eet, toute mesure perturbe
notablement le systme et donc, pour ces systmes toutes petites chelles,
il nest plus possible de dissocier lappareil de mesure du systme lui mme
et de supposer que la perturbation due la mesure est arbitrairement petite.
Nous renvoyons un lecteur intress au cours du physicien S. Haroche [32].
Exemple 16 (Le hockey puck). tant donn un corps rigide (de masse
unitaire) dans le plan, dont le centre de gravit est repr par les coordon-
nes (x, y), dont lorientation est donne par langle , et dont linertie est
note J. Ce systme est soumis exclusivement
3
une force (commande) u
sexerant en un point bien dtermin (situ une distance r du centre de
gravit) de ce corps. Il est reprsent sur la Figure 3.3. Les quations de la
dynamique sont
d
2
dt
2
x = usin
d
2
dt
2
y = ucos
J
d
2
dt
2
= ru
Ce systme mcanique est sous-actionn. Il possde 3 degrs de libert et
une seule commande. On souhaite pourtant le dplacer dune conguration
une autre (c.--d. dun point de dpart et dune orientation un point
3. Il sagit dun hockey-puck, c.--d. un palet sur une table coussin dair
128 CHAPITRE 3. COMMANDABILIT, STABILISATION
A B
u
Figure 3.3 Le hockey puck : un solide soumis une force u (commande).
Pour eectuer des dplacements (entre A et B), il faut le faire tourner en
le faisant avancer puis le retourner brutalement avant de le faire avancer
nouveau pour enn le freiner en prenant en compte la rotation induite par
la dclration.
darrive et une orientation possiblement dirente). On ne dispose que
dune seule commande. Pour raliser ces manoeuvres, on est oblig dutiliser
des stratgies compliques. Par exemple, on ne peut pas dplacer latralement
le systme sans engendrer de rotation. Pour arrter le solide lorsquil a acquis
de la vitesse, il faut le faire tourner et adapter la force suivant langle de
rotation. On se reportera [57] pour un expos dtaill.
3.2 Commandabilit non linaire
Figure 3.4 Planication de trajectoire entre deux tats p et q.
On considre le systme (f tant une fonction rgulire)
d
dt
x(t) = f(x(t), u(t)), x(t) R
n
, u(t) R
m
(3.5)
3.2. COMMANDABILIT NON LINAIRE 129
Dnition 9 (Trajectoire dun systme command). On appelle trajec-
toire du systme (3.5) toute fonction rgulire I t (x(t), u(t)) R
n
R
m
qui satisfait identiquement sur un intervalle dintrieur non vide I de R les
quations (3.5).
Dnition 10 (Commandabilit). Le systme (3.5) est dit commandable
en temps T > 0 si et seulement si pour tout p, q R
n
, il existe une loi horaire
[0, T] t u(t) R
m
, appele commande en boucle ouverte, qui amne le
systme de ltat x(0) = p ltat x(T) = q, c.--d. , telle que la solution du
problme de Cauchy
d
dt
x(t) = f(x(t), u(t)) pour t [0, T]
x(0) = p
vrie x(T) = q. Le systme est dit simplement commandable lorsquil est
commandable pour au moins un temps T > 0.
Dautres dnitions sont possibles : elles correspondent toutes des va-
riantes
4
plus ou moins subtiles de la Dnition 10. Comme lillustre la Fi-
gure 3.4, la commandabilit exprime une proprit topologique trs natu-
relle. En gnral, la commande en boucle ouverte [0, T] t u(t) nest pas
unique, il en existe une innit. Cette tape sappelle planication de trajec-
toire. Calculer t u(t) partir de la connaissance de f, p et q constitue
lune des questions majeures de lAutomatique. Cette question est loin dtre
compltement rsolue actuellement.
Trs souvent, labsence de commandabilit est due lexistence dintgrales
premires non triviales. Ce sont des quantits qui restent constantes le long
de toute trajectoire. Nous allons les tudier.
3.2.1 Exemple de non commandabilit par la prsence
dintgrale premire
Considrons le racteur exothermique de la Figure 3.5. Les quations de
bilan matire et dnergie donnent les quations direntielles suivantes
d
dt
x
1
= D(x
in
1
x
1
) k
0
exp(E/RT)x
1
d
dt
x
2
= Dx
2
+ k
0
exp(E/RT)x
1
d
dt
T = D(T
in
T) + H exp(E/RT)x
1
+ u
(3.6)
4. titre dexemple, on pourra considrer la notion de commandabilit en temps petits,
qui demande que toutes les directions soient accessibles en temps court. Un contre exemple
est constitu par une voiture nayant pas de marche arrire, qui bien que pouvant, au prix
dun certain nombre de manuvres, atteindre tous les points de son espace dtat, ne peut
se dplacer latralement.
130 CHAPITRE 3. COMMANDABILIT, STABILISATION
Figure 3.5 Un racteur chimique exothermique o u correspond aux
changes thermiques avec lextrieur.
On reconnat leet non linaire essentiel de la loi dArrhenius
k = k
0
exp(E/RT)
qui relie la constante de vitesse k la temprature T. Comme nous lavons
crit, la cintique est suppose du premier ordre. Les constantes physiques
usuelles (D, x
in
1
, k
0
, E, T
in
, et H) sont toutes positives. La commande u
est proportionnelle la puissance thermique change avec lextrieur. On
note x
i
la concentration de lespce chimique X
i
, i = 1, 2. Il est assez facile
de voir que ce systme nest pas commandable. En eet, le bilan global sur
X
1
+ X
2
, limine le terme non linaire pour donner
d
dt
(x
1
+ x
2
) = D(x
in
1
x
1
x
2
).
La quantit = x
1
+ x
2
vrie une quation direntielle autonome
d
dt
=
D(x
in
1
). Donc
= x
in
1
+ (
0
x
in
1
) exp(Dt) (3.7)
o
0
est la valeur initiale de . Si, dans la Dnition 10, on prend ltat
initial p tel que = x
1
+ x
2
= x
in
1
et q tel que = x
1
+ x
2
= 0, il nexiste
pas de commande qui amne le systme de p vers q. En eet, pour toute
trajectoire dmarrant en un tel p, la quantit x
1
+x
2
reste constante et gale
x
in
1
. Cette partie non commandable du systme reprsente par la variable
admet ici un sens physique prcis. Elle est bien connue des chimistes qui la
nomment invariant chimique.
Lexemple ci-dessus nous indique que labsence de commandabilit peut-
tre lie lexistence dinvariants, i.e., des combinaisons des variables du
3.3. COMMANDABILIT LINAIRE 131
systme et ventuellement du temps, qui sont conserves le long de toute tra-
jectoire. Pour (3.6), il sagit de (x
1
+x
2
x
in
1
) exp(Dt) comme le montre (3.7).
Nous dnissons la notion dintgrale premire pour les systmes commands.
Dnition 11 (Intgrale premire). Une fonction rgulire R R
n

(t, x) h(t, x) R est appele intgrale premire du systme (3.5), si elle


est constante le long de toute trajectoire du systme. Une intgrale premire
est dite triviale si cest une fonction constante sur R R
n
.
Si h est une intgrale premire, sa drive le long dune trajectoire arbi-
traire est nulle pour toute trajectoire t (x(t), u(t)) du systme, c.--d.
d
dt
h =
h
t
+
h
x
d
dt
x 0
Si (3.5) admet une intgrale premire non triviale t h(t, x) alors (3.5)
nest pas commandable. Sinon, il existe T > 0, tel que pour tout p, q R
n
et
tout instant initial t, h(t, p) = h(t +T, q) (il existe une trajectoire reliant p
q sur [t, t+T]). Donc h est une fonction priodique du temps et indpendante
de x. Mais alors la drive de h le long des trajectoires du systme correspond


t
h. Comme elle est nulle, h est une constante, ce qui contredit lhypothse.
Nous avons montr la proposition suivante
Proposition 5. Si le systme (3.5) est commandable, alors ses intgrales
premires sont triviales.
Il est possible de caractriser, partir de f et dun nombre ni de ses
drives partielles, lexistence dintgrales premires non triviales. Nous allons
nous restreindre dans ce cours au cas linaire. La dmarche est transposable
au cas non linaire mais elle conduit alors des calculs plus lourds qui,
pour tre prsents de faon compacte, ncessitent le langage de la gomtrie
direntielle et des crochets de Lie (voir par exemple [40]).
3.3 Commandabilit linaire
Nous considrons ici les systmes linaires stationnaires du type
d
dt
x = Ax + Bu (3.8)
o ltat x R
n
, la commande u R
m
et les matrices A et B sont constantes
et de tailles n n et n m, respectivement.
132 CHAPITRE 3. COMMANDABILIT, STABILISATION
3.3.1 Matrice de commandabilit et intgrales premires
Supposons que (3.8) admette une intgrale premire h : RR
n
(t, x)
h(t, x) R. Soit le changement de variables sur x dni par x = exp(tA)z.
Avec les variables (z, u), (3.8) devient
d
dt
z = exp(tA)Bu (3.9)
car daprs la Proposition 1,
d
dt
(exp(tA)) = exp(tA) A = Aexp(tA). Dans
lquation (3.9), il est notable que le second membre ne dpend que de u
(et de t mais pas de z). Lintgrale premire devient h(t, exp(tA)z) = l(t, z).
Comme la valeur de l est constante le long de toute trajectoire t (z(t), u(t)),
nous avons
d
dt
l =
l
t
+
l
z
d
dt
z = 0
Comme
d
dt
z = exp(tA)Bu, pour toute valeur de z et u, on a lidentit
suivante
l
t
(t, z) +
l
z
(t, z) exp(tA)Bu 0
En prenant, u = 0, z et t arbitraires, on en dduit
l
t
(t, z) 0
Donc, ncessairement, l est uniquement fonction de z. Ainsi
l
z
(z) exp(tA)B 0
En drivant cette relation par rapport t, on a,
l
z
(z) exp(tA)AB 0
Plus gnralement, une drivation nimporte quel ordre k 0 donne
l
z
(z) exp(tA)A
k
B 0
En spciant t = 0, on obtient
l
z
(z)A
k
B = 0, k 0.
3.3. COMMANDABILIT LINAIRE 133
Ainsi le vecteur
l
z
(z) appartient lintersection des noyaux gauche de la
famille innie de matrice (A
k
B)
k0
. Le noyau gauche de A
k
B nest autre
que Im(A
k
B)

, lorthogonal de limage de A
k
B. Donc
l
z
(z)

k0
Im(A
k
B)

Mais

k0
Im(A
k
B)

=
_
Im(B) + . . . + Im(A
k
B) + . . .
_

La suite despaces vectoriels E


k
= Im(B) + . . . + Im(A
k
B) est une suite
croissante pour linclusion, E
k
E
k+1
. Si pour un certain k, E
k
= E
k+1
,
cela signie que Im(A
k+1
B) E
k
, donc A(E
k
) E
k
. Mais Im(A
k+2
B) =
Im(AA
k+1
B) A(E
k+1
). Ainsi Im(A
k+2
B) E
k
. On voit donc que pour
tout r > 0, Im(A
k+r
B) E
k
, do E
k+r
= E
k
. La suite des E
k
est une suite
de sous-espaces vectoriels de R
n
embots les uns dans les autres. Cette suite
stationne ds quelle nest plus, pour un certain k, strictement croissante. Il
sut donc de ne considrer que ses n premiers termes, c.--d. E
0
,. . . ,E
n1
,
car automatiquement E
n1
= E
n+r
pour tout r > 0.
En revenant la suite des noyaux gauche de A
k
B, nous voyons que
le fait que
l
z
(z) est dans le noyau gauche de la suite innie de matrices
(A
k
B)
k0
, est quivalent au fait que
l
z
(z) est dans le noyau gauche de la
suite nie de matrices (A
k
B)
0kn1
.
5
Ainsi, pour tout z,
l
z
(z) appartient au noyau gauche de la matrice
n (nm),
( = (B, AB, A
2
B, . . . , A
n1
B) (3.10)
dite matrice de commandabilit de Kalman. Si ( est de rang n, son noyau
gauche est nul, donc l ne dpend pas de z : l est alors une fonction constante
et h galement.
Rciproquement, si la matrice de commandabilit ( nest pas de rang
maximal, alors il existe un vecteur w R
n
/0, dans le noyau gauche de
5. On pourrait aussi utiliser le thorme de Cayley-Hamilton qui donne un rsultat plus
prcis : toute matrice carre est racine de son polynme caractristique. Cela veut dire, A
tant de taille n, que A
n
est une combinaison linaire des (A
k
)
0kn1
A
n
=
n1

k=0
p
k
A
k
o les p
k
sont dnis par det(I
n
A) =
n

n1
k=0
p
k

k
. Nous avons prfr un argument
plus simple avec la suite des E
k
car il a lavantage de sappliquer au cas non linaire. Il
correspond au calcul de lalgbre de Lie de commandabilit.
134 CHAPITRE 3. COMMANDABILIT, STABILISATION
(3.10). En remontant les calculs avec l(z, t) = w
T
z, on voit que
d
dt
l = 0 le
long des trajectoires. En passant aux variables (x, u), on obtient une intgrale
premire non triviale h(t, x) = w
T
exp(tA)x. Toute trajectoire du systme
se situe dans un hyperplan orthogonal w.
En rsum, nous avons dmontr la proposition suivante.
Proposition 6. La matrice de commandabilit
( = (B, AB, A
2
B, . . . , A
n1
B)
est de rang n, si, et seulement si, les seules intgrales premires du sys-
tme (3.8) sont triviales.
Des Propositions 5 et 6, il vient que, si le systme (3.8) est comman-
dable, sa matrice de commandabilit est de rang n. Nous allons voir que la
rciproque est vraie. Pour cela, nous avons besoin de certaines proprits
dinvariance.
3.3.2 Invariance
Dnition 12 (Changement dtat, bouclage statique rgulier). Un
changement linaire de coordonnes x x est dni par une matrice M
inversible dordre n : x = M x. Un bouclage statique rgulier u u est dni
par une matrice N inversible dordre m et une autre matrice K, mn : u =
K x + N u. Cest un changement de variables sur les commandes paramtr
par ltat.
Lensemble des transformations
_
x
u
_

_
x
u
_
=
_
M 0
K N
__
x
u
_
(3.11)
forment un groupe lorsque les matrices M, N et K varient (M et N restant
inversibles).
Si
d
dt
x = Ax + Bu est commandable (resp. nadmet pas dintgrale pre-
mire) alors

x =

A x+

B u obtenu avec (3.11) est commandable (resp. nadmet


pas dintgrale premire). Les notions de commandabilit et dintgrale pre-
mire sont intrinsques, c.--d. indpendantes des coordonnes avec lesquelles
les quations du systme sont tablies. Si la matrice de commandabilit dans
les coordonnes (x, u) est de rang n, la matrice de commandabilit dans les
coordonnes ( x, u) sera aussi de rang n. Cette simple remarque conduit au
rsultat non vident suivant
rang(B, AB, . . . A
n1
B) = n quivaut rang(

B,

A

B, . . . ,

A
n1

B) = n
3.3. COMMANDABILIT LINAIRE 135
o

A et

B sobtiennent en crivant
d
dt
x = Ax + Bu dans les coordonnes
( x, u)

x = M
1
(AM + BK) x + M
1
BN u.
soit

A = M
1
(AM + BK),

B = M
1
BN
En fait, il est possible daller beaucoup plus loin et de montrer que les indices
de commandabilit dnis ci-dessous sont aussi invariants.
Dnition 13 (Indices de commandabilit). Pour tout entier k, on note

k
le rang de la matrice (B, AB, A
2
B, . . . , A
k
B). Les (
k
) sont appels indices
de commandabilit du systme linaire (3.8),
La suite
k
est croissance, majore par n. Labsence dintgrale premire
est quivalente
n1
= n.
Proposition 7 (invariance). Les indices de commandabilit de
d
dt
x = Ax +
Bu sont invariants par changement de variable sur x et bouclage statique
rgulier sur u.
Nous laissons la preuve de ce rsultat par rcurrence sur n en exercice.
Il est important de comprendre lide gomtrique de cette invariance. Les
transformations (x, u) ( x, u) du type (3.11) forment un groupe. Ce groupe
dnit une relation dquivalence entre deux systmes ayant mme nombre
dtats et mme nombre de commandes. La proposition prcdente signie
simplement que les indices de commandabilit sont les mmes pour deux
systmes appartenant la mme classe dquivalence, i.e le mme objet go-
mtrique vu dans deux repres dirents. En fait, on peut montrer que les
indices de commandabilit sont les seuls invariants : il y a autant de classes
dquivalence que dindices de commandabilit possibles. Nous ne montre-
rons pas en dtail ce rsultat. Tous les lments ncessaires cette preuve
se trouvent dans la construction de la forme de Brunovsky ci-dessous (voir
aussi [38, 67]).
Nous allons voir, avec la forme normale de Brunovsky, quune telle corres-
pondance entre y et les trajectoires du systme est gnrale. Il sut que (3.8)
soit commandable. Tout revient donc trouver la sortie de Brunovsky y de
mme dimension que la commande u.
3.3.3 Critre de Kalman et forme de Brunovsky
Thorme 23 (Critre de Kalman). Le systme
d
dt
x = Ax + Bu est com-
mandable si et seulement si la matrice de commandabilit
( = (B, AB, . . . A
n1
B)
136 CHAPITRE 3. COMMANDABILIT, STABILISATION
est de rang n = dim(x).
Pour abrger, on dit souvent que la paire (A, B) est commandable pour
dire que le rang de la matrice de commandabilit ( est maximum.
La preuve que nous allons donner de ce rsultat nest pas la plus courte
possible. Cependant, elle permet de dcrire explicitement, pour toute du-
re T > 0 et pour p, q R
n
, les trajectoires du systme qui partent de p et
arrivent en q. Cette preuve utilise la forme dite de Brunovsky, objet du tho-
rme suivant. La forme de Brunovsky se construit en suivant une mthode
dlimination proche du pivot de Gauss.
Thorme 24 (Forme de Brunovsky). Si (B, AB, . . . A
n1
B), la matrice de
commandabilit de
d
dt
x = Ax + Bu, est de rang n = dim(x) et si B est de
rang m = dim(u), alors il existe un changement dtat z = Mx (M matrice
inversible n n) et un bouclage statique rgulier u = Kz +Nv (N matrice
inversible mm), tels que les quations du systme dans les variables (z, v)
admettent la forme normale suivante (criture sous la forme de m quations
direntielles dordre 1)
y
(
1
)
1
= v
1
, . . . , y
(
m
)
m
= v
m
(3.12)
avec comme tat z = (y
1
, y
(1)
1
, . . . , y
(
1
1)
1
, . . . , y
m
, y
(1)
m
, . . . , y
(
m
1)
m
), les

i
tant des entiers positifs.
Les m quantits y
i
, qui sont des combinaisons linaires de ltat x, sont
appeles sorties de Brunovsky.
Les indices de commandabilit
k
et les m entiers
i
de la forme de Bru-
novsky sont intimement lis (pour plus de dtail voir [38]) : la connaissance
des uns est quivalente celle des autres.
Dmonstration. La preuve de ce rsultat repose sur
une mise sous forme triangulaire des quations dtat et llimination
de u;
linvariance du rang de (B, AB, . . . A
n1
B) par rapport aux transfor-
mations (3.11) ;
une rcurrence sur la dimension de ltat.
Mise sous forme triangulaire
On suppose que B est de rang m = dim(u) (sinon, on peut faire un
regroupement des commandes en un nombre plus petit que m de faon se
ramener ce cas). Alors, il existe une partition de ltat x = (x
r
, x
u
) avec
3.3. COMMANDABILIT LINAIRE 137
dim(x
r
) = n m et dim(x
u
) = m telle que les quations (3.8) admettent la
structure bloc suivante
d
dt
x
r
= A
rr
x
r
+ A
ru
x
u
+ B
r
u
d
dt
x
u
= A
ur
x
r
+ A
uu
x
u
+ B
u
u
o B
u
est une matrice carre inversible. Cette partition nest pas unique, bien
sr. En rsolvant la seconde quation par rapport u et en reportant cette
expression dans la premire quation, on obtient
d
dt
x
r
= A
rr
x
r
+ A
ru
x
u
+ B
r
B
1
u
(
d
dt
x
u
A
ur
x
r
A
uu
x
u
)
d
dt
x
u
= A
ur
x
r
+ A
uu
x
u
+ B
u
u
En regroupant les drives dans la premire quation, on a
d
dt
x
r
B
r
B
1
u
d
dt
x
u
= (A
rr
B
r
B
1
u
A
ur
)x
r
+ (A
ru
B
r
B
1
u
A
uu
)x
u
d
dt
x
u
= A
ur
x
r
+ A
uu
x
u
+ B
u
u.
Avec la transformation du type (3.11) dnie par
x
r
= x
r
B
r
B
1
u
x
u
, x
u
= x
u
, u = A
ur
x
r
+ A
uu
x
u
+ B
u
u,
les quations
d
dt
x = Ax + Bu deviennent
d
dt
x
r
=

A
r
x
r
+

A
u
x
u
d
dt
x
u
= u
o

A
r
= (A
rr
B
r
B
1
u
A
ur
) et

A
u
= (A
rr
B
r
B
1
u
A
ur
)B
r
B
1
u
+ (A
ru

B
r
B
1
u
A
uu
). Dans cette structure triangulaire, o la commande u nintervient
pas dans la seconde quation, on voit apparatre un systme plus petit dtat
x
r
et de commande x
u
. Cela nous permet de rduire la dimension de x et de
raisonner par rcurrence.
Invariance de rang
Un simple calcul par blocs nous montre que si (B, AB, . . . A
n1
B) est de
rang n alors (A
u
, A
r
A
u
, . . . A
nm1
r
A
u
) est de rang n m. Du systme de
taille n on passe ainsi au systme de taille rduite nm,
d
dt
x
r
=

A
r
x
r
+

A
u
x
u
( x
r
ltat, x
u
la commande).
Rcurrence sur le nombre dtats
tant donn n, supposons le rsultat vrai pour toutes les dimensions
dtat infrieures ou gales n 1. Considrons un systme
d
dt
x = Ax +Bu
avec n = dim(x), sa matrice de commandabilit de rang n, et B de rang
138 CHAPITRE 3. COMMANDABILIT, STABILISATION
m = dim(u) > 0. Llimination de u donne, aprs une transformation du
type (3.11),
d
dt
x
r
= A
r
x
r
+ A
u
x
u
d
dt
x
u
= u
o dim(u) = dim(x
u
) = m et dim(x
r
) = nm avec (A
u
, A
r
A
u
, . . . A
nm1
r
A
u
)
de rang nm < n (les ont t enlevs pour allger les notations). Notons m
le rang de A
u
. Comme m m, un changement de variable sur x
u
, ( x
u
, x
u
) =
Px
u
avec P inversible, permet dcrire le systme sous la forme
d
dt
x
r
= A
r
x
r
+

A
u
x
u
d
dt
x
u
= u
d
dt
x
u
= u
(3.13)
avec ( u, u) = Pu, dim( x
u
) = m et

A
u
de rang m. Le rang de la matrice de
commandabilit de
d
dt
x
r
= A
r
x
r
+

A
u
x
u
(x
r
est ltat et x
u
la commande)
est gal n m = dim(x
r
), lhypothse de rcurrence assure lexistence
dun changement de variable x
r
= Mz et dun bouclage statique rgulier
x
u
= Kz + N v ( v est la nouvelle commande ici) mettant ce sous-systme
sous forme de Brunovsky. Le changement dtat (x
r
, x
u
, x
u
) dni par
_
_
x
r
x
u
x
u
_
_
=
_
_
M 0 0
K N 0
0 0 1
_
_
_
_
z
v
x
u
_
_
et le bouclage statique rgulier sur ( u, u)
u = KM
1
(A
r
x
r
+

A
u
x
u
) + N v, u = v
transforment le systme (3.13) sous forme de Brunovsky avec v = ( v, v)
comme nouvelle commande.
Preuve du Thorme 23 La commandabilit est indpendante du choix
des variables sur x et dun bouclage statique rgulier sur u. On peut donc
supposer le systme sous sa forme de Brunovsky. Dans ces coordonnes, aller
dun tat un autre est lmentaire. Ce problme se ramne tudier la
commandabilit du systme scalaire y
()
= v. Ltat initial (y
0
, . . . , y
1
0
),
ltat nal (y
T
, . . . , y
1
T
) ainsi que la dure T tant donns, les lois horaires
t v(t) assurant le passage entre ces deux tats pendant la dure T corres-
pondent alors la drive -ime de fonctions [0, T] t (t) R, dont
les drives jusqu lordre 1 en 0 et T sont imposes par

(r)
(0) = y
r
0
,
(r)
(T) = y
r
T
, r = 0, . . . , 1
3.3. COMMANDABILIT LINAIRE 139
Figure 3.6 Deux masses couples par un ressort. Lensemble est soumis
une seule force u.
Il existe bien sr une innit de telles fonctions (on peut prendre pour
un polynme de degr 2 1, par exemple).
Exemple 17 (Un exemple dutilisation de la forme de Brunovsky). Soit le
systme mcanique deux degrs de libert et une seule commande reprsent
sur la Figure 3.6. En ngligeant les frottements et en supposant le ressort
linaire de raideur k, on obtient le modle suivant
_
m
1
x
1
= k(x
2
x
1
) + u
m
2
x
2
= k(x
1
x
2
)
(3.14)
Montrons que ce systme est commandable. Il sut pour cela de remar-
quer que la quantit x
2
, labscisse de la masse qui nest pas directement sou-
mise la force u, joue un rle trs particulier ( sortie de Brunovsky). Si au
lieu de donner t u(t) et dintgrer (3.14) partir de positions et vitesses
initiales, on xe t x
2
(t) = y(t), alors, on peut calculer x
1
=
m
2
k
y + y et
donc, u = m
1
x
1
+ m
2
x
2
=
m
1
m
2
k
y
(4)
+ (m
1
+ m
2
) y. Ainsi, on peut crire le
systme en faisant jouer x
2
un rle privilgi
_

_
x
1
= (m
2
/k) y + y
x
2
= y
u = (m
1
m
2
/k) y
(4)
+ (m
1
+ m
2
) y
On obtient une paramtrisation explicite de toutes les trajectoires du sys-
tme. Les relations prcdentes tablissent une correspondance bi-univoque et
rgulire entre les trajectoires de (3.14) et les fonctions rgulires t y(t).
Cette correspondance permet de calculer de faon lmentaire une commande
[0, T] t u(t) qui fait passer le systme de ltat p = (x
p
1
, v
p
1
, x
p
2
, v
p
2
) ltat
140 CHAPITRE 3. COMMANDABILIT, STABILISATION
q = (x
q
1
, v
q
1
, x
q
2
, v
q
2
) (v
i
correspond
d
dt
x
i
). tant donnes les quations
_

_
x
1
= (m
2
/k) y + y
v
1
= (m
2
/k) y
(3)
+
d
dt
y
x
2
= y
v
2
=
d
dt
y
(3.15)
il apparat quimposer p en t = 0 revient imposer y et ses drives jus-
qu lordre 3 en 0 : (y
0
, y
(1)
0
, y
(2)
0
, y
(3)
0
). Il en est de mme en t = T avec
(y
T
, y
(1)
T
, y
(2)
T
, y
(3)
T
). Il sut donc de trouver une fonction rgulire [0, T]
t y(t) dont les drives jusqu lordre 3 sont donnes a priori en 0 et
en T. Un polynme de degr 7 en temps rpond la question mais il existe
bien dautres possibilits. Nous en dtaillons une ci-dessous qui est compl-
tement explicite.
Soit la fonction C
4
: [0, 1] [0, 1] dnie par
() =

4

4
+ (1 )
4
.
Il est facile de voir que est croissante avec (0) = 0, (1) = 1 et
d
k

d
k
(0) =
d
k

d
k
(1) = 0 pour k = 1, 2, 3. La fonction
y(t) =
_
1
_
t
T
___
y
0
+ ty
(1)
0
+
t
2
2
y
(2)
0
+
t
3
6
y
(3)
0
_
+
_
t
T
__
y
T
+ (t T)y
(1)
T
+
(t T)
2
2
y
(2)
T
+
(t T)
3
6
y
(3)
T
_
vrie y(0) = y
0
, y(T) = y
T
avec
d
k
y
dt
k
(0, T) = y
(k)
0,T
, k = 1, 2, 3. On obtient
ainsi une trajectoire en x correspondant une telle transition en utilisant les
formules (3.15) et le contrle correspondant avec
u = (m
1
m
2
/k) y
(4)
+ (m
1
+ m
2
) y
En particulier, le transfert de la conguration stationnaire x
1
= x
2
= 0 la
conguration stationnaire x
1
= x
2
= D > 0 durant le temps T sobtient avec
le contrle en boucle ouverte suivant ( feedforward)
u(t) =
Dm
1
m
2
kT
4
d
4

d
4

t
T
+
D(m
1
+ m
2
)
T
2
d
2

d
2

t
T
car alors y(t) = D
_
t
T
_
.
3.3. COMMANDABILIT LINAIRE 141
3.3.4 Planication et suivi de trajectoires
Des preuves des Thormes 23 et 24, il est important de retenir deux
choses.
1. Dire que le systme
d
dt
x = Ax +Bu est commandable, est quivalent
lexistence dun bouclage statique rgulier u = Kz +Nv et dun chan-
gement dtat x = Mz permettant de ramener le systme la forme
de Brunovsky y
()
= v et z = (y, . . . , y
(1)
) (par abus de notation
y = (y
1
, . . . , y
m
) et y
()
= (y
(
1
)
1
, . . . , y
(
m
)
m
)). Ces changements donnent
x = M(y, . . . , y
(1)
), u = L(y, . . . , y
()
)
o la matrice L est construite avec K, N et M. Lorsquon considre une
fonction rgulire arbitraire du temps t (t) R
m
et quon calcule
x(t) et u(t) par les relations
x(t) = M((t), . . . ,
(1)
(t)), u(t) = L((t), . . . ,
()
(t))
alors t (x(t), u(t)) est une trajectoire du systme. Lquation
d
dt
x(t)
Ax(t)Bu(t) = 0 est identiquement satisfaite. Rciproquement, toutes
les trajectoires rgulires du systme se paramtrisent de cette faon,
grce m fonctions scalaires arbitraires
1
(t), . . .,
m
(t) et un nombre
ni de leurs drives par les formules ci-dessus.
2. La commandabilit de
d
dt
x = Ax + Bu implique la possibilit de stabi-
lisation par retour dtat. La forme de Brunovsky fait apparatre cette
possibilit. Sous cette forme normale, chacun des m sous-systmes in-
dpendants scrit y
(
i
)
i
= v
i
. Soient
i
valeurs propres,
1
, . . . ,

i
,
correspondant au spectre dune matrice relle de dimension
i
. Notons
s
k
les fonctions symtriques des
i
(des quantits relles donc) homo-
gnes de degr k, obtenues par le dveloppement suivant

k=1
(X
k
) = X

i
s
1
X

i
1
+ s
2
X

i
2
+ . . . + (1)

i
s

i
Alors, ds que les
k
sont partie relle strictement ngative (c.--d.
quils correspondent une matrice Hurwitz ), le bouclage
v
i
= s
1
y
(
i
1)
i
s
2
y
(
i
2)
i
+ . . . + (1)

i
1
s

i
y
i
assure la stabilit de y
(
i
)
i
= v
i
. En eet, les exposants caractristiques
(on dit aussi les ples) du systme boucl sont les
k
.
142 CHAPITRE 3. COMMANDABILIT, STABILISATION
Figure 3.7 Suivi de trajectoire.
Comme nous venons de le voir, de la forme de Brunovsky, on dduit directe-
ment le rsultat suivant
Thorme 25 (Placement de ples). Si la paire (A, B) est commandable
(voir le Thorme 23) alors, pour toute matrice relle F de taille n n, il
existe une matrice mn, K (non ncessairement unique si m > 1), telle que
le spectre de A BK concide avec celui de F.
De retour dans les coordonnes de modlisation,
d
dt
x = Ax + Bu, la pla-
nication de trajectoire nous donne une trajectoire en boucle ouverte du sys-
tme (par exemple la trajectoire que doit suivre une fuse au dcollage, la
manoeuvre datterrissage dun avion, . . .). Nous la notons t (x
r
(t), u
r
(t))
avec lindice r pour rfrence. En pratique, il convient, comme lillustre la
Figure 3.7, de corriger en boucle ferme en fonction de lcart x, la com-
mande de rfrence u
r
. Le problme est donc de calculer la correction u
partir de x de faon revenir sur la trajectoire de rfrence. Cest un
problme de suivi de trajectoire. On peut galement le rsoudre en utilisant
un bouclage stabilisant par placement de ples sous la forme de Brunovsky.
Nous allons dtailler ce point.
Comme
d
dt
x
r
= Ax
r
+Bu
r
, on obtient, par dirence avec
d
dt
x = Ax+Bu
lquation derreur suivante
d
dt
(x) = A x + B u
o x = xx
r
et u = uu
r
. Le systme tant commandable, il existe K,
matrice mn, telle que les valeurs propres de A+BK sont toutes partie
relle strictement ngative (daprs le Thorme de placement de ples 25).
La correction
u = K x
assure le suivi asymptotique de la trajectoire de rfrence t x
r
(t).
Nous terminerons par une constatation dordre exprimental : lorsque le
modle dynamique
d
dt
x = Ax+Bu est dorigine physique, il nest pas rare que
3.4. COMMANDE LINAIRE QUADRATIQUE LQR 143
sa partie non commandable, i.e., ses intgrales premires, ait une signication
physique immdiate, tout comme les grandeurs y, fonction de x et intervenant
dans la forme de Brunovsky de sa partie commandable. Cet tat de fait nest
vraisemblablement pas d entirement au hasard : en physique, les grandeurs
qui admettent une signication intrinsque, i.e., les grandeurs physiques, sont
celles qui ne dpendent pas du repre de lobservateur. En Automatique, le
passage dun repre un autre correspond, entre autres, une transformation
de type (3.11). Il est alors clair que le sous-espace engendr par les sorties
de Brunovsky est un invariant. Il a donc toutes les chances davoir un sens
physique immdiat. Les sorties de Brunovsky admettent un quivalent non
linaire pour de nombreux systmes physiques (voir la Section 3.5.1).
3.4 Commande linaire quadratique LQR
Nous avons tudi la proprit de commandabilit (objet de la Dni-
tion 10), qui requiert, pour tre satisfaite par un systme, lexistence pour
tout p, q dune trajectoire reliant un tat p un tat q. Sous lhypothse
de commandabilit, nous avons vu comment construire une telle trajectoire
par la forme de Brunovsky (voir Thorme 24). Cette trajectoire est loin
dtre unique. On va maintenant montrer comment choisir la trajectoire la
meilleure au sens dun critre quadratique. Cest lobjet de la commande
linaire quadratique.
Nous nous intressons ici, en toute gnralit, aux systmes linaires ins-
tationnaires du type
d
dt
x(t) = A(t)x(t) + B(t)u (3.16)
o ltat x(t) R
n
, la commande u(t) R
m
et, pour tout t [0, +[ les
matrices A(t) et B(t) sont de tailles n n et n m, respectivement. Ces
systmes peuvent provenir de bilans exacts ou, plus souvent, de la linarisa-
tion autour de trajectoires de manuvre entre des points stationnaires. Ainsi
si t (x
r
(t), u
r
(t)) est une trajectoire de rfrence de
d
dt
x = f(x, u), on a
d
dt
x
r
= f(x
r
, u
r
) et on note
A(t) =
f
x

(x
r
(t),u
r
(t))
, B(t) =
f
u

(x
r
(t),u
r
(t))
En fait, x et u dans (3.16), correspondent aux carts x x
r
(t) et u u
r
(t).
Considrons un intervalle de temps donn [0, t
f
] (sur lequel lventuelle
trajectoire de rfrence est dnie). On cherche minimiser le critre qua-
144 CHAPITRE 3. COMMANDABILIT, STABILISATION
0 200 400 600 800 1000 1200 1400 1600 1800 2000
0.8
1
1.2
1.4
1.6
1.8
2
2.2
2.4
2.6
x 10
5
temps
altitude
Figure 3.8 Trajectoire de rentre dun vhicule spatial (dpart en orbite,
arrive 80.000 pieds) . Les rebonds atmosphriques permettent de maximiser
le dport latral en utilisant les eets arodynamiques.
dratique suivant
J =
_
t
f
0
_
x
T
(t)Rx + u
T
(t)Qu(t)
_
dt (3.17)
o R est une matrice symtrique positive et Q une matrice symtrique dnie
positive
6
.
Implicitement, on cherche une commande [0, t
f
] t u(t) faible (car
pondre par Q dans le calcul de lintgrale) limitant les dviations de x
elles-mmes pondres par R sur lhorizon temporel [0, t
f
]. La commande
minimisant (3.17) ralise le meilleur compromis (au sens prcis par les pon-
drations R et Q) entre dviation de ltat et eort sur les actionneurs.
Exemple 18 (Rentre atmosphrique). Un exemple de trajectoire dnis-
sant un systme linaris tangent instationnaire du type (3.16) est donn sur
la Figure 3.8. On y a reprsent lhistorique des valeurs de laltitude pour
une trajectoire de vaisseau spatial (type navette) dans la manuvre de r-
entre atmosphrique au cours de laquelle on cherche maximiser le dport
6. Lhypothse de symtrie nenlve rien la gnralit. En eet pour tout x R
n
, on
a x
T
Gx = x
T
((G+G
T
)/2)x. Autrement dit, seule la partie symtrique de G compte dans
le calcul de x
T
Gx.
3.4. COMMANDE LINAIRE QUADRATIQUE LQR 145
latral (i.e. en faisant pivoter lappareil pour rejoindre une plus haute lati-
tude o est situ le point de chute dsir pour lengin). Cet objectif et les
contraintes arodynamiques (notamment la thermique et la variation de den-
sit de latmosphre) confrent loptimum de nombreuses bosses (appeles
rebonds atmosphriques). An dassurer le suivi de cette trajectoire, on doit
concevoir un contrleur en boucle ferme. On linarise alors les quations au-
tour de cette trajectoire rebonds et on obtient naturellement un modle de
la forme (3.16). On pourra se reporter [11] pour une prsentation dtaille
de ce problme.
Dans le cas multivariable en particulier, i.e. o on dispose de plusieurs
commandes, on a en gnral trop de degrs de libert pour rsoudre les
problmes de planication et de suivi de trajectoire. En voquant un critre
minimiser comme nous venons de le faire en (3.17), on dnit implicitement
lutilisation des degrs de libert supplmentaires : ils permettent doptimiser
cet indice de performance.
Exemple 19 (Racteur nuclaire eau pressurise). On prsente ici un
exemple de systme multivariable pour lequel on peut raliser des transitoires
de trs nombreuses faons. De manire gnrale, les racteurs nuclaires de
production dlectricit prsentent dintressants problmes dAutomatique.
Leur schma de principe est donn sur la Figure 3.9, on pourra se rfrer
[48] pour une prsentation gnrale. Dans le circuit primaire, la neutronique
est contrle par la contre-ractivit des barres et du bore dont on peut agir
sur la concentration par un circuit de borication/dilution. Les changes avec
le circuit secondaire fournissent, travers le gnrateur de vapeur, de la
puissance la turbine qui est accouple une gnratrice. On peut utiliser
une vanne de contournement pour fournir plus ou moins de puissance la
turbine. En dehors des phases de rgulation, c.--d. de la stabilisation autour
dun point de fonctionnement (on parle de rgulation de frquence du rseau),
on est souvent amen raliser des transitoires lorsque la demande du rseau
lectrique varie. Une manuvre dicile est liltage, qui consiste isoler le
rseau. Il faut alors utiliser les direntes commandes de manire coordonne
pour rduire la puissance en minimisant la fatigue des installations. Une
formulation type commande linaire quadratique permet de spcier ce genre
de cahier des charges.
De manire encore plus gnrale, on peut considrer le cot avec pond-
ration nale
J =
1
2
x
T
(t
f
)S
f
x(t
f
) +
1
2
_
t
f
0
_
x
T
(t)Rx(t) + u
T
(t)Qu(t)
_
dt (3.18)
146 CHAPITRE 3. COMMANDABILIT, STABILISATION
racteur
borication/dilution
barres de contrle
pressuriseur
gnrateur de vapeur
vanne de
contournement
pompe circuit secondaire
pompe de circulation
condenseur
turbine
refroidissement
rseau lectrique
Figure 3.9 Schma de principe dun racteur nuclaire eau pressuri-
se. Pour contrler la production dlectricit, on peut utiliser 3 actionneurs
(commandes) : barres de contrle, systme de borication/dilution, vanne de
contournement de la turbine.
qui permet de rajouter de limportance au point nal atteint (S
f
tant une
matrice symtrique positive).
Lintrt des formulations quadratiques (3.18) (et (3.17)) est quelles sont
en gnral bien poses au sens mathmatique, et quelles admettent une so-
lution unique, calculable numriquement
7
3.4.1 Multiplicateurs de Lagrange en dimension innie
Le but de cette section est de prsenter de faon simple la mthode
des multiplicateurs de Lagrange en dimension innie. Cette mthode permet
de caractriser loptimum du critre (3.18) (ou (3.17)). Un lecteur intress
pourra consulter [4, 13] ou les notes de lES doptimisation [61].
Commenons par la dimension nie. On part du problme suivant o le
critre J : R
n
R et les p contraintes scalaires h
i
: R
n
R sont des
7. Calculable analytiquement pour un ou deux tats mais pas plus en pratique. Cest
trs dirent de lapproche utilisant la forme normale de Brunovsky, approche que lon
peut conduire analytiquement sans dicult sur de nombreux exemples physiques bien
plus que trois tats.
3.4. COMMANDE LINAIRE QUADRATIQUE LQR 147
fonctions drivables du temps
min

x R
n
h
1
(x) = 0
.
.
.
h
p
(x) = 0
J(x)
Pour rsoudre ce problme on introduit
p multiplicateurs de Lagrange (les variables adjointes) = (
1
, ...,
p
)
R
p
;
on calcule le Lagrangien
L(x, ) = J(x) +
p

i=1

i
h
i
(x) = J(x) +
T
h(x);
on calcule les conditions de stationnarit du Lagrangien au 1er ordre
en faisant comme si les variables x et pouvaient varier librement dans
toutes les directions. Ces conditions traduisent le fait que L = 0 pour
toutes variations innitsimales x et des variables x et .
La condition L = 0 pour tout x donne n quations
J
x
k
+
p

i=1

i
h
i
x
k
= 0, k = 1, . . . , n
La condition L = 0 pour tout redonne les p contraintes
h
i
(x) = 0, i = 1, . . . p
On a ainsi un systme de n+p inconnues avec n+p quations rsoudre pour
trouver loptimum. La partie la plus dure reste cependant faire : rsoudre
ce systme dquations non-linaires et vrier que la solution trouve est
bien loptimum
8
.
Passons maintenant la dimension innie avec le problme suivant o
toutes les fonctions L : R
n
R
m
R, f : R
n
R
m
R
n
, l : R
n
R sont
drivables et o le temps nal t
f
et la condition initiale x
0
sont des constantes
8. On pourra alors regarder les conditions au second ordre.
148 CHAPITRE 3. COMMANDABILIT, STABILISATION
donnes
min

[0, t
f
] t (x(t), u(t)) R
n
R
m
x(0) = x
0
f
1
(x(t), u(t))
d
dt
x
1
(t) = 0, t [0, t
f
]
.
.
.
f
n
(x(t), u(t))
d
dt
x
n
(t) = 0, t [0, t
f
]
_
l(x(t
f
)) +
_
t
f
0
L(x(t), u(t)) dt
_
(3.19)
On est en dimension innie car on minimise une fonctionnelle pour toutes
les courbes t (x(t), u(t)) qui vrient les contraintes, i.e. pour toutes les
trajectoires du systme
d
dt
x = f(x, u) qui dmarrent en t = 0 de x
0
.
On voit que les contraintes f
i
(x(t), u(t))
d
dt
x
i
(t) = 0 dpendent dun
indice discret i et dun indice continu t. Il est donc logique dintroduire les
multiplicateurs
i
(t) avec ces deux types dindice. On forme le Lagrangien
L avec une somme discrte sur i et une somme continue sur t (une intgrale
donc) des produits contrainte dindice (i, t) fois multiplicateur dindice (i, t)
L(x, u, ) = l(x(t
f
)) +
_
t
f
0
L(x(t), u(t)) dt
+
n

i=1
_
t
f
0

i
(t)
_
f
i
(x(t), u(t))
d
dt
x
i
(t)
_
dt
Le Lagrangien L est une fonctionnelle qui aux fonctions x, u et sur [0, t
f
]
associe un rel L(x, u, ) calcul avec une intgrale sur t. On note de faon
plus compacte
L(x, u, ) = l(x(t
f
))+
_
t
f
0
_
L(x(t), u(t)) +
T
(t)
_
f(x(t), u(t))
d
dt
x(t)
__
dt
Les conditions de stationnarit du premier ordre sobtiennent alors, comme
dans le cas de la dimension nie, en explicitant quau premier ordre la va-
riation L de L est nulle pour toute variation innitsimale x, u et
des courbes paramtres t x(t), t u(t) et t (t). Puisquon na pas
introduit de multiplicateur pour la contrainte x(0) = x
0
, nous imposons la
variation x de vrier la contrainte x(0) = 0.
Commenons par la variation de . On doit avoir, pour toute variation de
la courbe , une variation de L nulle au premier ordre. En dautres termes,
pour toute fonction t (t) R
n
on doit avoir
L =
_
t
f
0

T
(t)
_
f(x(t), u(t))
d
dt
x(t)
_
dt = 0
3.4. COMMANDE LINAIRE QUADRATIQUE LQR 149
La seule possibilit
9
est qu chaque instant t [0, t
f
], f(x(t), u(t))
d
dt
x(t) =
0. On retrouve bien les contraintes comme en dimension nie.
Poursuivons avec la variation de u. On doit avoir, pour toutes variations
du contrle u, une variation de L nulle au premier ordre. Pour toute fonc-
tion t u(t) R
m
, on doit avoir
L =
_
t
f
0
_
L
u

(x(t),u(t))]
u(t) +
T
(t)
f
u

(x(t),u(t))
u(t)
_
dt = 0
En mettant u en facteur on obtient
L =
_
t
f
0
_
L
u

(x(t),u(t))
+
T
(t)
f
u

(x(t),u(t))
_
u(t) dt = 0
Ceci donne la condition de stationnarit sur u
L
u
(x, u) +
T
f
u
(x, u) = 0, t [0, t
f
] (3.20)
Terminons par la variation de x. On doit avoir, pour toutes variations x
vriant x(0) = 0, une variation de L nulle au premier ordre. Pour toute
fonction t x(t) R
n
telle que x(0) = 0, on doit avoir
L =
l
x
(x(t
f
))x(t
f
)+
_
t
f
0
_
L
x

(x(t),u(t))]
x(t) +
T
(t)
_
f
x

(x(t),u(t))
x(t)
d
dt
x(t)
__
dt = 0
Pour mettre, comme avec u, x en facteur dans lintgrale, il nous faut
liminer
d
dt
x. La seule possibilit est de faire une intgration par partie.
Cela fait apparatre
d
dt
. Cest ici que rside principalement la nouveaut par
rapport la dimension nie. On a

_
t
f
0

T
(t)
d
dt
x(t) dt = [
T
x]
t
f
0
+
_
t
f
0
d
dt

T
(t) x(t) dt
=
T
(t
f
)x(t
f
) +
_
t
f
0
d
dt

T
(t) x(t) dt
car x(0) = 0. On a
L =
_
l
x
(x(t
f
))
T
(t
f
)
_
x(t
f
)+
_
t
f
0
_
L
x

(x(t),u(t))]
+
T
(t)
f
x

(x(t),u(t))
+
d
dt

T
(t)
_
x(t) dt = 0
9. On se reportera au lemme de duBois-Reymond.
150 CHAPITRE 3. COMMANDABILIT, STABILISATION
Donc, pour toute fonction t x(t) telle que x(0) = x(t
f
) = 0, on a
_
t
f
0
_
L
x

(x(t),u(t))]
+
T
(t)
f
x

(x(t),u(t))
+
d
dt

T
(t)
_
x(t) dt = 0
On en dduit
L
x

(x(t),u(t))]
+
T
(t)
f
x

(x(t),u(t))
+
d
dt

T
(t) = 0
c.--d.
_
L
x
_
T
(x,u)
+
_
f
x
_
T
(x,u)
+
d
dt
= 0, t [0, t
f
] (3.21)
Enn, avec x(t
f
) ,= 0 on obtient de L = 0 la condition nale
(t
f
) =
l
x
(x(t
f
))
En somme, les conditions doptimalit du premier ordre pour le pro-
blme (3.19) sont pour t [0, t
f
]
_

_
d
dt
x(t) = f(x(t), u(t))
d
dt
(t) =
_
f
x
_
T
(x(t),u(t))
(t)
_
L
x
_
T
(x(t),u(t))
0 =
_
L
u
_
(x(t),u(t))
+
T
_
f
u
_
(x(t),u(t))
(3.22)
avec comme condition au bord
x(0) = x
0
, (t
f
) =
l
x
(x(t
f
)) (3.23)
Il sagit dun problme aux deux bouts, ce nest pas un problme de Cauchy,
car la condition initiale est spare entre les temps t = 0 et t = t
f
comme
le prcise lquation (3.23). On appelle souvent tat adjoint. Nous allons
maintenant utiliser ces formules dans le cas o f est linaire et o les fonc-
tions L et l sont quadratiques. Cest le cas dit linaire quadratique. Sous ces
hypothses, les conditions de stationnarit ci-dessus sont alors des conditions
ncessaires et susantes doptimalit.
3.4. COMMANDE LINAIRE QUADRATIQUE LQR 151
3.4.2 Problme aux deux bouts dans le cas linaire qua-
dratique
La caractrisation de la commande optimale pour le problme de mi-
nimisation du critre (3.18) pour une condition initiale x(0) = x
0
donne
passe par le calcul des conditions de stationnarit (3.22) avec f = Ax +Bu,
L =
1
2
(x
T
Rx + u
T
Qu) et l =
1
2
x
T
S
f
x. Le problme aux deux bouts corres-
pondant prend la forme
d
dt
x(t) = A(t)x(t) BQ
1
B
T
(t)
d
dt
(t) = Rx(t) A
T
(t)(t)
_

_
(3.24)
avec les conditions limites bilatrales
x(0) = x
0
, (t
f
) = S
f
x(t
f
)
Ltat adjoint est de la mme dimension que x. La commande optimale est
alors donne par la dernire quation de (3.22)
u(t) = Q
1
B
T
(t)(t)
La particularit des quations (3.24) est quelles admettent une solution
explicite sous forme linaire
(t) = S(t)x(t)
avec S(t
f
) = S
f
. Nous allons dtailler ce point.
En substituant dans (3.24), on obtient
d
dt
S(t)x(t) + S(t)A(t)x(t) S(t)B(t)Q
1
B
T
(t)S(t)x(t)
= Rx(t) A
T
(t)S(t)x(t)
Il sut alors de choisir S solution de lquation direntielle matricielle
de Riccati en temps rtrograde (quadratique en linconnue S)
d
dt
S(t) = S(t)A(t) + S(t)B(t)Q
1
B
T
(t)S(t) R A
T
(t)S(t)
S(t
f
) = S
f
_
_
_
(3.25)
pour obtenir nalement la commande optimale
u(t) = Q
1
B
T
(t)S(t)x(t) (3.26)
152 CHAPITRE 3. COMMANDABILIT, STABILISATION
Le fait majeur retenir ici est que la commande optimale (3.26) sexprime
prcisment comme une loi de feedback instationnaire dont le gain peut-
tre calcul hors-ligne
10
(i.e. avant de raliser la moindre exprience) par la
rsolution de lquation de Riccati (3.25).
Exemple 20 ([13]). Soit la dynamique
d
dt
x = v,
d
dt
v = u et le critre
minimiser
J =
1
2
_
c
1
v(t
f
)
2
+ c
2
x(t
f
)
2
_
+
1
2
_
t
f
0
u
2
(t)dt
o c
1
, c
2
et t
f
sont des constantes positives. La commande optimale est
u(t) =
x
(t)x(t)
v
(t)v(t)
o

x
=
1/c
2
+ 1/c
1
(t
f
t)
2
+ 1/3(t
f
t)
3
D(t
f
t)

v
=
1/c
1
(t
f
t) + 1/2(t
f
t)
2
D(t
f
t)
avec
D(t
f
t) =
_
1
c
2
+
1
3
(t
f
t)
3
__
1
c
1
+ t
f
t
_

1
4
(t
f
t)
4
De manire intressante, il est possible dexprimer simplement la valeur
du cot J (3.18) associe la commande optimale u (3.26). Considrons
lgalit
_
t
f
0
d
dt
_
x
T
(t)S(t)x(t)
_
dt = x
T
(t
f
)S
f
x(t
f
) x
T
(0)S(0)x(0).
Il vient alors
J
1
2
x
T
(0)S(0)x(0) =
1
2
_
t
f
0
d
dt
_
x
T
(t)S(t)x(t)
_
dt
+
1
2
_
t
f
0
(x
T
(t)Rx(t) + u
T
(t)Qu(t))dt
10. On peut montrer que le problme linaire instationnaire avec cot quadratique consi-
dr ici donne la solution au deuxime ordre dun problme non-linaire plus prcis dont il
est lapproximation. La loi de feedback que nous venons de calculer procure alors le calcul
des extrmales de voisinages (voir [13]).
3.4. COMMANDE LINAIRE QUADRATIQUE LQR 153
En dveloppant et en explicitant (3.26), on a
J
1
2
x
T
(0)S(0)x(0) =
1
2
_
t
f
0
(x
T
(t)
_
R SBQ
1
B
T
S + SA + A
T
S +

S
_
x(t))dt
En utilisant (3.25), on obtient nalement
J
1
2
x
T
(0)S(0)x(0) = 0.
On vient de calculer que le cot associ la commande optimale (3.26) est
J
opt
=
1
2
x
T
(0)S(0)x(0) (3.27)
Nous pouvons maintenant rcapituler nos rsultats dans la proposition sui-
vante
Proposition 8 (contrleur LQR). Soit le systme linaire instationnaire (3.16)
d
dt
x(t) = A(t)x(t) +B(t)u avec x(0) comme condition initiale, et le critre
minimiser (3.18)
J =
1
2
x
T
(t
f
)S
f
x(t
f
) +
1
2
_
t
f
0
_
x
T
(t)Rx(t) + u
T
(t)Qu(t)
_
dt
o A(t) est une matrice nn, B(t) est une matrice nm, S
f
et R sont sym-
triques positives, Q est symtrique dnie positive. La solution ce problme
de minimisation est la loi de feedback optimal (3.26)
u(t) = Q
1
B
T
(t)S(t)x(t)
o S est dnie par l quation direntielle de Riccati rtrograde (3.25), et
la valeur du critre qui lui est associe est J
opt
=
1
2
x
T
(0)S(0)x(0).
3.4.3 Planication de trajectoires
+ lobjectif de minimiser un critre quadratique du type (3.17), on peut
ajouter une contrainte nale, permettant dexprimer le souhait de se rendre
exactement en un point donn. On se retrouve alors avec un problme de
planication de trajectoire optimale pour un systme linaire instationnaire.
La contrainte que nous considrons ici est
x(t
f
) = (3.28)
154 CHAPITRE 3. COMMANDABILIT, STABILISATION
o R
n
. Il est possible bien sr de considrer des contraintes plus gn-
rales, et/ou ne portant que sur certaines composantes de ltat, on pourra se
rfrer [13] pour un expos des mthodes se rapportant ces cas.
Les conditions de stationnarit sont modies par ladjonction de la con-
trainte (3.28). Il sut de remplacer la condition nale dans (3.23) par la
condition nale x(t
f
) = . On obtient la commande optimale par la rsolu-
tion des quations suivantes
d
dt
S(t) = S(t)A(t) + S(t)B(t)Q
1
B
T
(t)S(t) R A
T
(t)S(t) (3.29)
S(t
f
) = 0 (3.30)
d
dt
V (t) =
_
A
T
(t) S(t)B(t)Q
1
B
T
(t)
_
V (t) (3.31)
V (t
f
) = I (3.32)
d
dt
H(t) = V
T
(t)B(t)Q
1
B
T
(t)V (t) (3.33)
H(t
f
) = 0 (3.34)
o I est la matrice identit de taille n. On notera que (3.29) est une quation
direntielle de Riccati quon devra rsoudre en temps rtrograde depuis
sa condition terminale (3.30). Une fois cette quation rsolue, on pourra
calculer V (t) en rsolvant lquation linaire (3.31) partir de la condition
terminale (3.32). Ensuite, on pourra calculer H(t) travers (3.33) et (3.34)
par une simple intgration en temps rtrograde. La matrice H(t) est toujours
ngative car H(t
f
) = 0 et
d
dt
H 0. Elle nest pas singulire lorsque le systme
est commandable (voir [13]). Finalement, la commande optimale est
u(t) = Q
1
B
T
(t)
_
S(t) V (t)H
1
(t)V
T
(t)
_
x(t) Q
1
B
T
(t)V (t)H
1
(t)
Cest encore une fois une loi de feedback instationnaire, complt par un
terme de feedforward lui aussi instationnaire.
Exemple 21. Considrons le systme dynamique
d
dt
x(t) = Ax(t) + Bu(t)
_
0 1
1/2 0
_
x(t) +
_
0
1
_
u(t)
On souhaite calculer une commande [0 3] t u(t) R transfrant le
systme de x
0
= [0.5 1]
T
x
f
= [1 0]
T
en minimisant le critre
quadratique
J =
1
2
_
3
0
u(t)
2
dt
3.4. COMMANDE LINAIRE QUADRATIQUE LQR 155
On forme le systme
d
dt
S(t) = S(t)A + S(t)BQ
1
B
T
S(t) A
T
S(t) (3.35)
S(3) = 0 (3.36)
d
dt
V (t) =
_
A
T
S(t)BB
T
_
V (t) (3.37)
V (3) = I (3.38)
d
dt
H(t) = V
T
(t)BB
T
V (t) (3.39)
H(3) = 0 (3.40)
quon rsoud en cascade comme expliqu la Section 3.4.3. Tout dabord, on
remarque que S(t) = 0. Lquation (3.37) se rcrit alors
d
dt
V (t) = A
T
V (t),
quon peut rsoudre explicitement avec la condition terminale (3.38). Il vient
V (t) = exp
_
(t 3)A
T
_
Ensuite, on intgre numriquement (3.39) ce qui donne
H(t) =
_
t
f
t
V
T
()BB
T
V ()d
pour nalement calculer le contrle optimal
u(t) = B
T
V (t)H
1
(t)V
T
(t)x(t) B
T
(t)V (t)H
1
(t)
La rsolution eective de ces calculs donne les trajectoires de la Figure 3.10.
3.4.4 Rgulateur LQR
On utilise souvent une version plus simple de la commande linaire qua-
dratique que celle que nous venons de prsenter en considrant t
f
+.
Le cot minimiser est alors
J =
_
+
0
_
x
T
(t)Rx(t) + u
T
(t)Qu(t)
_
dt (3.41)
o R est une matrice symtrique positive, Q est une matrice symtrique
dnie positive et la dynamique que nous considrons est linaire stationnaire
d
dt
x(t) = Ax(t) + Bu (3.42)
156 CHAPITRE 3. COMMANDABILIT, STABILISATION
0 0.5 1 1.5 2 2.5 3
1. 5
1
0. 5
0
0.5
1
Figure 3.10 Trajectographie sous contraintes nales (planication de tra-
jectoire) avec minimisation quadratique.
o ltat x R
n
, la commande u R
m
et les matrices A et B sont de tailles
n n et n m, respectivement.
La rsolution de ce problme de commande optimale est plus simple. Elle
aboutit un feedback stationnaire qui possde dintressantes proprits.
Thorme 26 (Rgulateur LQR). Considrons le problme de minimisa-
tion du cot quadratique (3.41) pour le systme (3.42) sous les hypothses
suivantes :
1. (A, B) est commandable
2. R est symtrique positive
3. Q est symtrique dnie positive
4. Il existe une racine de R telle que (A, R
1/2
) est observable (voir Cha-
pitre 4)
11
.
La solution ce problme de minimisation est la loi de feedback optimal
u(t) = Q
1
B
T
S
0
x(t)
11. On entend par racine de R, note R
1/2
une matrice telle que R = (R
1/2
)
T
R
1/2
.
Toute matrice hermitienne positive admet une telle factorisation.
3.4. COMMANDE LINAIRE QUADRATIQUE LQR 157
o S
0
est lunique solution symtrique stabilisante (i.e. telle que
d
dt
x = (A
BQ
1
B
T
S
0
)x(t) est asymptotiquement stable) de l quation de Riccati alg-
brique
0 = SA + A
T
S SBQ
1
B
T
S + R (3.43)
et la valeur du critre qui lui est associe est x
T
(0)S
0
x(0).
Dmonstration. La preuve de ce rsultat sarticule en plusieurs points. La
principale dicult rside dans la preuve de lexistence et de lunicit dune
solution symtrique stabilisante lquation de Riccati algbrique (3.43).
i) Commenons par montrer lexistence dune telle solution. Considrons
lquation direntielle de Riccati obtenue partir de (3.25) en inversant le
temps
d
dt
= A + A
T
BQ
1
B
T
+ R (3.44)
et notons
0
(t) la solution correspondant la condition initiale
0
(0) = 0.
Comme on la vu la Proposition 8, on a alors, quel que soit x(0),
min
u
_
t
0
_
x
T
(t)Rx(t) + u
T
(t)Qu(t)
_
dt = x
T
(0)
0
(t)x(0)
Cette fonction est croissante en t, car
min
u
_
t
2
t
1
0
_
x
T
(t)Rx(t) + u
T
(t)Qu(t)
_
dt
min
u
_
t
1
0
_
x
T
(t)Rx(t) + u
T
(t)Qu(t)
_
dt
Dautre part, cette fonction est majore. En eet, la paire (A, B) tant com-
mandable, il existe, par le Thorme de placement de ples 25 un feedback
linaire stationnaire u(t) = Kx(t) procurant la convergence exponentielle
au systme boucl
d
dt
x = (A BK)x. Ltat, et donc la commande calcu-
le par ce feedback, convergent tous deux exponentiellement vers zro. On
en dduit que, pour un certain > 0 correspondant la valeur du critre
obtenue en utilisant ce feedback linaire stationnaire, on a
min
u
_
t
0
_
x
T
(t)Rx(t) + u
T
(t)Qu(t)
_
dt
La fonction t x
T
(0)
0
(t)x(0) est croissante et majore donc elle converge
vers une limite, ncessairement quadratique, que nous notons x
T
(0)

x(0)
158 CHAPITRE 3. COMMANDABILIT, STABILISATION
avec

symtrique. Quel que soit x(0), on a lim


t
x
T
(0)
0
(t)x(0) =
x
T
(0)

x(0). On en dduit lim


t

0
(t) =

. En utilisant lquation di-


rentielle de Riccati (3.44), on en dduit que, lorsque t ,
d
dt
(t) converge
lui aussi, et que sa limite est ncessairement nulle. On en dduit nalement,
que

satisfait lquation de Riccati algbrique


0 =

A + A
T

BQ
1
B
T

+ R (3.45)
Montrons que

est dnie positive (dans le but de lutiliser ensuite


pour construire une fonction de Lyapounov). Supposons quil existe un x(0)
non nul tel que x
T
(0)

x(0) = 0, alors, quel que soit t 0, on a


min
u
_
t
0
_
x
T
(t)Rx(t) + u
T
(t)Qu(t)
_
dt = 0
Or Q est symtrique dnie positive, on en dduit u = 0 et, loptimum, on
a alors
_
t
0
(R
1/2
x(t))
T
R
1/2
x(t)dt = 0
On a alors ncessairement, que pour tout t 0, R
1/2
x() = 0 pour tout
[0, t]. Lquation direntielle satisfaite pour cet optimum est
d
dt
x = Ax
car, comme nous venons de le voir, dans ce cas la commande est nulle. On
en dduit, par drivations successives,
R
1/2
x(0) = 0 = R
1/2
Ax(0) = R
1/2
A
2
x(0) = ... = R
1/2
A
n1
x(0)
Or la paire (A, R
1/2
) est observable (voir le critre de Kalman pour lobserva-
bilit donn au Thorme 28). On en dduit x(0) = 0, do la contradiction.
Donc,

est symtrique dnie positive.


Posons A
c
= A BQ
1
B
T

la matrice obtenue en fermant la boucle.


On peut dduire de lquation de Riccati (3.45) lgalit

A
c
+ A
T
c

= R

BQ
1
B
T

Considrons la fonction (candidate tre de Lyapounov)


V (x) = x
T

x
Cette fonction continment direntiable est strictement positive, sauf en 0
o elle est nulle. En drivant par rapport t, on obtient
d
dt
V (x) = x
T
(

A
c
+ A
T
c

)x = x
T
_
R +

BQ
1
B
T

_
x
3.4. COMMANDE LINAIRE QUADRATIQUE LQR 159
Lensemble des points tels que
d
dt
V (x) = 0 est donc dni par les qua-
tions B
T

x = 0 et R
1/2
x = 0. Lensemble invariant contenu dans ce sous-
ensemble est rduit lespace des x satisfaisant
R
1/2
x(0) = 0 = R
1/2
A
c
x(0) = R
1/2
Ax(0) = ... = R
1/2
A
n1
x(0)
Puisque la paire (A, R
1/2
) est observable, ce sous-ensemble est rduit zro.
Par le Thorme de LaSalle 11, on en dduit la convergence asymptotique
du systme vers zro. La matrice

est donc stabilisante.


ii) Pour prouver lunicit nous allons utiliser le lemme suivant.
Lemme 2. Lquation matricielle dinconnue X
XA + BX = C
o A, B et C sont des matrices carres de dimensions bien choisies, possde
une unique solution si et seulement si A et B nont pas de valeur propre
commune.
On pourra se rfrer [38] pour la dmonstration de ce rsultat.
Considrons donc deux solutions symtriques distinctes S
1
et S
2
de lqua-
tion (3.43) telles que
A
1
= A BQ
1
B
T
S
1
et A
2
= A BQ
1
B
T
S
2
sont toutes deux stables. Calculons alors
(S
1
S
2
)A
1
+ A
T
2
(S
1
S
2
)
= S
1
A S
1
BQ
1
B
T
S
1
S
2
A + S
2
BQ
1
B
T
S
1
+
_
A BQ
1
B
T
S
2
_
T
(S
1
S
2
) = R + R = 0
en utilisant deux fois lquation (3.43).
On en dduit lquation matricielle
(S
1
S
2
)A
1
+ A
T
2
(S
1
S
2
) = 0
qui est justement de la forme voque dans le Lemme 2. Or, par hypothse,
A
1
et A
2
ne possdent pas de valeur propre commune car A
1
et A
2
sont
stables. On en dduit
S
1
= S
2
do lunicit.
iii) Calculons enn la valeur obtenue pour la commande optimale. Consi-
drons la commande optimale candidate u(t) = Q
1
B
T
S
0
x(t) et calculons
160 CHAPITRE 3. COMMANDABILIT, STABILISATION
la valeur du critre J pour une autre commande v. Cette commande devant
tre stabilisante, on a
_

0
d
dt
(x
T
S
0
x)dt = x
T
(0)S
0
x(0)
Poursuivons,
J = x
T
(0)S
0
x(0) +
_

0
_
x
T
(t)Rx(t) + v
T
(t)Qv(t) +
d
dt
(x
T
S
0
x)
_
dt
= x
T
(0)S
0
x(0)+
_

0
_
x
T
(R + A
T
S
0
+ S
0
A)x + v
T
Qv + v
T
B
T
S
0
x + x
T
S
0
Bv
_
dt
en utilisant lquation de Riccati algbrique (3.43)
= x
T
(0)S
0
x(0)+
_

0
_
x
T
S
0
BQ
1
B
T
S
0
x + v
T
Qv + v
T
B
T
S
0
x + x
T
S
0
Bv
_
dt
=
_

0
_
Q
1
B
T
S
0
x + v
_
T
Q
_
Q
1
B
T
S
0
x + v
_
dt
Or Q est par hypothse symtrique dnie positive. Donc, loptimum est
atteint pour la commande optimale
Q
1
B
T
S
0
x
et la valeur de cet optimum est x
T
(0)S
0
x(0).
Utilisation pratique de la commande LQR
Si (A, B) est commandable, Q diagonale termes strictement positifs
et R symtrique positive (par exemple diagonale termes positifs), alors
le thorme est applicable. Les matrices Q et R permettent dexprimer un
arbitrage entre limportance des erreurs sur ltat et leort sur la commande.
Plus un terme est grand, plus lerreur sy rapportant prend dimportance dans
la fonction cot et plus elle a tendance tre rduite par la solution optimale.
En rsolvant lquation de Riccati, on obtient la loi de commande optimale.
Exemple 22. Considrons le systme
d
dt
x =
1

x+u et le critre quadratique


J =
1
2
_
+
0
(ax
2
+ bu
2
)dt o a 0, b > 0. L quation de Riccati algbrique
associe est
0 =
2

S a +
S
2
b
3.4. COMMANDE LINAIRE QUADRATIQUE LQR 161
Systme LQR
Figure 3.11 Utilisation du rgulateur LQR en boucle ferme.
Elle possde deux solutions S

=
b


_
b
2

2
+ ab. La commande associe est
u =
_
1


_
1

2
+
a
b
_
x. La commande optimale correspond S
+
.
Rsolution de lquation de Riccati algbrique
Lorsquon cherche eectivement rsoudre lquation Riccati algbrique
(3.43) on peut utiliser deux approches. La premire consiste rsoudre lqua-
tion de Riccati direntielle (3.25) en temps rtrograde (i.e. en rajoutant un
signe devant le second membre) en partant de la condition initiale nulle.
La solution converge pour t + vers la solution de lquation Riccati al-
gbrique (3.43) recherche. Cette mthode est de Kalman. Cest dailleurs
lide utilise dans la preuve du Thorme 26. Une autre mthode repose sur
la dcomposition de Schur de la matrice recherche (i.e. une dcomposition
sous la forme dune matrice unitaire et dune matrice triangulaire suprieure).
Cest ce genre dapproche qui est utilise dans les logiciels de calcul scienti-
que. On pourra se rfrer dirents articles sur le sujet dont [8].
Marges de stabilit du rgulateur LQR
On sintresse ici aux marges de stabilit, dnies au Chapitre 2, procures
par le rgulateur LQR du Thorme 26.
Utilis en boucle ferme tel que sur la Figure 3.11, on se retrouve tudier
le lieu de Nyquist de la fonction de transfert
1 + Q
1
B
T
S
0
(sI A)
1
B
. Ainsi dans les calculs ci-dessous, s = est imaginaire pur et donc s

= s.
Notons K = Q
1
B
T
S
0
. Daprs lquation de Riccati algbrique (3.43), on a,
en faisant apparatre (sI A),
0 = S
0
(sI A) (sI + A
T
)S
0
R + K
T
QK
162 CHAPITRE 3. COMMANDABILIT, STABILISATION
do
0 = (sI + A
T
)
1
S
0
+ S
0
(sI A)
1
(sI + A
T
)
1
(K
T
QK R)(sI A)
1
(3.46)
car ((sI A)
1
)
T
= (s

I A
T
)
1
= (sI +A
T
)
1
puisque
T
correspond alors
la transposition hermitienne.
Calculons maintenant
(I + K(sI A)
1
B)
T
Q(I + K(sI A)
1
B)
= (I + B
T
(sI A
T
)
1
K
T
)Q(I + K(sI A)
1
B)
qui donne aprs substitution partielle de K
= Q + B
T
_
(sI + A
T
)
1
S
0
+ S
0
(sI A)
1
_
B
B
T
(sI + A
T
)
1
K
T
QK(sI A)
1
B
et, en utilisant (3.46), il vient
= Q + (sI A)
1
B
T
R(sI A)
1
B
Nous venons dtablir dans un cadre gnral multivariable lquation (dite
de retour et valable uniquement pour s = imaginaire)
(I + K(sI A)
1
B)
T
Q(I + K(sI A)
1
B) = Q + (sI A)
1
B
T
R(sI A)
1
B
(3.47)
Exprimons la dans le cas mono-entre. Alors, Q est un scalaire strictement
positif, K est un vecteur ligne, B est un vecteur colonne. Il vient alors
_
_
1 + K(sI A)
1
B
_
_
2
= 1 +Q (3.48)
o Q est un rel positif ou nul (car R nest que positive et non pas positive
dnie).
Ceci implique que le lieu de Nyquist du systme est une distance plus
grande que 1 du point 1. Ceci procure donc toujours une marge de phase
suprieure 60 degrs, une marge de gain (positive) innie, et une marge de
gain (ngative) dau moins 1/2, voir Figure 3.12.
Exemple 23. Considrons le systme
d
dt
x = Ax + Bu o
A =
_
0 1
1 0.3
_
, B =
_
0.25
1
_
3.5. COMPLMENTS 163
zone d'exclusion
-1
Lieu de Nyquist avec LQR
Figure 3.12 Utilisation du LQR en boucle ferme.
Avec les matrices de pondration Q =
_
1 0
0 1
_
, R = 1, on obtient le
rgulateur LQR de gains [0.8168 1.4823]. Le lieu de Nyquist du systme
ainsi boucl est reprsent sur la Figure 3.12. Il entoure 2 fois le point 1
dans le sens indirect. Cest le nombre de ples instables de la fonction de
transfert
K(sI A)
1
B =
1.687s + 0.385
s
2
0.3s + 1
Le rgultateur LQR assure la stabilit. Les marges de stabilit sont visibles
sur la Figure 3.12.
3.5 Complments
3.5.1 Linarisation par bouclage
Equivalence statique
La relation dquivalence qui permet de mettre un systme linaire
d
dt
x =
Ax +Bu commandable sous forme de Brunovsky peut tre prolonge au cas
164 CHAPITRE 3. COMMANDABILIT, STABILISATION
des systmes non linaires de la manire suivante. Au lieu de considrer des
transformations du type
_
x
u
_

_
Mx
Kx + Nu
_
avec M et N matrices inversibles, considrons des transformations inversibles
plus gnrales et non linaires suivantes
_
x
u
_

_
z = (x)
v = k(x, u)
_
o est un diomorphisme et x bloqu, u k(x, u) galement. On va
considrer les systmes non linaires de la forme
d
dt
x = f(x, u) et leur clas-
sication, comme nous lavons fait pour les systmes linaires, modulo le
groupe de transformations ci-dessus. La relation dquivalence qui en rsulte
est appele quivalence par bouclage statique rgulier et changement de co-
ordonnes (dune faon plus abrge quivalence statique). Dcider si deux
systmes avec les mmes nombres dtats et des commandes,
d
dt
x = f(x, u)
et
d
dt
z = g(z, v), (f, g rgulires) sont quivalents, est un problme de go-
mtrie dicile et largement ouvert. En revanche, il existe une caractrisation
explicite des systmes non linaires quivalents aux systmes linaires com-
mandables.
Exemple 24. Soit le systme de la Figure 3.6. On suppose ici que le ressort
est non linaire. Dans (3.14) la raideur k est fonction de x
1
x
2
: k =
k
0
+ a(x
1
x
2
)
2
avec k
0
et a > 0. On peut montrer que le systme reste
commandable et calculer sa sortie non linaire de Brunovsky (la sortie plate).
Exemple 25. Reprenons le systme (3.6) en ne considrant que les deux
quations direntielles relatives x
1
et T (nous ne considrons que la partie
commandable). On peut montrer (formellement) que ce sous-systme deux
tats et une commande est commandable (la quantit y = x
1
joue le rle de
sortie non linaire de Brunovsky (la sortie plate)) et en dduire le bouclage
statique qui linarise le systme.
CNS de linarisation statique
Lintrt pratique est le suivant. Les quations issues de la physique
d
dt
x =
f(x, u) sont en gnral non linaires dans les coordonnes de modlisation x
et u. La question Existe-t-il des coordonnes, z = (x) et v = k(x, u), qui
rendent les quations linaires,
d
dt
z = Az +Bv avec (A, B) commandable ?
est alors dimportance. En eet, une rponse positive signie que le systme
3.5. COMPLMENTS 165
est non linaire seulement en apparence : le systme est alors dit linarisable
par bouclage statique. Il sut de changer de repre pour que tout devienne
linaire.
partir de maintenant, nous considrons le systme
d
dt
x = f(x, u), x R
n
, u R
m
avec f rgulire et f(0, 0) = 0. Notre point de vue sera local autour de
lquilibre (x, u) = (0, 0).
Lemme 3. Les deux propositions suivantes sont quivalentes
1. Le systme tendu
_

_
d
dt
x = f(x, u)
d
dt
u = u
(3.49)
est linarisable par bouclage statique ( u est ici la commande)
2. Le systme
d
dt
x = f(x, u) (3.50)
est linarisable par bouclage statique.
Dmonstration. Si x = (z) et u = k(z, v) transforment (3.50) en un systme
linaire commandable
d
dt
z = Az + Bv, alors (x, u) = ((z), k(z, v)) et u =
k
z
(Az + Bv) +
k
v
v transforment (3.49) en
d
dt
z = Az + Bv,
d
dt
v = v (3.51)
systme linaire commandable. Ainsi la seconde proposition implique la pre-
mire.
Supposons maintenant la premire proposition vraie. Comme tout sys-
tme linaire commandable peut scrire sous la forme (3.51) avec (A, B)
commandable, (forme de Brunovsky) il existe une transformation (x, u) =
((z, v), (z, v)) et u = k(z, v, v) qui transforme (3.49) en (3.51) avec dim(z) =
dim(x). Cela veut dire que pour tout (z, v, v)

z
(z, v)(Az + Bv) +

v
v = f((z, v), (z, v)).
Donc ne dpend pas de v et la transformation inversible x = (z), u =
(z, v) transforme (3.50) en
d
dt
z = Az + Bv.
166 CHAPITRE 3. COMMANDABILIT, STABILISATION
Quitte tendre ltat en posant
d
dt
u = u et en prenant comme entre u,
on peut toujours supposer que f est ane en u, i.e., que le systme admet
les quations
d
dt
x = f(x) + u
1
g
1
(x) + . . . + u
m
g
m
(x) (3.52)
o f et les g
i
sont des champs de vecteurs rguliers. Il est alors facile de
voir que les transformations x = (z) et u = k(z, v) qui rendent le systme
linaire sont ncessairement anes en v, i.e., k(x, v) = (x) + (x)v avec
inversible pour tout x.
Prenons maintenant un changement rgulier de variables x = (z) din-
verse =
1
, z = (x). Considrons le systme dni par (3.52) dans le
repre x. Dans le repre z, on obtient
d
dt
z = (D f + u
2
D g
1
+ . . . + u
m
D g
m
)
x=(z)
(3.53)
o D est la matrice Jacobienne de :
_

i
x
j
_
i,j
. Ainsi, f (respectivement
g
k
) devient D f (respectivement D g
k
).
partir de ces champs de vecteurs dnissant (3.52), on construit, par la
rcurrence suivante, une suite croissante despaces vectoriels indexs par x
E
0
= g
1
, . . . , g
m
, E
i
= E
i1
, [f, E
i1
] i 1
o [f, g] est le crochet de Lie de deux champs de vecteurs f et g et o
signie espace vectoriel engendr par les vecteurs lintrieur des parenthses.
On rappelle que le crochet de deux champs de vecteurs f et g, de composantes
(f
1
(x), ..., f
n
(x)) et (g
1
(x), ..., g
n
(x)) dans les coordonnes (x
1
, ..., x
n
), admet
comme composantes dans les mmes coordonnes x
[f, g]
i
=
n

k=1
f
i
x
k
g
k

g
i
x
k
f
k
Un simple calcul montre que si z = (x) est un changement rgulier de
variables on obtient les composantes du crochet [f, g] dans les coordonnes z
par les mmes formules que dans les coordonnes x. En dautres termes
D.[f, g] = [D.f, D.g]
On sait faire du calcul direntiel intrinsque sans passer par un choix par-
ticulier de repre. Les E
k
deviennent, dans les coordonnes z, D.E
k
. On
appelle ce type dobjet des distributions (rien voir avec les distributions de
L. Schwartz). Ce sont des objets intrinsques car la mthode de construction
de E
k
ne dpend pas du systme de coordonnes choisi pour faire les calculs.
3.5. COMPLMENTS 167
Thorme 27. CNS linarisation statique Autour de lquilibre (x, u) =
(0, 0), le systme (3.52) est linarisable par bouclage statique rgulier si et
seulement si les distributions E
i
, i = 1, . . . , n 1 dnies ci-dessus sont
involutives (stables par le crochet de Lie), de rang constant autour de x = 0
et le rang de E
n1
vaut n, la dimension de x.
Une distribution E est dite involutive si et seulement si pour tous champs
de vecteurs f et g dans E (pour tout x, f(x) et g(x) appartiennent lespace
vectoriel E(x)) le crochet [f, g] reste aussi dans E.
Dmonstration. Il est vident que les distributions E
i
restent inchanges par
bouclage statique u = (x) + (x)v avec (x) inversible. Comme pour un
systme linaire commandable
d
dt
x = Ax + Bu, E
i
correspond limage de
(B, AB, . . . , A
i
B), les conditions sur les E
i
sont donc ncessaires.
Leur cot susant repose essentiellement sur le thorme de Frobenius [28].
Ce rsultat classique de gometrie direntielle dit que toute distribution in-
volutive E de rang constant m correspond, dans des coordonnes adaptes
w = (w
1
, ..., w
n
), lespace vectoriel engendr par les m premires compo-
santes. On a lhabitude de noter /w
k
le champs de vecteurs de composantes
(
i,k
)
1in
dans les coordonnes w. Alors E = /w
1
, ..., /w
m
.
Si les E
i
vrient les conditions du thorme, alors il existe un systme
de coordonnes locales (x
1
, . . . , x
n
) autour de 0 tel que
E
i
=
_

x
1
, . . . ,

x

i
_
o
i
est le rang de E
i
. Dans ces coordonnes locales,
d
dt
x
i
pour i >
0
ne d-
pend pas de la commande u. Ainsi, en remplaant u par (x)+(x)u avec une
matrice inversible bien choisie, la dynamique (3.52) scrit ncessairement
sous la forme
d
dt
x
i
= u
i
, i = 1, . . . ,
0
d
dt
x
i
= f
i
(x), i =
0
+ 1, . . . , n
Un raisonnement simple montre que, pour i >
1
, f
i
ne dpend pas de
(x
1
, . . . , x

0
) car E
1
est involutive. Ainsi nous avons la structure suivante
d
dt
x
i
= u
i
, i = 1, . . . ,
0
d
dt
x
i
= f
i
(x
1
, . . . , x
n
), i =
0
+ 1, . . . ,
1
d
dt
x
i
= f
i
(x

0
+1
, . . . , x
n
), i =
1
+ 1, . . . , n
168 CHAPITRE 3. COMMANDABILIT, STABILISATION
De plus, le rang de (f

0
+1
, . . . , f

1
) par rapport (x
1
, . . . , x

0
) vaut
1

0
.
Donc
0

1

0
. Quitte faire des permutations sur les
0
premires
composantes de x, on peut supposer que (x
1
, . . . , x

0
) (f

0
+1
, . . . , f

1
)
est inversible. Cela permet de dnir un nouveau systme de coordonnes en
remplaant les
1

0
premires composantes de x par (f

0
+1
, . . . , f

1
). Dans
ces nouvelles coordonnes, aprs bouclage statique rgulier u (x)u avec
(x) inversible bien choisi, nous obtenons la structure suivante (les notations
avec u, x et f sont conserves)
d
dt
x
i
= u
i
, i = 1, . . . ,
0
d
dt
x
i
= x
i
0
, i =
0
+ 1, . . . ,
1
d
dt
x
i
= f
i
(x

0
+1
, . . . , x
n
), i =
1
+ 1, . . . , n
On sait que ce systme est linarisable si et seulement si le systme rduit
d
dt
x
i
= x
i
0
, i =
0
+ 1, . . . ,
1
d
dt
x
i
= f
i
(x

0
+1
, . . . , x
n
), i =
1
+ 1, . . . , n
lest avec (x
1
, . . . , x

0
) comme commande. Comme les distributions E
i
associes ce systme rduit se dduisent simplement de celles du systme
tendu en liminant les champs de vecteurs

x
1
, . . .

x

0
, on voit quelles
vrient, elles aussi, les conditions du thorme. Il est donc possible de rduire
encore le systme. chaque tape, la linarisation du systme tendu est
quivalente celle du systme rduit. Au bout de cette limination (en au plus
de n 1 tapes), la linarisation du systme de dpart est alors quivalente
celle dun systme rduit de la forme
d
dt
x = f(x, u)
o le rang de f par rapport u est gale la dimension de x, linarisation
qui est alors triviale.
Bouclage dynamique
Le Lemme 3 est trompeur. Il semble suggrer que le fait dtendre un sys-
tme en rajoutant des drives de la commande dans ltat ne rajoute rien
3.5. COMPLMENTS 169
pour la linarisation. Ceci est vrai si on rajoute le mme nombre dintgra-
teurs sur toutes les commandes (c.--d. si on eectue une prolongation tota-
le). Par contre, des nombres dirents peuvent permettre de gagner quelque
chose. Par exemple le systme
x = u
1
sin , z = u
1
cos 1,

= u
2
nest pas linarisable par bouclage statique bien que le systme tendu
x = u
1
sin , z = u
1
cos 1, u
1
= u
1
,

= u
2
de commande ( u
1
, u
2
) le soit. Ce fait nest nullement en contradiction avec le
Lemme 3 puisque seule lentre u
1
a t prolonge par des intgrateurs deux
fois. Pour un systme une seule commande, on ne gagne videment rien.
Cette remarque est lorigine de la technique de linarisation par bou-
clage dynamique. Un systme
d
dt
x = f(x, u) est dit linarisable par bouclage
dynamique rgulier si et seulement si il existe un compensateur dynamique
rgulier
d
dt
= a(x, , v), u = k(x, , v),
tel que le systme boucl
d
dt
x = f(x, k(x, , v)),
d
dt
= a(x, , v)
soit linarisable par bouclage statique rgulier. Noter que la dimension de est
libre. La dimension de lespace dans lequel on doit travailler peut a priori tre
arbitrairement grande. Noter galement que les compensateurs dynamiques
qui consistent ne prolonger que les entres, sont des compensateurs parti-
culiers. Ils sont insusants car ils ne permettent pas de linariser certains
systmes comme celui ci
x = u
2
cos u
1
sin
z = u
2
sin + u
1
cos g

= u
2
On peut montrer que, quel que soit le compensateur dynamique de la forme
u
(
1
)
1
= u
1
, u
(
2
)
2
= u
2
(
1
et
2
entiers arbitraires), le systme tendu nest
pas linarisable par bouclage statique. En revanche, il est linarisable par des
bouclages dynamiques plus gnraux.
Cette question est lorigine des systmes plats, les systmes linarisables
par des bouclages dynamiques dits endognes et auxquels est associe une re-
lation dquivalence (i.e., une gomtrie). Pour en savoir plus, on se reportera
[55].
170 CHAPITRE 3. COMMANDABILIT, STABILISATION
3.5.2 Stabilisation par mthode de Lyapounov et backs-
tepping
On a dj dcouvert cette mthode de stabilisation autour dun point
dquilibre lors de lexemple reprsent sur la Figure 3.1. On reprend ici
simplement lide de base pour un systme non linaire
12
.
On part dun systme dynamique avec un seul contrle u (pour simplier),
d
dt
x = f(x) + ug(x)
et dune fonction V (x) positive et qui tend linni quand x R
n
tend
vers linni en norme. On suppose ici que toutes les fonctions sont drivables
autant de fois que ncessaire.
On suppose de plus que pour u = 0, la drive de V le long des trajectoires
d
dt
x = f(x) est ngative ou nulle. Pour les systmes mcaniques, V est souvent
lnergie mcanique. Ainsi par hypothse pour tout x on a
V
x
f(x) 0
Avec u ,= 0, on a
d
dt
V =
V
x
f(x) + u
V
x
g(x)
Le feedback est alors construit avec nimporte quelle fonction K : R R
assez rgulire qui sannule en 0 uniquement et telle que K() > 0 si < 0
et K() < 0 si > 0
u = K
_
V
x
g(x)
_
Le principe dinvariance de LaSalle sapplique alors (voir le Thorme 11).
Lensemble vers lequel convergent les trajectoires du systme en boucle fer-
me est donn en rsolvant le systme sur-dtermin suivant
d
dt
x = f(x),
V
x
f(x) = 0,
V
x
g(x) = 0.
La mthode consiste driver un certain nombre de fois les deux quations
algbriques
V
x
f(x) = 0 et
V
x
g(x) = 0 par rapport au temps et remplacer
chaque fois
d
dt
x par f(x). La fonction V est souvent appele controlled
Lyapounov function ou CLF.
La mthode dite du backstepping rsout le problme suivant. Les don-
nes sont
12. Lide sapplique aussi aux systmes de dimension innie, i.e., gouverns par des
quations aux drives partielles avec un contrle sur la frontire.
3.5. COMPLMENTS 171
un systme ane en contrle (on suppose toujours, pour simplier lex-
pos, un seul contrle scalaire)
d
dt
x = f(x) + ug(x)
une fonction de Lyapounov V pour u = 0 (une CLF donc)
On peut donc utiliser la mthode ci-dessous pour construire le feedback,
not u = k(x), qui stabilise le systme. On souhaite en dduire un feedback
stabilisant pour le systme tendu
d
dt
x = f(x) + g(x),
d
dt
= u
o maintenant le contrle nest plus mais sa drive u. On considre la
fonction suivante
W(x, ) = V (x) +
1
2
( k(x))
2
Ainsi W est bien innie linni et reste positive. Calculons sa drive par
rapport au temps
d
dt
W =
V
x
(f(x) + g(x)) + p( k(x))
_
u
k
x
(f(x) + g(x))
_
Utilisons le fait quavec = k(x) la drive
d
dt
V =
V
x
(f(x) + k(x)g(x)) est
ngative. Cela conduit au rarrangement suivant du second membre
d
dt
W =
V
x
(f(x)+k(x)g(x))+(k(x))
_
u
k
x
(f(x) + g(x)) +
V
x
g(x)
_
Il sut, avec p paramtre positif, de poser
u =
k
x
(f(x) + g(x))
V
x
g(x) p( k(x))
pour avoir
d
dt
W =
V
x
(f(x) + k(x)g(x)) p( k(x))
2
0
On conclut lanalyse toujours par linvariance de LaSalle. Pour un expos
dtaill des possibilits de ces mthodes nous renvoyons le lecteur intress
[63].
Chapitre 4
Observabilit, estimation et
adaptation
Dans le chapitre prcdent, nous avons vu comment stabiliser un systme
par retour dtat (feedback). La ralisation pratique de tels bouclages n-
cessite la connaissance chaque instant de ltat x. Or, il est frquent que
seule une partie de ltat soit directement mesure. On est alors confront
au problme suivant. Connaissant les quations du systme (i.e., ayant un
modle),
d
dt
x = f(x, u), les relations entre les mesures y et ltat, y = h(x),
les entres t u(t) et les mesures t y(t) , il nous faut estimer x. Cela
revient rsoudre le problme suivant
d
dt
x = f(x, u), y = h(x)
o x est linconnue (une fonction du temps) et o u et y sont des fonctions
connues du temps. Il est clair que ce problme est sur-dtermin. Lunicit de
la solution correspond la proprit dobservabilit que nous allons dnir.
Lexistence dune solution provient du fait que y et u ne peuvent pas tre des
fonctions du temps indpendantes lune de lautre. Elles doivent vrier des
relations de compatibilit qui prennent la forme dquations direntielles (le
modle).
Ce chapitre aborde ces questions. Tout dabord nous donnons, dans un
cadre gnral, les dnitions et les critres assurant lexistence et lunicit
de la solution. Pour les systmes linaires nous prsentons une mthode trs
conome en calculs pour obtenir x avec un observateur asymptotique. Nous
montrons aussi comment paramtrer de faon optimale un tel observateur
asymptotique grce au ltre de Kalman. Le couplage avec la loi de feed-
back est alors simple : il sut de remplacer dans les formules donnant la loi
de rtro-action les valeurs de ltat par leur estimes. On montre alors que
173
174 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
le contrleur ainsi obtenu, celui qui part des sorties, estime ltat et utilise
cette estimation pour calculer le contrle (observateur contrleur, commande
modale, bouclage dynamique de sortie), permet de stabiliser asymptotique-
ment tout systme linaire coecients constants commandable et obser-
vable (cest le principe de sparation). Enn, nous proposons quelques ex-
tensions aux cas non linaires avec la synthse dobservateurs asymptotiques
via linjection de sortie et la notion de contraction.
4.1 Un exemple
Cet exemple est reprsentatif de ce que, dans certains domaines indus-
triels, les ingnieurs appellent les capteurs logiciels. Il sagit, pour un moteur
lectrique, destimer la vitesse de rotation et son couple de charge via les
signaux de courants (mesure) et de tension (contrle). Il est possible dobte-
nir des estimations de ces deux variables mcaniques, coteuses mesurer,
en partant des variables lectriques, qui sont simples et faciles mesurer.
Pour simplier, nous traitons ici le cas des moteurs courant continu. Pour
les moteurs induction, le mme problme se pose mais il est nettement
plus complexe, non compltement rsolu et fait encore lobjet de travaux de
recherches et de dveloppement
1
.
Les capteurs logiciels sont des outils de traitement en temps-rel de lin-
formation. Ils fournissent (idalement) des informations non bruites sur des
grandeurs mesures ou non. Sur lexemple choisi ici, il sagit, partir de la
mesure des tensions et des courants qui traversent le moteur, destimer de
faon causale sa vitesse mcanique et son couple de charge. Lintrt pra-
tique est vident : les informations lectriques sont toujours disponibles car
les capteurs sont simples et ables. Au contraire, les informations mcaniques
ncessitent une instrumentation complexe, chre et peu able. On cherche
sen passer. Pour des raisons de cot mais aussi de scurit, dduire des cou-
rants et tensions, la vitesse de rotation est un enjeu technologique important
en lectro-technique.
Dans dautres domaines, on rencontre des problmes trs similaires. Pour
les procds, les dbits, tempratures et pressions sont faciles avoir par des
capteurs simples et robustes alors que les compositions sont plus diciles
mesurer (temps de retard de lanalyse, ...). Un traitement de linforma-
tion contenue dans les signaux de tempratures, pressions et dbits permet
souvent dobtenir des estimations prcieuses sur les compositions. Un autre
exemple intressant (galement voqu dans lExemple 28) est lestimation
1. Le systme est inobservable au premier ordre et trs sensible aux paramtres basse
vitesse.
4.1. UN EXEMPLE 175
de lorientation relative dun mobile par rapport un rfrentiel terrestre les
mesures sont de deux types : les gyromtres donnent de faon prcise et ra-
pide les vitesses angulaires ; le GPS ou les images issues camra embarques
donnent des informations basse frquence sur les positions et orientations.
On peut dduire grce aux relations cinmatiques, une estimation robuste de
lorientation du mobile (ses trois angles dEuler, i.e., une matrice de rotation),
de sa vitesse et de sa position. Ce problme est central dans les techniques
de guidage de missiles et de drones.
Lexemple du moteur courant continu que nous prsentons en dtails
illustre la notion dobservabilit (voir la Dnition 14), la technique des ob-
servateurs asymptotiques (voir la Section 4.3.2), et lobservateur-contrleur
(voir la Section 4.4).
4.1.1 Un modle simple de moteur courant continu
Un premier modle de moteur courant continu est le suivant
J
d
dt
= k p
L
d
dt
= k R + u
o est la vitesse de rotation du moteur, le courant, u la tension, L > 0 la
self, R > 0 la rsistance, k la constante de couple, p le couple de charge et J
linertie de la partie tournante (moteur + charge).
Nous supposons les paramtres J > 0, k > 0, L > 0 et R > 0 connus et
constants. En revanche, seule lintensit est mesure. La charge p est une
constante inconnue. Il nous faut concevoir un algorithme qui ajuste en temps
rel la tension u de faon suivre une vitesse de rfrence
r
(t) variable dans
le temps. Pour cela nous ne disposons que dun capteur de courant.
4.1.2 Estimation de la vitesse et de la charge
Comme p est un paramtre constant,
d
dt
p = 0 et on peut linclure dans
les variables dtat. On a alors le systme
d
dt
p = 0
J
d
dt
= k p
L
d
dt
= k R + u
avec comme commande u et comme sortie y = . +tudier lobservabilit de ce
systme revient se poser la question suivante : connaissant t ((t), u(t))
et les quations du systme, est-il possible de calculer et p ? La rponse est
176 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
positive et immdiate car
= (u L
d
dt
R)/k, p = k (J/k)
_
d
dt
u L
d
2
dt
2
R
d
dt

_
Le systme est donc observable. On pourrait aussi reprendre le critre de
Kalman (Thorme 28). Dans lesprit, il est issu du mme calcul.
Cependant les mesures de courant sont bruites. Il est donc hors de ques-
tion de driver ce signal. Le fait dtre en thorie observable ne donne pas un
algorithme destimation raliste. Il nous faut concevoir un algorithme qui soit
insensible au bruit, i.e., qui les ltre sans introduire de dphasage comme le
ferait un simple ltre passe-bas. Ici apparat une ide centrale : lobservateur
asymptotique. Cette ide consiste copier la dynamique du systme en lui
rajoutant des termes correctifs lis lerreur entre la prdiction et la mesure.
Cela donne ici lobservateur suivant
d
dt
p = L
p
( )
J
d
dt
= k p L

( )
L
d
dt
= k R + u L

( )
Il est dusage de rajouter un sur les estimes. On parle souvent pour
le paramtre p didentication, p tant la valeur identie et pour et
destimation ou de ltrage, et tant les valeurs estimes et ltres (cest
dire dbarrasses des bruits hautes frquences). En choisissant correctement
les gains L
p
, L

et L

les carts entre les estimes et les vraies valeurs tendent


vers zro. En eet la dynamique des erreurs e
p
= pp, e

= et e

=
scrit
d
dt
e
p
= L
p
e

J
d
dt
e

= e
p
(k L

)e

L
d
dt
e

= (L

+ R)e

ke

Il sagit dun systme linaire stationnaire dont les valeurs propres sont les
racines du polynme en s de degr 3 suivant
s
3
+
L

+ R
L
s
2
+
k(k L

)
LJ
s +
L
p
k
LJ
+tant donn quen jouant sur les L
p
, L

et L

, on peut donner nimporte


quelles valeurs aux fonctions symtriques des racines, il est possible de les
choisir comme lon veut. Si L
p
, L

et L

vrient

+ R
L
= r
1
+ r
2
+ r
3
k(k L

)
LJ
= r
1
r
2
+ r
1
r
3
+ r
2
r
3

L
p
k
LJ
= r
1
r
2
r
3
4.1. UN EXEMPLE 177
alors les racines seront r
1
, r
2
et r
3
. On peut choisir pour les ples dobser-
vation (on le verra en dtail dans le Thorme 29 de placement des ples de
lobservateur) les valeurs suivantes
r
1
=
R
L
(1 +

1), r
2
=
R
L
(1

1), r
3
=
_
k
2
LJ
Ce choix correspond aux chelles de temps caractristiques du systme en
boucle ouverte.
Les valeurs p, et ainsi calcules convergent vers p, et , quelle que
soit la loi horaire t u(t).
4.1.3 Prise en compte des chelles de temps
Supposons, et cest souvent le cas, que la dynamique lectrique est nette-
ment plus rapide que la dynamique mcanique. Cela revient dire que la self
L est trs petite, positive mais mal connue. Ainsi, tout ce que lon sait cest
que L o est un petit paramtre positif. Il est alors facile de voir que les
rsultats thoriques sur les perturbations singulires (voir Section 1.4.1) sap-
pliquent ici : le systme reste stable en boucle ouverte avec une dynamique
du courant convergeant immdiatement vers son rgime quasi-statique
= (u k)/R
La dynamique lente de la vitesse tant alors
J
d
dt
= (k
2
/R) + (k/R)u p.
Il sut de remarquer que, puisque = (uR)/k, la vitesse est indirectement
connue en combinant la tension et la mesure de courant.
Lobservateur asymptotique aura alors la forme plus simple suivante
d
dt
p = L
p
( z(t))
J
d
dt
= (k
2
/R) + (k/R)u p L

( z(t))
(4.1)
o la mesure z(t) = (u(t) R(t))/k correspond la vitesse , suite lap-
proximation quasi-statique pour le courant. Les gains L
p
et L

doivent
tre choisis positifs pour garantir la stabilit et pas trop grands cause de
lapproximation quasi-statique sur le courant.
Le suivi de la rfrence en vitesse t
r
(t) sera alors assur par le
feedback u solution de
(k
2
/R) + (k/R)u p = J(
d
dt

r
(
r
)/)
178 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
si on avait directement accs et p. Ici > 0 est la constante de temps
de suivi. ne doit pas tre trop petit toujours cause de lapproximation
quasi-statique sur le courant. Il est alors naturel de remplacer et p par leur
estimes pour calculer u
(k
2
/R) + (k/R)u p = J(
d
dt

r
(
r
)/)
Nous avons obtenu le bouclage dynamique de sortie y = avec y
r
=
r
(t)
une rfrence continment drivable en t (la partie dynamique tant alors
forme par lobservateur de et p)
d
dt
p = L
p
( z(t))
J
d
dt
= (k
2
/R) + (k/R)u(t) p L

( z(t))
z(t) = (u(t) Ry(t))/k
u(t) = k +
R
k
p + J
_
d
dt
y
r
(t)
y
r
(t)

_
4.1.4 Contraintes sur les courants
Il est important pour des raisons de scurit de garantir un courant
born. Ainsi nous avons comme contrainte
[[
max
o
max
> 0 est le courant maximum support par le variateur et le moteur.
Les algorithmes prcdents ne garantissent pas le respect de cette contrainte
dtat. Nanmoins, il est possible de prendre en compte cette contrainte en
ne modiant que le contrleur de la section prcdente sans toucher lob-
servateur. On considre donc un premier bouclage grand gain en courant :
u = R k +
1

( )
o est une rfrence de courant et tel que R 1. Un tel bouclage rend
la dynamique du courant stable et bien plus rapide que celle de la vitesse. On
pourra remarquer que, mme si L est petit, ce bouclage ne fait que renforcer
la rapidit du courant sans le dstabiliser. En eet on a
L
d
dt
= ke

(R + 1/)( )
et donc est une trs bonne approximation. La dynamique de la vitesse
se rduit
J
d
dt
= k

i p
4.2. OBSERVABILIT NON LINAIRE 179
Une justication mathmatique de cette rduction relve encore de la thorie
des perturbations singulires.
La rfrence de courant peut alors tre calcule ainsi
=
J
r
J(
r
)/ + p
k
o > 0 est un temps nettement suprieur lchelle de temps de la dynamique
du courant, i.e., L/(R + 1/) avec et p solution de (4.1).
Si la rfrence de courant ainsi calcule ne vrie pas la contrainte, alors
il sut de la saturer en valeur absolue
max
en prservant son signe. Il est
possible de voir quune telle saturation ne peut pas dstabiliser la vitesse.
Elle assure de fait le suivi au mieux de la rfrence
r
.
4.2 Observabilit non linaire
Considrons les systmes non linaires de la forme
_
_
_
d
dt
x = f(x, u)
y = h(x)
(4.2)
avec x R
n
, u R
m
et y R
p
, les fonctions f et h tant rgulires.
4.2.1 Dnition
Pour dnir lobservabilit, il convient dabord de dnir la notion de
distinguabilit.
Dnition 14 (Distinguabilit). Deux tats initiaux x et x sont dits in-
distinguables (nots xI x) si pour tout t 0, les sorties y(t) et y(t) sont
identiques pour toute entre u(t) admissible
2
. Ils sont dits distinguables si-
non.
Lindistinguabilit est une relation dquivalence. Notons I(x) la classe
dquivalence de x. Lobservabilit est alors dnie de la manire suivante
Dnition 15 (Observabilit globale). Le systme (4.2) est dit observable
en x si I(x) = x et il est observable si I(x) = x pour tout x.
2. y(t) (resp. y(t)) correspond la sortie de (4.2) avec lentre u(t) et la condition
initiale x (resp. x).
180 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
En fait, le systme est observable si pour tous les tats initiaux x et x,
il existe une entre admissible u qui distingue x et x, cest dire telle que
y(t) ,= y(t) pour au moins un temps t 0.
Il peut exister des entres qui ne distinguent pas certains points. Cepen-
dant, le systme peut tre malgr tout observable. Par exemple
_
_
_
d
dt
x
1
= ux
2
d
dt
x
2
= 0
y = x
1
est observable (pour u = 1 par exemple). Cependant lentre u = 0 ne dis-
tingue pas les points x et x tels que x
1
= x
1
et x
2
,= x
2
. Notons que lobserva-
bilit ne signie pas que toute entre distingue tous les tats. Lobservabilit
est un concept global. Il peut tre ncessaire daller trs loin dans le temps
et dans lespace dtat pour distinguer deux tats initiaux. Pour cela nous
introduisons le concept plus fort qui suit.
Dnition 16 (Observabilit locale en temps et en espace). Ltat x
de (4.2) est localement observable, si pour tout > 0 et pour tout voisinage
U de x, il existe > 0 plus petit que et un voisinage V de x contenu dans
U, tel que pour tout x V , il existe une entre [0, ] t u(t) qui distingue
x et x, i.e. telle que y() ,= y(). Le systme (4.2) est localement observable
sil lest pour tout x.
Intuitivement, le systme (4.2) est localement observable si on peut ins-
tantanment distinguer chaque tat de ses voisins en choisissant judicieuse-
ment lentre u.
4.2.2 Critre
La seule faon eective de tester lobservabilit dun systme est de consi-
drer lapplication qui x associe y et ses drives en temps. Nous suppo-
serons dans cette section que y et u sont des fonctions rgulires du temps.
Nous supposerons galement que les rangs en x des fonctions de (x, u,
d
dt
u, . . .)
qui apparaissent ci-dessous sont constants.
Considrons donc (4.2). On note h
0
(x) := h(x). En drivant y par rapport
au temps on a
d
dt
y = D
x
h(x)
d
dt
x = D
x
h(x) f(x, u) := h
1
(x, u)
Des drivations successives conduisent donc une suite de fonctions
h
k
(x, u, . . . , u
(k1)
)
4.2. OBSERVABILIT NON LINAIRE 181
dnie par la rcurrence
h
k+1
=
d
dt
(h
k
), h
0
(x) = h(x)
Si pour un certain k, le rang en x du systme
_

_
h
0
(x) = y
h
1
(x, u) =
d
dt
y
.
.
.
h
k
(x, u, . . . , u
(k1)
) = y
(k)
vaut n = dim(x) alors le systme est localement observable. Il sut dutiliser
le thorme dinversion locale pour calculer x en fonction de (y, . . . , y
(k)
)
et (u, . . . , u
(k1)
). Si partir dun certain k, h
k+1
ne fait plus apparatre de
nouvelle relation en x, i.e., si le rang en x de (h
0
, . . . , h
k
)

est identique celui


de (h
0
, . . . , h
k
, h
k+1
)

, alors il en est de mme pour k + 2, k + 3, . . . Ainsi, il


nest pas ncessaire de driver plus de n 1 fois y pour savoir si un systme
est localement observable ou non. Ce raisonnement est valable autour dun
tat gnrique, nous ne traitons pas les singularits qui peuvent apparatre
en des tats et entres particulires. Nous renvoyons [27] pour les cas plus
gnraux avec singularits.
Ce calcul lmentaire montre aussi que y et u sont relis par des quations
direntielles. Elles correspondent aux relations de compatibilit associes au
systme sur-dtermin (4.2) o linconnue est x et les donnes sont u et y.
On obtient toutes les relations possibles en liminant x du systme
_

_
h
0
(x) = y
h
1
(x, u) =
d
dt
y
.
.
.
h
n
(x, u, . . . , u
(n1)
) = y
(n)
On peut montrer que pour un systme localement observable, u et y sont
relis par p = dim(y) quations direntielles indpendantes. Ces quations
font intervenir y driv au plus n fois et u driv au plus n 1 fois.
La mise en forme des ides prcdentes est assez fastidieuse mais nan-
moins instructive. Nous nous contenterons de retenir quen gnral lobserva-
bilit signie que ltat peut tre exprim en fonction des sorties, des entres
et dun nombre ni de leur drives en temps. Dans ce cas, y et u sont relis
par p quations direntielles dordre au plus n en y et n 1 en u.
182 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
Exemple 26. Pour conclure, reprenons lexemple du racteur chimique (3.6)
an dillustrer lanalyse formelle prcdente. Nous ne considrons que x
1
et
T car linvariant chimique x
1
+x
2
est suppos gal x
in
1
. Nous supposons que
la temprature T est mesure (thermo-couple) mais pas la concentration x
1
.
Nous avons donc rsoudre le systme sur-dtermin (les quantits autres
que (x
1
, u, y, T) sont des constantes connues)
d
dt
x
1
= D(x
in
1
x
1
) k
0
exp(E/RT)x
1
d
dt
T = D(T
in
T) + H exp(E/RT)x
1
+ u
y(t) = T
On a facilement x
1
en fonction de (y,
d
dt
y) et u
x
1
=
d
dt
y D(T
in
y) u
H exp(E/Ry)
(4.3)
Le systme est donc observable. y et u sont relis par une quation diren-
tielle du second ordre en y et du premier ordre en u. On lobtient en utilisant
lquation donnant
d
dt
x
1
d
dt
_
d
dt
y D(T
in
y) u
H exp(E/Ry)
_
= Dx
in
1
(D +k
0
exp(E/Ry))
d
dt
y D(T
in
y) u
H exp(E/Ry)
(4.4)
Il sagit dune condition de compatibilit entre y et u. Si elle nest pas sa-
tisfaite alors le systme sur-dtermin de dpart nadmet pas de solution. On
conoit trs bien que ces relations de compatibilit sont la base du diagnostic
et de la dtection de panne.
4.2.3 Observateur, estimation, moindres carrs
Savoir que le systme est observable est bien. Calculer x partir de y et u
est encore mieux. Cependant, la dmarche formelle prcdente ne rpond en
pratique qu la premire question. En eet, avoir x en fonction de drives
des mesures savre dune utilit fort limite ds que lordre de drivation
dpasse 2 et/ou ds que les signaux sont bruits. Il convient en fait de calculer
x en fonction dintgrales de y et u. Dans ce cas, le bruit sur les signaux
est beaucoup moins gnant. La synthse dobservateur pose des problmes
supplmentaires (et nettement plus diciles en fait) que la caractrisation
des systmes observables.
4.2. OBSERVABILIT NON LINAIRE 183
Revenons (4.2). Nous avons un nombre inni dquations en trop. En
eet, puisque lentre u est connue, ltat x est entirement donn par sa
condition initiale x
0
grce au ot
u
t
de
d
dt
x = f(x, u(t)) :
u
t
(x
0
) est la
solution de
d
dt
x = f(x, u(t)) qui dmarre en x
0
t = 0. Ainsi x
0
vrie
chaque instant t, p quations, p tant donc le nombre de mesures
y(t) = h(
u
t
(x
0
))
Il est trs tentant de rsoudre ce systme par les moindres carrs, mme si,
pour un systme non-linaire cela na pas beaucoup de sens. Considrons
un intervalle dobservation [0, T]. x
0
peut tre calcul comme largument du
minimum de
J() =
_
T
0
(y(t) h(
u
t
(x
0
)))
2
dt
x
0
est ainsi obtenu comme on obtient un paramtre partir de donnes
exprimentales et dun modle o ce paramtre intervient : en minimisant
lerreur quadratique entre lobservation y(t) et la valeur prdite par le modle

u
t
(x
0
). Les problmes dobservateurs sont fondamentalement proches des
problmes destimation pour lesquels loptimisation joue un rle important.
Cependant, les dicults ne sont pas pour autant aplanies : la rsolution de
lquation direntielle
d
dt
x = f(x, u) ne peut se faire que numriquement en
gnral ; la fonction J na aucune raison davoir les proprits de convexit qui
assurent la convergence des principaux algorithmes doptimisation (voir par
exemple [61]). La synthse dobservateurs reste donc une question dicile en
gnral bien que trs importante en pratique. Noter enn que lidentication
de paramtres sur un modle
d
dt
x = f(x, u, ) en est un sous-problme :
lidentiabilit correspond alors lobservabilit du systme tendu
d
dt
x = f(x, u, ),
d
dt
= 0, y = x
dtat (x, ) et de sortie y = x.
Dans le cas linaire, f = Ax + Bu et h = Cx,
u
t
(x
0
) est une fonction
ane en x
0

u
t
(x
0
) = exp(tA)x
0
+
_
t
0
exp((t s)A)Bu(s) ds
partir dun intervalle dobservations [0, T], x
0
peut tre calcul comme
largument du minimum de
J() =
_
T
0
(z(t) C exp(tA)x
0
)
2
dt (4.5)
184 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
o z(t) = y(t) C
_
t
0
exp((t s)A)Bu(s) ds. Dans ces conditions J est
quadratique. On est en train de retrouver, dans un cadre dterministe pour
les moindres carrs, le ltre de Kalman trait dans la Section 4.5. Nous
allons maintenant aborder lobservabilit des systmes linaires avec un point
de vue moins classique qui met laccent sur les observateurs asymptotiques.
Ces derniers fournissent, avec des calculs trs conomiques, directement x =

u
t
(x
0
) en fonction de y, u et leurs intgrales.
4.3 Observabilit linaire
On considre ici le systme, dentre u, dtat x et de sortie y suivant
d
dt
x = Ax + Bu, y = Cx (4.6)
o A est une matrice n n, B une matrice n m et C une matrice p n.
4.3.1 Le critre de Kalman
Thorme 28 (Critre de Kalman). Le systme (4.6)
d
dt
x = Ax + Bu,
y = Cx est observable au sens de la Dnition 16 si et seulement si le rang
de la matrice dobservabilit
O =
_
_
_
_
_
C
CA
.
.
.
CA
n1
_
_
_
_
_
est gal n = dim(x).
Pour abrger, on dit souvent que la paire (A, C) est observable lorsque le
rang de la matrice dobservabilit O est maximum. On notera la dualit avec
le critre de commandabilit du Thorme 23.
Dmonstration. Drivons y et dutilisons lquation dtat. Une premire d-
rivation donne
d
dt
y = C
d
dt
x = CAx + CBu.
Donc x est ncessairement solution du systme (les fonctions y et u sont
connues)
Cx = y
CAx =
d
dt
y CBu.
4.3. OBSERVABILIT LINAIRE 185
ce niveau, tout se passe comme si la quantit y
1
=
d
dt
y CBu tait une
nouvelle sortie. En la drivant de nouveau, nous avons CA
2
x =

y
1
CABu.
Maintenant, x est ncessairement solution du systme tendu
Cx = y
0
= y
CAx = y
1
=
d
dt
y CBu
CA
2
x = y
2
=

y
1
CABu.
Il est alors facile de voir que, ainsi de suite, x est ncessairement solution des
quations
CA
k
x = y
k
(4.7)
o les quantits connues y
k
sont dnies par la rcurrence y
k
=
d
dt
y
k1

CA
k1
Bu pour k 1 et y
0
= y.
Si le rang de la matrice dobservabilit est maximum et gal n, elle
admet un inverse gauche (non ncessairement unique), P matrice n pn
vriant
P
_
_
_
_
_
C
CA
.
.
.
CA
n1
_
_
_
_
_
= 1
n
Ainsi,
x = P
_
_
_
y
0
.
.
.
y
n1
_
_
_
La condition de rang est donc susante.
Supposons maintenant que la matrice dobservabilit, de taille pn n,
soit de rang r < n. Nous allons montrer quil existe, au moins, deux trajec-
toires direntes avec les mmes commandes, donnant la mme sortie. Cela
montrera que la condition est aussi ncessaire.
Soit w R
n
un lment non nul du noyau de la matrice dobservabi-
lit. Pour k = 0, . . . , n 1, CA
k
w = 0. Par un raisonnement identique
celui fait lors de la preuve de la Proposition 6 avec les noyaux gauche
de A
k
B, on a ncessairement CA
k
w = 0, pour toute k n. Donc, w est
dans le noyau de toutes les matrices CA
k
. Prenons comme premire tra-
jectoire [0, T] t (x, u) = 0. Il vient, y = 0. Prenons maintenant
comme seconde trajectoire, celle qui, commande nulle, dmarre en w :
[0, T] t (x, u) = (exp(tA)w, 0). Sa sortie vaut
C exp(tA)w =
+

i=0
t
i
i!
CA
i
w = 0
186 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
car chaque terme de la srie est nul. Ceci conclut la preuve.
4.3.2 Observateurs asymptotiques
Comme on la dj dit, il est classique de noter par x(t) une estimation de
la quantit x(t). Nous cherchons ici obtenir une estimation de ltat sans
utiliser les drives de y et u. La premire ide qui vient lesprit est de
copier la dynamique du systme. On intgre directement
d
dt
x = A x + Bu
partir dune condition initiale

x
0
et des valeurs connues du contrle u
chaque instant. Si la matrice A est stable, alors x peut tre pris comme
estimation de x car lerreur e
x
= x x tend naturellement vers 0 puisque
d
dt
e
x
= Ae
x
.
Si A est instable cette mthode ne marchera pas. En eet, une petite er-
reur initiale e
x
(0) sera amplie exponentiellement. Intuitivement, si lerreur
xx devient grande alors, le systme tant observable, lerreur sur les sorties
y y deviendra grande galement
3
. Comme y est connue, il est alors tentant
de modier
d
dt
x = A x +Bu par lajout dun terme du type L( y y) quon
connat et qui correspond lerreur dobservation. Le problme suivant se
pose : peut-on choisir la matrice L de faon ce que la solution x du systme
d
dt
x = A x + Bu(t) L( y y(t)), y = C x
converge vers x? Puisque y = Cx, la question se pose ainsi : peut-on ajuster
la matrice L de faon obtenir une quation direntielle derreur stable
d
dt
e
x
= (A LC)e
x
?
Soyons plus exigeants encore, par un choix judicieux de L, peut-on imposer
ALC davoir toutes ses valeurs propres partie relle strictement ngative ?
Or, les valeurs propres restent inchanges par la transposition : A LC
admet le mme spectre que A

. De plus la paire (A, C) est observable si,


et seulement si, la paire (A

, C

) est commandable (comme on la dj voqu,


on obtient le critre de Kalman de commandabilit en transposant celui de
lobservabilit). Ainsi le thorme 25 se transpose de la manire suivante.
Thorme 29 (Placement de ples. Observateur asymptotique). Si (A, C)
est observable, il existe L, matrice n p, telle que le spectre de ALC soit
le mme que celui de nimporte quelle matrice relle n n librement choisie.
3. On a not y = C x.
4.4. OBSERVATEUR-CONTRLEUR 187
4.3.3 Observateurs rduits de Luenberger
Supposons que C soit de rang maximum p = dim(y) et que la paire (A, C)
soit observable. On peut toujours supposer, quitte faire un changement de
variable sur x, que y correspond aux p premires composantes de ltat x :
x = (y, x
r
). Lquation dtat
d
dt
x = Ax + Bu scrit alors sous forme blocs
d
dt
y = A
yy
y + A
yr
x
r
+ B
y
u
d
dt
x
r
= A
ry
y + A
rr
x
r
+ B
r
u
Il est facile de montrer, en revenant, par exemple la dnition de lobserva-
bilit, que (A, C) est observable si, et seulement si, (A
rr
, A
yr
) lest : en eet
connatre y et u implique la connaissance de A
yr
x
r
=
d
dt
y A
yy
y B
y
u, qui
peut tre vue comme une sortie du systme
d
dt
x
r
= A
rr
x
r
+ (B
r
u + A
ry
y).
En ajustant correctement la matrice des gains dobservation L
r
, le spectre
de A
rr
L
r
A
yr
concide avec celui de nimporte quelle matrice relle carre
dordre n p = dim(x
r
). Considrons alors la variable = x
r
L
r
y au lieu
de x
r
. Un simple calcul montre que
d
dt
= (A
rr
L
r
A
yr
) + (A
ry
L
r
A
yy
(A
rr
L
r
A
yr
)L
r
)y + (B
r
L
r
B
y
)u
Ainsi en choisissant L
r
, de faon avoir A
rr
L
r
A
yr
stable, nous obtenons
un observateur dordre rduit n p pour (donc pour x
r
= + L
r
y) en
recopiant cette quation direntielle
d
dt

= (A
rr
L
r
A
yr
)

+(A
ry
L
r
A
yy
(A
rr
L
r
A
yr
)L
r
)y(t)+(B
r
L
r
B
y
)u(t)
La dynamique de lerreur sur , e

=

vrie lquation autonome stable
d
dt
e

= (A
rr
L
r
A
yr
)e

.
Cet observateur rduit est intressant lorsque np est petit, typiquement
n p = 1, 2 : la stabilit dun systme de dimension 1 ou 2 est en outre trs
simple tudier.
4.4 Observateur-contrleur
4.4.1 Version tat multi-entre multi-sortie (MIMO)
4
En regroupant les rsultats sur la commandabilit et lobservabilit li-
naires, nous savons comment rsoudre de faon robuste par rapport de
4. MIMO : pour Multi-Input Multi-Output
188 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
petites erreurs de modle et de mesures, le problme suivant : amener,
laide de la commande u, ltat x du systme de p q pendant le temps
T en ne mesurant que y sachant que :
d
dt
x = Ax + Bu, y = Cx, (A, B)
commandable et (A, C) observable.
En eet, comme (A, B) est commandable, nous savons avec la forme de
Brunovsky construire explicitement une trajectoire de rfrence [0, T] t
(x
r
(t), u
r
(t)) pour aller de p q. Le respect de certaines contraintes peut-
tre important ce niveau et tre un guide dans le choix de cette trajectoire
de rfrence (et intervenir dans la dnition du critre pour la commande
optimale).
Toujours cause de la commandabilit, nous savons construire un bou-
clage statique sur x, Kx, de faon ce que la matrice A BK soit stable
(placement de ple). La matrice K est souvent appele matrice des gains de
la commande.
Grce lobservabilit, nous savons construire un observateur asympto-
tique sur x en choisissant les gains dobservation L de faon avoir ALC
stable.
Alors le bouclage dynamique de sortie
u(t) = u
r
(t) K( x x
r
(t)) contrleur
d
dt
x = A x + Bu(t) L(C x y(t)) observateur
assure le suivi asymptotique de la trajectoire de rfrence [0, T] t
(x
r
(t), u
r
(t)). Avec ce bouclage, appel commande modale ou encore observa
teur-contrleur, les petites erreurs de conditions initiales sont amorties lorsque
t crot et les petites erreurs de modle et de mesures ne sont pas amplies
au cours du temps.
En eet, comme
d
dt
x = Ax + Bu et y = Cx, on a pour la dynamique du
systme boucl
d
dt
x = Ax + B(u
r
(t) K( x x
r
(t)))
d
dt
x = A x + B(u
r
(t) K( x x
r
(t))) L(C x Cx)
o ltat est maintenant (x, x). Comme (x
r
, u
r
) est une trajectoire du systme,
d
dt
x
r
= Ax
r
+ Bu
r
, on a en prenant comme variables dtat (x = x
x
r
(t), e
x
= x x) au lieu de (x, x), la forme triangulaire suivante :
d
dt
(x) = (A BK) x BK e
x
d
dt
e
x
= (A LC) e
x
Ce qui montre que e
x
et x tendent vers 0 exponentiellement en temps. Le
spectre du systme dtat (x, e
x
) se compose du spectre de A LC et de
celui de A BK. Cest le principe de sparation.
4.4. OBSERVATEUR-CONTRLEUR 189
4.4.2 Version transfert mono-entre mono-sortie (SISO)
5
Figure 4.1 Le transfert en boucle ferme, e = y
c
y =
1
1+GK
y
c
.
Dans le cas mono-variable o y et u sont de dimension un, il est instructif
dinterprter lobservateur contrleur ci-dessus sous sa version tat, en terme
de transfert. On part donc du transfert rationnel y = G(s)u, avec G(s) =
P(s)
Q(s)
strictement causal (d
0
P < d
0
Q), P et Q premiers entre eux (pas de
racines communes dans C). On cherche, comme illustr sur la gure 4.1, un
contrleur K(s) aussi sous la forme dun transfert rationnel causal, K(s) =
N(s)
D(s)
(d
0
N < d
0
D), de sorte que le systme boucl soit stable. Nous allons
voir que lobservateur-contrleur rpond la question. Pour cela on passe
la forme dtat. Pour viter tout confusion avec les fonctions de transfert, les
matrices sont notes en caractres calligraphiques.
Il existe trois matrices (/, B, () telles que
d
dt
x = /x + Bu, y = (x avec
(/, B) commandable, (/, () observable et G(s) = ((s1 /)
1
B. Lobserva-
teur contrleur
u = / x,
d
dt
x = / x +Bu L(( x (y y
c
))
correspond au transfert u = K(s)(y
c
y) donn par
K(s) = /(s1 /+B/ +L()
1
L.
Lidentit matricielle suivante
6
_
1 (/
1
^(/+^ +L()
1
L

1
= 1 +((/+^)
1
^(/+L()
1
L.
conduit, avec /= s1 /, ^ = B/, la formule explicite suivante :
1
1 + G(s)K(s)
= 1 ((s1 /+B/)
1
B/(s1 /+L()
1
L
Ainsi le transfert en boucle ferme admet comme ples ceux du contrleur et
de lobservateur, ples que lon peut choisir o lon veut puisque (/, B) est
commandable et (/, () est observable.
5. SISO : pour Single-Input Single-Output
6. Cette identit est un excellent exercice de calcul dans un cadre non commutatif.
190 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
Figure 4.2 Boucle ferme avec gnrations de trajectoires par un ltre
passe bas sur la consigne y
c
et dont lordre est au moins gal celui du
systme (d
0
R d
0
Q, R stable).
Le gain statique en boucle ferme
1
1+G(0)K(0)
= 1 ((/B/)
1
B/(/
L()
1
L entre e = y
c
y et y
c
na aucune raison dtre nul. Pour avoir cela,
soit on rajoute un eet intgral lent (recalage), soit on rajoute u, u
c
vriant
Q(0)y
c
= P(0)u
c
.
On peut aussi gnrer en temps rel et de faon causale des rfrences y
r
et u
r
qui vrient identiquement Q(s)y
r
= P(s)u
r
et qui suivent asympto-
tiquement nimporte quelle consigne vriant Q(0)y
c
= P(0)u
c
. Il sut de
poser
y
r
=
P(s)
R(s)
y
c
, u
r
=
Q(s)
R(s)
y
c
avec R polynme stable, d
0
R d
0
Q et R(0) = 1. Ainsi, 1/R(s) est un ltre
passe-bas de gain statique unitaire, et on considre le contrleur
u = u
r
K(s)(y y
r
).
qui donne comme transfert en boucle ferme y = y
r
=
Q(s)
R(s)
y
c
. On parle
alors de ltrage de la consigne y
c
. Ces petits calculs de gnration et suivi
de trajectoires correspondent au schma bloc fonctionnel de la gure 4.2. Si
Q(0) ,= 0, alors, avec le changement dchelle y
c
y
c
/Q(0) on voit que y
r
est bien une valeur ltre de y
c
.
4.5 Filtre de Kalman
Nous proposons ici une prsentation simplie de la technique du ltrage
de Kalman. On se restreint au cas des ltres gains constants. Le ltre de
Kalman gains constants, tel que nous le prsentons ici, est un algorithme
utilis pour reconstruire les variables dtat dun systme continu soumis des
perturbations stochastiques en utilisant des mesures incompltes entches
4.5. FILTRE DE KALMAN 191
de bruit. Cette technique (voir [39]) a t utilise de manire intensive dans le
domaine de la navigation inertielle [23]. Il en existe de nombreuses variantes :
version instationnaire, version discrte, version tendue pour tenir compte de
la variation du point de fonctionnement, etc. On pourra se reporter [59]
pour une prsentation complte et [9] pour des complments au sujet de la
robustesse dans le cadre stationnaire.
Le lien avec les observateurs asymptotiques de la section prcdente est
simple : ces derniers peuvent tre interprts comme des ltres de Kalman
o les matrices de covariance des bruits sur ltat et la sortie paramtrisent
la matrice des gains L du thorme 29. Au lieu de dnir L partir des ples
de lobservateur, i.e., des valeurs propres de ALC, L est dni partir des
matrices de covariance. Comme pour la commande LQR, il dicile davoir
alors des formules analytiques pour L sauf pour les systmes un ou deux
tats
7
.
4.5.1 Formalisme
On considre un systme sous forme dtat linaire stationnaire
d
dt
x(t) = Ax(t) + Bu(t) + D(t) (4.8)
o ltat est x(t) R
n
, lentre est un signal (dterministe) connu u(t) R
m
,
et (t) R
q
reprsente la valeur dun signal stochastique qui agit comme
une perturbation sur le systme. On suppose que ce dernier signal possde les
proprits statistiques suivantes (qui en font un bruit blanc gaussien centr) :
pour tout t, (t) est une variable gaussienne de moyenne E ((t)) = 0,
cov ((t), ()) = M

(t )
o est la fonction Dirac (voir [42]), et M

est une matrice constante de


/
q
(R) symtrique dnie positive.
Sous ces hypothses, x(t) solution de (4.8) est un processus stochastique
gaussien color.
En ce qui concerne la mesure, nous disposons de
y(t) = Cx(t) + (t) (4.9)
o y(t) R
p
, et (t) R
p
reprsente lui aussi un bruit blanc gaussien centr,
indpendant de (t) tel que
E ((t)) = 0, pour tout t
cov ((t), ()) = M

(t )
7. Ce qui nest pas le cas si L est dni en plaant les valeurs propres de ALC.
192 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
o M

est une matrice constante de /


p
(R) symtrique dnie positive.
On se place dans le cas o on connat les entres et les mesures jusquau
temps t. On note alors
U(t) = u(), ] , t]
Y (t) = y(), ] , t]
tant donn U(t) et Y (t), on cherche une estimation x(t) de ltat x(t) qui
soit optimale en un certain sens. Le critre minimiser est la covariance
totale de lerreur x(t) = x(t) x(t)
J = E
_
x
T
x
_
= trace
_
E( x(t) x
T
(t)

sous la contrainte destimation non biaise


E( x(t)) = 0
4.5.2 Hypothses et dnition du ltre
Hypothses
Pour pouvoir construire le ltre de Kalman, on suppose que les deux
hypothses (fortes) sont vries
(H1) : la paire (A, D) est commandable
(H2) : la paire (A, C) est observable
(H1) signie que le bruit (t) excite tout ltat du systme. (H2) implique
que la mesure non bruite Cx contient des informations sur tout ltat. On
peut relcher ces deux hypothses en nimposant seulement que
(H1

) : la paire (A, D) est stabilisable


(H2

) : la paire (A, C) est dtectable


en imposant que les modes non excits par le bruit (t) soient asymptotique-
ment stables et que les modes non observs soient asymptotiquement stables.
Minimisation de la covariance
Le ltre de Kalman que nous prsentons est un ltre stationnaire de
dimension gale celle de ltat du systme observer. Il admet comme entre
le signal u(t) et la mesure bruite y(t). Il scrit, comme pour lobservateur
4.5. FILTRE DE KALMAN 193
asymptotique de Luenberger, au moyen dune matrice de gain L sous la forme
suivante
d
dt
x(t) = A x(t) + Bu(t) L(C x(t) y(t)) (4.10)
Le terme C x(t) y(t) est nomm innovation. La stabilit de ce ltre dpend
de la stabilit de la matrice ALC. Daprs (H2), (ou (H2

)) il est possible
de stabiliser cette matrice par un choix appropri de L. La particularit du
ltre de Kalman rside dans le calcul de L partir des matrices de covariance
sur les bruits et .
Par dnition de lquation (4.10), lquation satisfaite par lerreur est
d
dt
x(t) = (A LC) x(t) + D(t) L(t)
En utilisant la matrice de transition (t, t
0
) = exp((A LC)(t t
0
)) entre
un temps initial t
0
et t, on peut crire la solution de ce systme comme-suit
x(t) = (t, t
0
)x(t
0
) +
_
t
t
0
(t, ) (D() L()) ()d
En passant aux esprances, il vient
E( x(t)) = (t, t
0
)E(x(t
0
))
car les signaux (t) et (t) sont desprance nulle par hypothse. Si A LC
est asymptotiquement stable, on en dduit que lorsque le ltre de Kalman
est initialis au temps t
0
= , on a
E( x(t)) = 0
et on conclut que lestimation est, quel que soit le choix de L (stabilisant),
non biaise
8
. Un calcul semblable permet de calculer la covariance de lerreur,
note E
_
x(t) x
T
(t)
_
comme lunique solution symtrique positive de
lquation matricielle de Lyapounov suivante
(A LC) + (A LC)
T
+ DM

D
T
+ LM

L
T
= 0 (4.11)
Ainsi, pour toute valeur de la matrice de gain L, on peut calculer la cova-
riance de lerreur par lquation prcdente. Le critre que nous cherchons
minimiser est justement J = trace(). Pour le ltre de Kalman, L est choisi
comme largument du minimum de cette fonction.
8. Si on initialise le ltre de Kalman en t = 0 avec un tat x(0) = x
0
quelconque,
la stabilit permettra de conclure labsence de biais de manire asymptotique, lorsque
t +.
194 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
Gain du ltre
Le gain du ltre de Kalman est
L = C
T
M
1

(4.12)
o est lunique solution symtrique positive de lquation de Riccati alg-
brique
0 = A + A
T
+ DM

D
T
C
T
(M

)
1
C
On peut montrer, par une dmonstration trs semblable au cas de la com-
mande quadratique, que le gain L est stabilisant, i.e. est tel que A LC a
toutes ses valeurs propres partie relle strictement ngative. Ceci justie a
posteriori les hypothses que nous avons formules.
Exemple 27. Considrons un systme autonome mono-dimensionnel trs
simple
d
dt
x = x + u +
y = x +
o E ((t)) = 0, pour tout t, cov ((t), ()) = (t ), E ((t)) = 0, pour
tout t, cov ((t), ()) = k
2
(t ). Le ltre de Kalman est de la forme
d
dt
x(t) = x + u L( x y(t))
o L est calcul par
L = (k
2
)
1
o est lunique solution positive de
0 = 2 + 1
2
_
k
2
_
1
Il vient =

k
2
+ k
4
k
2
et lquation du ltre de Kalman est alors
d
dt
x(t) =
_
1 +
1
k
2
x + u +
_
_
1 +
1
k
2
1
_
y
titre dillustration, on a reprsent sur la gure 4.3 des rsultats de
simulation permettant de comprendre leet du ltre de Kalman. On peut
comparer sur la mme gure ses rsultats avec un autre rglage non optimal.
4.5. FILTRE DE KALMAN 195
0 2 4 6 8 10 12
200
0
200
Bruit dexcitation
0 2 4 6 8 10 12
0
5
10
Mesure bruite
0 2 4 6 8 10 12
0
5
10
Etat rel et estimation de ltat (filtre de Kalman)
0 2 4 6 8 10 12
0
2
4
Estimation de la variance de lerreur (filtre de Kalman)
0 2 4 6 8 10 12
0
5
10
Etat rel et estimation de ltat (autre rglage de filtre)
0 2 4 6 8 10 12
0
2
4
Estimation de la variance de lerreur (autre rglage de filtre)
Figure 4.3 Utilisation dun ltre de Kalman.
196 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
Exemple 28 (Fusion de capteurs pour robot roues). Considrons un ro-
bot mobile roues indpendantes tel que le MobileRobots
TM
Pioneer 3-AT
reprsent sur la Figure 4.4. Pour contrler ce vhicule, on peut librement
agir sur les quatres roues indpendantes. Pour le rendre autonome, c.--d.
capable de suivre une trajectoire prvue lavance par exemple, la principale
dicult consiste estimer ( bord) prcisment la position et lorientation
du vhicule. Pour rsoudre ce problme, on peut quiper le vhicule dun cer-
tain nombre de capteurs embarqus : odomtres, rcepteur GPS, gyroscope
entre autres.
Chaque capteur prsente des dfauts bien spciques. Le GPS fournit un
signal actualis relativement basse frquence, entch dun fort bruit de
mesure basse frquence. Le gyroscope fournit des informations frquemment
ractualises mais dgrades par un fort bruit de mesure haute frquence. En-
n, les odomtres sont relativement ables, mais ont une rsolution limite.
Les quations de la dynamique du vhicule sont
_

_
d
dt
x =
(v
1
+ v
2
)
2
cos ,
d
dt
y =
(v
1
+ v
2
)
2
sin ,
d
dt
=
(v
2
v
1
)
2l
(4.13)
o v
1
, v
2
reprsentent la vitesse du train roulant gauche et droit respecti-
vement, x, y reprsentent la position du centre de masse du vhicule et
est lorientation du chassis, l est la demi largeur de lengin. En conditions
normales dutilisation, le modle (4.13) est able.
Dans ce modle, on dispose de la connaissance de v
1
et v
2
par lutilisa-
tion des odomtres (ici des capteurs incrmentaux situs dans les arbres des
roues). On mesure x et y par le rcepteur GPS et enn on mesure
d
dt
grce
un gyroscope
9
un axe.
An destimer ltat (x, y, )
T
du systme, on peut utiliser un observateur,
ou un ltre de Kalman. Ces techniques de fusion de capteurs utilisent la re-
dondance de linformation et laccord avec un modle dynamique, pour fournir
une estimation meilleure que linformation fournie par chacun des capteurs
sparment. Par exemple, si on intgre (en boucle ouverte) les donnes du
gyroscope et des odomtres, ce qui thoriquement permet de calculer les posi-
tions, on observe trs rapidement (aprs quelques dizaines de secondes) une
importante drive de lestimation. Si on nutilise que le GPS, on obtient assez
rapidement des aberrations signalant par exemple des mouvements latraux
de plusieurs mtres (alors que le vhicule en est totalement incapable).
On a reprsent sur la Figure 4.5, des rsultats de suivi en boucle ferme
dune trajectoire de consigne. On donne aussi titre informatif, lenregis-
9. Ce gyroscope de technologie MEMS mesure une vitesse angulaire.
4.5. FILTRE DE KALMAN 197
Figure 4.4 Vhicule autonome roues indpendantes (remerciements au
Laboratoire de recherches balistiques et arodynamiques de la Dlgation
Gnrale pour lArmement).
trement des valeurs donnes par le rcepteur GPS quon pourra comparer
lestimation par fusion de capteurs (on dit aussi hybridation) de la position
du vhicule.
198 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
10 5 0 5 10 15 20
25
20
15
10
5
0
Figure 4.5 Suivi de trajectoire en boucle ferme pour un vhicule roues
en utilisant une fusion de capteurs : GPS, gyroscope et odomtres.
4.6. COMPLMENTS 199
Utilisation dans un cadre dterministe
Lorsque le systme nest pas aect par des bruits ou que ceux-ci sont mal
connus, on peut continuer utiliser le ltre de Kalman pour rgler lobserva-
teur asymptotique stationnaire quil dnit. Les matrices M

et M

agissent
comme des pondrations (on remarquera lanalogie avec la commande qua-
dratique une fois de plus) avec les eets suivants :
1. lorsquon augmente M

, on a tendance faire moins conance aux


mesures (ou certaines dentre elles si on agit seulement sur certains
coecients dominants de la matrice) et donc naturellement linuence
de ces mesures sur la dynamique du ltre sera rduite travers le calcul
de la matrice de gain (4.12) ;
2. lorsquon augmente M

, on a tendance faire moins conance au


modle de la dynamique non bruite, naturellement on va acclrer
la dynamique de lobservateur pour en tenir compte en privilgiant
dans (4.10) linnovation aux dpens du modle. Ceci est apparent dans
la contribution de M

au gain L travers la covariance dans lqua-


tion (4.11).
4.6 Complments
4.6.1 Estimation de paramtres et commande adapta-
tive
Soit le systme dtat x et de paramtre p
d
dt
x = f(x, t) + p g(x, t), x R
n
, p R
On suppose que les trajectoires t x(t) sont bornes et donc dnies pour
tout temps t positif. On mesure ici tout ltat x. On souhaite estimer p.
On considre lestimateur suivant o K et sont des paramtres constants
> 0 (sorte de moindres carrs rcursifs)
d
dt
x = f(x(t), t)+ p g(x(t), t)K( xx(t)),
d
dt
p = g(x(t), t), ( x x(t)))
o , ) est le produit scalaire dans R
n
.
Cet estimateur donne en temps rel dune part une valeur ltre de x, x
et dautre part reconstruit asymptotiquement le paramtre p lorsquil existe
200 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
> 0 tel que |g(x, t)| pour tout x R
n
et tout temps t. En eet, il
sut de considrer la fonction de Lyapounov suivante
V =
1
2
( x x)
2
+
1
2
( p p)
2
On voit que
d
dt
V = K( x x)
2
0
Ainsi x tend vers x quand t tend vers linni. Et donc, intuitivement
d
dt
x
d
dt
x
converge vers 0 soit donc (p p)g(x, t) converge zro. Comme le vecteur g(x, t)
est toujours de norme plus grande que > 0 on en dduit que p converge
vers p.
Il est possible de gnraliser cet estimateur pour un nombre arbitraire m
de paramtres. On part de
d
dt
x = f(x, t) +
m

i=1
p
i
g
i
(x, t)
On considre avec
i
> 0 paramtre (i = 1, ..., m) lestimateur
d
dt
x = f(x(t), t) +
m

i=1
p
i
g
i
(x(t), t) K( x x(t))
d
dt
p
1
=
1
g
1
(x(t), t), ( x x(t)))
.
.
.
d
dt
p
m
=
m
g
m
(x(t), t), ( x x(t)))
Il est alors facile de voir que la fonction
V =
1
2
( x x)
2
+
m

i=1
1
2
i
( p
i
p
i
)
2
est dcroissante
d
dt
V = K( x x)
2
0
Donc on a toujours x qui converge vers x. En revanche, la convergence des
p
i
vers les p
i
nest pas garantie : tout dpend des g
i
(x, t) : sils forment pour
chaque x et t un systme libre de vecteurs de R
n
, systme bien conditionn,
alors la convergence des paramtres est encore assure. Dans les autres cas,
cela dpend de la trajectoire suivie par x. En revanche, il est trs intressant
4.6. COMPLMENTS 201
de voir que x converge toujours vers x. Lestimateur prcdent est une sorte
de ltre non linaire et adaptatif de x.
Cet estimateur est aussi la base de la commande adaptative qui estime p
en mme temps que lon contrle le systme via u. Prenons un seul paramtre
p et un seul contrle u (la gnralisation est simple partir de l)
d
dt
x = f
0
(x) + uf
1
(x) + pg(x)
Supposons que nous ayons un feedback u = k(x, p) qui stabilise le systme
en x = 0 mais o le paramtre p inconnu intervient. Alors, il est naturel de
considre le feedback construit partir des estimes u = k(x, p) ou u = k( x, p)
avec
d
dt
x = f
0
(x(t)) + u(t)f
1
(x(t)) + p g(x(t), t) K( x x(t))
d
dt
p = g(x(t), t), ( x x(t)))
Sous des hypothses raisonnables sur la dynamique en boucle ouverte pour x
(pas dexplosion en temps ni essentiellement) on montre que x tend vers x
et ensuite que le feedback assure la convergence de x vers 0. Sans conditions
supplmentaires, tout ce que lon peut dire cest que p reste born. Ainsi, la
connaissance de p nest pas ncessairement indispensable pour faire converger
x vers 0 avec le contrle u. Cest le principal paradoxe du contrle adaptatif.
Un lecteur intress pourra consulter [41]. On notera que lune des hypothses
trs importante est la dpendance ane de la dynamique par rapport au
paramtre p. Dans le cas de dpendance non linaire trs peu de rsultats
existent.
4.6.2 Linarisation par injection de sortie
Il arrive parfois que, dans les bonnes coordonnes dtat, coordonnes
notes x ici, les quations du systme scrivent ainsi :
d
dt
x = Ax + f(Cx, t), y = Cx
avec la paire (A, C) observable et f(y, t) est une fonction a priori non linaire.
Il est clair quil faut avoir un peu de air pour choisir les bonnes variables x
pour que le systme scrive ainsi. Ce nest en gnral pas possible. Parfois
cest possible et mme vident comme pour le pendule command :
d
2
dt
2
=
g
l
sin + u(t), y = .
202 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
En eet dans ce cas on a
x =
_

d
dt

_
, A =
_
0 1
0 0
_
, C =
_
1 0
_
,
f(Cx, t) =
_
0

g
l
sin + u(t)
_
Il est alors facile de construire un observateur pour x. Il sut de choisir L
telle que A + LC soit une matrice relle stable. Alors lobservateur
d
dt
x = A x + L(C x y(t)) + f(y(t), t)
est exponentiellement convergent car lorsque lon regarde la dynamique de
lerreur e
x
= x x, les termes non linaires disparaissent et on a
d
dt
e
x
= (A + LC)e
x
.
4.6.3 Contraction
La notion de contraction [49, 33] pour un systme, avec une dynamique
x = f(x, t), peut tre interprte comme la dcroissance exponentielle, avec
le temps, de la longueur de tout segment de conditions initiales transport
par le ot.
Dnition 17 (Contraction stricte). Soit un systme dynamique
d
dt
x =
f(x, t) rgulier ((
1
par exemple) dni sur une varit M rgulire. Soit g
une mtrique sur M. Soit U M un sous ensemble de M. La dynamique f
est dite strictement contractante sur U au sens de la mtrique g, si la partie
symtrique de sa matrice Jacobienne est une matrice dnie ngative, cest
dire, sil existe > 0 tel que, dans des coordonnes locales x sur U, nous
avons pour tout t et pour tout x,
f
x
T
g(x) + g(x)
f
x
+
g
x
f(x, t) g(x)
Nous avons le rsultat suivant qui justie cette dnition et cette termi-
nologie.
Thorme 30. Soit un systme dynamique
d
dt
x = f(x, t) rgulier dni sur
une varit M rgulire. Soit g(x) une mtrique sur M. Soit X(x, t) le ot
associ f
d
dt
X(x, t) = f(X(x, t), t) t [0, T[ avec T +.
X(x, 0) = x
4.6. COMPLMENTS 203
Considrons deux points x
0
and x
1
dans M et une godsique (s) qui joint
x
0
= (0) et x
1
= (1). Si
f est une stricte contraction sur un sous ensemble U M, avec la
constante prsente dans la dnition 17,
et si X((s), t) appartient U pour tout s [0, 1] et pour tout t [0, T[.
alors
d
g
(X(x
0
, t), X(x
1
, t)) e

2
t
d
g
(x
0
, x
1
) t [0, T[
o d
g
est la distance godsique associe la mtrique g.
Dmonstration. La preuve est la suivante
10
. Soit l(t) la longueur de la courbe
(X((s), t), s [0, 1]) au sens de la mtrique g
l(t) =
_
1
0

dX((s), t)
ds
T
g(X((s), t))
dX((s), t)
ds
ds
Nous avons alors
d
dt
l(t) =
_
1
0
d
dt
_
dX((s),t)
ds
T
g(X((s), t))
dX((s),t)
ds
_
2
_
dX((s),t)
ds
T
g(X((s), t))
dX((s),t)
ds
ds
Comme
d
dt
dX((s), t)
ds
=
d
ds
f(X((s), t), t) =

X
f(X((s), t), t)
d
ds
X((s), t)
nous obtenons
d
dt
_
dX((s), t)
ds
T
g(X((s), t))
dX((s), t)
ds
_
=
dX((s), t)
ds
T
P(s, t)
dX((s), t)
ds
avec
P(s, t) =
f(X)
X
T
g(X) + g(X)
f(X)
X
+
g(X)
X
f(X, t)
et
X = X((s), t)
Puisque f est une contraction sur U, il existe > 0 tel que
P(s, t) g(X((s), t))
10. Cette preuve sinspire de calculs faits par Laurent Praly
204 CHAPITRE 4. OBSERVABILIT, ESTIMATION ET ADAPTATION
On obtient alors lingalit suivante pour la drive
d
dt
l(t)
d
dt
l(t)

2
l(t)
qui conduit
l(t) l(0)e

2
t
t [0, T[
Puisque d
g
(X(x
0
, t), X(x
1
, t)) l(t) et l(0) = d
g
(x
0
, x
1
) (en eet est la
godsique qui joint les deux points x
0
et x
1
), le thorme est dmontr.
Lorsque la varit Riemannienne M est lespace Euclidien R
n
, la dyna-
mique
d
dt
x = f(x, t) est une contraction lorsque la partie symtrique de la
matrice Jacobienne est ngative
f
x
+
_
f
x
_
T
0
Enn, lintrt pour la construction dobservateurs non-linaires asympto-
tiques vient du fait quavec une dynamique contractante, il sut de simuler
le systme pour avoir une estimation de x
d
dt
x = f( x, t)
la dpendance en temps tant alors due aux entres et/ou aux termes derreur
entre la sortie estime et la mesure.
Lexemple typique est le suivant. On considre un systme mcanique
un degr de libert x
1
, de vitesse x
2
obissant lquation de Newton suivante
d
dt
x
1
= x
2
,
d
dt
x
2
= F(x
1
, x
2
, t)
avec comme seule mesure y = x
1
et on suppose que
F
x
2
0. On considrer
alors lobservateur
d
dt
x
1
= x
2
( x
1
y(t))
d
dt
x
2
= F(y(t), x
2
) ( x
1
y(t))
avec , > 0 deux paramtres de rglage. On crit symboliquement cet
observateur
d
dt
x = f( x, t) o la dpendance en t vient de la mesure y(t) =
x
1
(t). Cet observateur scrit formellement
d
dt
x = f( x, t). Avec comme produit
scalaire celui qui est associ la matrice constante symtrique dnie positive
g =
_
1 0
0
1

_
4.6. COMPLMENTS 205
on a
_
f
x
_
T
g + g
f
x
=
_
2 0
0
2
F
x
2

_
0
Nous navons pas une contraction stricte comme dans la Dnition 17 mais
au sens large. Il est cependant facile de voir que si
F
x
2
< 0 uniformment
pour tout x avec > 0, on a une contraction stricte et donc la convergence
exponentielle de x vers x.
Annexe A
Sur le thorme de
Cauchy-Lipchitz
On considre donc le problme de Cauchy suivant :
x(0) = x
0
,
d
dt
x(t) = v(x(t), t). (A.1)
Pour tablir des rsultats sur ces proprits (essentiellement, les Thormes 1
et 2) nous allons utiliser la notion de solution approchante qui sappuie sim-
plement sur le schma numrique dEuler explicite
x
k+1
= x
k
+ v(x
k
, k), x
0
= x(0), k N
o est un petit temps > 0 et x
k
une approximation de x(k).
Considrons le problme de Cauchy (A.1). On suppose, de manire gn-
rale, que v est continue dans une rgion R = |x x
0
| b, [t[ a. En
gnral on prend comme norme | |, la norme euclidienne sur R
n
, mais ce
nest pas une obligation. Par la suite, sauf mention contraire | | dsigne la
norme euclidienne. Il en dcoule que v est borne sur R par une certaine
constante M > 0.
Dnition 18 (Solution approchante). On appelle solution approchante
prs du problme de Cauchy (A.1), une fonction t x(t) continue,
drivable par morceaux, telle que pour tout (t, x(t)) R on a
x(0) = x
0
,
_
_
_
_
d
dt
x(t) v(x(t), t)
_
_
_
_

en tout point o
d
dt
x est dni.
207
208 ANNEXE A. SUR LE THORME DE CAUCHY-LIPCHITZ
En dautres termes,
d
dt
x(t) peut ne pas tre dni en un nombre ni de
points de [t[ a.
De telles solutions approchantes existent comme le prcise le rsultat
suivant.
Thorme 31. Soit le problme de Cauchy (A.1) o v est continue sur
R = |x x
0
| b, [t[ a et majore par [v[ M. Pour tout > 0, on
peut construire une solution approchante prs dnie sur lintervalle [t[
min(a, b/M) h.
Dmonstration. Lapplication v est continue sur R, elle est donc uniform-
ment continue. Pour tout > 0, il existe > 0 tel que
[v(x
1
, t
1
) v(x
2
, t
2
)[
quels que soient (x
1
, t
1
) R et (x
2
, t
2
) R avec |x
1
x
2
| , [t
1
t
2
[ .
Considrons maintenant, tant donn, un ensemble de temps interm-
diaires entre 0 et h
t
0
= 0 < t
1
< t
2
... < t
m
= h
vriant
[t
i
t
i1
[ min(, /M), i = 1, ..., m (A.2)
(par exemple, cette famille de temps intermdiaires peut tre de plus en plus
nombreuse lorsque diminue). Nous allons montrer que la fonction dnie
par la relation de rcurrence (dite de Cauchy-Euler)
x(t) = x
i1
+ (t t
i1
)v(x
i1
, t
i1
), t
i1
t t
i
, x
i
= x(t
i
)
est une solution approchante prs. Cette fonction est continue, et elle pos-
sde une drive continue par morceaux (elle est en fait ane par morceaux
par construction). Sa drive est dnie partout sauf aux points (t
i
)
i=1,...,m1
.
En dehors de ces points, on a, pour t
i1
t t
i
,
_
_
_
_
d
dt
x(t) v(x(t), t)
_
_
_
_
= |v(x
i1
, t) v(x(t), t)|
Par (A.2), et daprs la relation de rcurrence, on a
|x(t) x
i1
| = M(t t
i1
) < M

M
= (A.3)
209
Daprs la continuit uniforme de v dj voque, on dduit de (A.2)-(A.3)
|v(x
i1
, t
i1
) v(x(t), t)|
On a donc tabli, que pour tout [t[ < a en dehors des points t
1
, ..., t
m
on a
_
_
_
_
d
dt
x(t) v(x(t), t)
_
_
_
_

Enn, par construction x(0) = x
0
, ce qui achve la dmonstration.
Nous allons maintenant avoir besoin de la proprit Lipschitz permettant
de prouver une ingalit de croissance de la propagation des approximations.
Dnition 19 (Fonction Lipschitz). Une fonction scalaire (x, t) R
R
n
R v(x, t) R est Lipschitz avec la constante k > 0 (ou k-Lipschitz)
en x si
|v(x
1
, t) v(x
2
, t)| k |x
1
x
2
|
pour tout (x
1
, t), (x
2
, t) dans R.
Dnition 20 (Fonction Lipschitz vectorielle). Une fonction (x, t)
R
n
R v(x, t) R
n
est Lipschitz en x si et seulement si chacune de ses
composantes lest (les constantes Lipschitz de chaque composante peuvent
direr).
On notera, grce la proposition suivante, que la proprit Lipschit-
zienne est trs gnrale.
Proposition 9. Soit R
n
R (x, t) v(x, t) R
n
. Supposons que chaque
drive partielle
v(x,t)
x
i
pour i = 1, ..., n existe et soit de norme borne par un
scalaire c, alors v(x, t) est Lipschitzienne en x avec comme constante c

n.
Dmonstration. Quels que soient x = (x
1
, ..., x
n
) et y = (y
1
, ..., y
n
) deux
vecteurs de R
n
, on peut crire,
v(y, t) = v(x, t) +

i=1,...,n
_
1
0
v
x
i

(y+(xy),t)
(x
i
y
i
) d
Il sut alors dutiliser lingalit de Cauchy-Schwartz, lingalit triangulaire
et lhypothse
_
_
_
v(x,t)
x
i
_
_
_ n pour avoir
|v(y, t) v(x, t)| c

n|x y|
210 ANNEXE A. SUR LE THORME DE CAUCHY-LIPCHITZ
Nous allons maintenant pouvoir noncer, sous une hypothse de Lipschitz,
un rsultat important sur la propagation des direntes entre les solutions
approchantes.
Thorme 32 (Propagation de la distance entre deux solutions appro-
chantes). tant donne v(x, t) continue sur une rgion R et k-Lipschitz en
x. Soient x
1
(t) et x
2
(t) deux solutions approchantes
1
et
2
prs du pro-
blme de Cauchy (A.1), dnies sur [t[ b. La dirence d(t) = x
1
(t)x
2
(t)
satisfait, pour tout [t[ b
|d(t)| exp(k [t[) |d(0)| +

1
+
2
k
(exp(k [t[) 1) (A.4)
Dmonstration. La drive
d
dt
d(t) est dnie partout sauf en un nombre ni
de points. Par dnition des solutions approchantes, on a (en notant

1
+
2
)
_
_
_
_
d
dt
d(t)
_
_
_
_
=
_
_
_
_
d
dt
x
1
(t)
d
dt
x
2
(t)
_
_
_
_
|v(x
1
(t), t) v(x
2
(t), t)| +
k |x
1
x
2
| + k |d(t)| +
o on a utilis la proprit Lipschitzienne de v. Aux points tels que
d
dt
d(t)
existe et d(t) ,= 0, on peut donc conclure daprs le Lemme 4 (donn un peu
plus loin),
d
dt
|d(t)| k |d(t)| +
On a alors trois cas :
1. si d(t) est identiquement nul, alors la conclusion est triviale
2. si d(t) ne sannule jamais sur ] b, b[, alors on peut crire
_
t
0
exp(kt)
_
d
dt
|d(t)| k |d(t)|
_
dt
_
t
0
exp(kt)dt
o le membre de gauche peut avoir un intgrand discontinu mais pos-
sde eectivement une primitive. Il vient
exp(kt) |d(t)| |d(0)|

k
(1 exp(kt))
do la conclusion
211
3. sil existe

t tel que d(

t) ,= 0, [

t[ b alors que d sannule quelque part


sur lintervalle [b,

t], alors, par continuit de |d(t)|, il existe t


1
, avec
b t
1
<

t b tel que d(t
1
) = 0 et d(t) ,= 0 sur t
1
< t <

t. Par une
intgration semblable au cas prcdent mais eectue sur lintervalle
[t
1
,

t], on a alors
|d(t)|

k
(exp (k(t t
1
)) 1)
qui est une majoration plus forte que celle recherche.
Lemme 4. Si x(t) est continment direntiable sur un intervalle ouvert
]t
1
, t
2
[, alors, en tout point t tel que |x(t)| ,= 0, la drive
dx(t)
dt
existe et
vrie

d |x(t)|
dt

_
_
_
_
dx(t)
dt
_
_
_
_
Dmonstration. Soit t ]t
1
, t
2
tel que |x(t)| , = 0, avec |x(t)| =
_

n
i=1
x
2
i
(t),
il vient
dx(t)
dt
=

n
i=1
x
i
dx
i
dt
x(t)
qui est bien dnie. Dautre part, par passage la
limite dans lingalit suivante, on obtient le rsultat dsir.
1
t
[|x(t + t)| |x(t)|[
1
t
|x(t + t) x(t)|
Nous pouvons maintenant nous intresser aux thormes dexistence et
dunicit des solutions du problme de Cauchy.
Thorme 33 (Unicit de la solution au problme de Cauchy). Soit le pro-
blme de Cauchy (A.1) o v(x, t) est continue et Lipschitz en x dans un
voisinage de (x
0
, 0). Ce problme possde au plus une solution.
Dmonstration. Soient deux solutions (exactes) x
1
et x
2
du problme (A.1).
Daprs le Thorme 32, on a
|x
1
(t) x
2
(t)| 0
do x
1
x
2
.
Thorme 34 (Existence dune solution au problme de Cauchy). Soit le
problme de Cauchy (A.1) o v(x, t) est continue et Lipschitz en x dans la
rgion R = [x x
0
[ b, [t[ a. Soit M la borne suprieure de |f| sur R.
Il existe une solution x(t) de (A.1) dnie sur lintervalle [t[ min(a,
b
M
)
h.
212 ANNEXE A. SUR LE THORME DE CAUCHY-LIPCHITZ
Dmonstration. Considrons une suite dcroissante positive (
n
)
nN
conver-
geant vers 0. Daprs le Thorme 31, on peut construire une suite de fonc-
tions (x
n
)
nN
qui sont chacune solution approchante
n
prs de (A.1). On
a alors, pour [t[ h,
_
_
_
_
d
dt
x
n
v(x
n
(t), t)
_
_
_
_

n
, x
n
(0) = x
0
La drive
d
dt
x
n
est dnie partout sauf en un nombre ni de points t
(n)
i
,
i = 1, ..., m
n
. On va prouver trois proprits
1. la suite de fonctions (x
n
)
nN
converge uniformment sur [t[ h vers
une fonction continue x(t)
2. la suite
_
_
t
0
f(t, x
n
(t))dt
_
nN
converge uniformment vers
_
t
0
f(t, x(t))dt
3. la fonction x(t) est continment direntiable et vrie x(0) = x
0
et
d
dt
x(t) = v(x(t), t). Autrement dit x(t) est solution du problme de Cau-
chy.
preuve du point 1
Considrons n < p et appliquons lingalit du Thorme 32 aux deux so-
lutions approchantes x
n
(t) et x
p
(t). Il vient, en notant k la constante Lip-
schitz de v(x, t)
|x
n
(t) x
p
(t)|

n
+
p
k
(exp([t[) 1)
2
n
k
(exp([t[) 1)
donc la suite de fonctions continues (x
n
(t)) est uniformment de Cauchy, elle
converge vers une fonction limite continue
1
.
preuve du point 2
Considrons une rgion R

= [t[ h, |x x
0
| Mh. Lapplication v(x, t)
est continue dans R

. Donc, pout tout > 0, il existe > 0 tel que, pour


tout (t, x
1
), (t, x
2
) dans R

, tels que |x
1
x
2
| , on a
|v(x
1
, t) v(x
2
, t)|
Pour ce , il existe daprs le rsultat de convergence tabli au point 1, N N
tel que, pour tout n > N on a
|x
n
(t) x(t)|
1. Lensemble des fonctions continues bornes de [t[ h dans R
n
est un sous espace
clos des fonctions bornes et est donc complet.
213
pour tout [t[ h. Donc la suite (v(x
n
(t), t)) converge uniformment vers
v(x(t), t) et on a (uniformment en t)
lim
n
_
t
0
v(x
n
(t), t)dt =
_
t
0
v(x(t), t)dt
preuve du point 3
Reprenons lingalit
_
_
d
dt
x
n
(t) v(x
n
(t), t)
_
_

n
pour tout [t[ < h. En int-
grant, on obtient
_
_
_
_
_
t
1
0
(
d
dt
x
n
(t) v(x
n
(t), t))dt
_
_
_
_

n
[t
1
[
n
h
or x
n
(t) est continue, donc lintgration donne
_
_
_
_
x
n
(t
1
) x
0

_
t
1
0
v(x
n
(t), t)dt
_
_
_
_

n
h
Daprs le point 2, on a alors par passage la limite
x(t) = x
0
+
_
t
1
0
v(x
n
(t), t)dt
Lintgrand v(x(t), t) est continu, donc x(t) est continment direntiable et
sa drive vaut
d
dt
x(t) = v(x(t), t).
Annexe B
Autour des fonctions de
Lyapounov
Dune faon moins restrictive que dans la dnition ci-dessous, dnition
que nous nutiliserons que dans cette annexe, on appelle en gnral fonction
de Lyapounov toute fonction globalement dnie sur lespace dtat, valeurs
relles et dcroissante le long de toute trajectoire.
Dnition 21. Soit x un point dquilibre dun systme
d
dt
x = v(x) dni
dans un domaine R
n
, o v est Lipschitz. On appelle fonction de Lya-
pounov (centre en x) une fonction V : R qui vrie les trois proprits
suivantes
1. V est continue et possde des drives partielles continues
2. V ( x) = 0 et V (x) > 0 sur x
3.
d
dt
V (x) = V (x)v(x) 0 pour tout x (autrement dit V est d-
croissante le long des trajectoires).
Thorme 35 (Stabilit et stabilit asymptotique locale par une fonction de
Lyapounov). Avec les notations de la Dnition B, sil existe une fonction de
Lyapounov V (x) dans un voisinage centr en x alors x est un point dquilibre
stable. Si de plus,
d
dt
V < 0 pour tout x x, alors x est un point
dquilibre (localement) asymptotiquement stable.
Dmonstration. Reprenons la Dnition 1, et montrons tout dabord la sta-
bilit de x. On souhaite montrer que, pour tout > 0 tel que la boule centre
en x de rayon soit contenue dans , il existe > 0 tel que, pour toute
condition initiale |x
0
x| , on a
|x(t) x| , pour tout t 0
215
216 ANNEXE B. AUTOUR DES FONCTIONS DE LYAPOUNOV
Figure B.1 Liens entre fonction de Lyapounov et la norme Euclidienne.
La fonction de Lyapounov va nous fournir ces ingalits qui portent sur la
norme Euclidienne. Notons le minimum atteint par V (qui est continue) sur
la frontire (compacte) de la boule B

centre en x de rayon . Par hypothse,


= min
x x=
V (x) > 0. Considrons maintenant le sous-ensemble
E

2
x B

/V (x)

2

Ce sous-ensemble est strictement lintrieur de B

et est donc gal x/V (x)

2
. En eet, si ce ntait pas le cas, il existerait un x

la fois dans E

2
et
la frontire de B

. On aurait alors
V (x

)

2
et | x x

| = donc V (x

)
do la contradiction.
Dautre part, on note que V est continue et vrie V ( x) = 0. On peut
donc nalement construire une boule B

centre en x de rayon dans laquelle


on a V (x)

2
. Cette boule est donc incluse dans E

2
.
On vient dtablir (voir Figure B.1)
B

2
B

Lensemble E

2
est positivement invariant : pour toute condition initiale
x(0) = x
0
appartenant E

2
, on a x(t) E

2
pour tout t 0. En eet, on
dduit de
d
dt
V (x) 0 que V (x) V (x(0))

2
.
217
On peut alors conclure que pour toute condition initiale x(0) B

on a
x(0) E

2
, et donc par linvariance que vous venons dvoquer, x(t) E

2
pour tout t 0 et donc x(t) B

pour tout t 0. Do la conclusion


concernant la stabilit du point dquilibre x.
Considrons maintenant lhypothse supplmentaire
d
dt
V < 0 pour tout
x x. La fonction t V (x(t)) est dcroissante et borne infrieurement
par 0, donc elle converge. Notons
lim
t+
V (x(t)) = l
Par hypothse l 0, montrons par labsurde que l = 0. Si ce ntait pas le cas,
alors x(t) resterait en dehors, lorsque t +, de El
2
= x /V (x)
l
2
et
donc, par la continuit de V et lquation V ( x) = 0 dj voques, en dehors
dune certaine boule B
r
de rayon r vriant > r > 0 centre en x. On peut
alors calculer k = max
rx
d
dt
V (x) qui, par construction, vrie k < 0.
Enn,
V (x(t)) = V (x(0)) +
_
t
0
d
dt
V (x(t))dt V (x(0)) kt
Le second membre de la dernire ingalit converge vers ce qui est in-
compatible avec la proprit V (x) 0.
Nous venons de montrer que lim
t+
V (x(t)) = 0. Il nous faut mainte-
nant conclure sur x lui-mme. Considrons > 0, et, comme prcdemment,
lensemble E

2
B

. Puisque lim
t+
V (x(t)) = 0, alors il existe un temps
T > 0 tel que x(t) E

2
pour tout t T. On en dduit que pour tout
> 0, il existe un temps T > 0 tel que x(t) B

. Le point x est donc


asymptotiquement stable.
Au cours de la preuve du thorme prcdent, nous avons t capables
de construire un sous-ensemble de conditions initiales (not E

2
) fournissant
des trajectoires convergeant asymptotiquement vers le point dquilibre x.
Ce sous-ensemble fait donc partie dun ensemble appel bassin dattraction
du point x. Ce dernier est dni comme lensemble des conditions initiales
fournissant une trajectoire convergeant vers x. Caractriser prcisment cet
ensemble est dicile, et nous en avons pour linstant simplement trouv une
partie. Une question intressante est de savoir sous quelle hypothse le bassin
dattraction est lespace R
n
tout entier, c.--d. sous quelle hypothse x est
globalement asymptotiquement stable.
De manire prliminaire, considrons lexemple dun systme de dimen-
sion 2, avec
V (x) =
x
2
1
1 + x
2
1
+ x
2
2
218 ANNEXE B. AUTOUR DES FONCTIONS DE LYAPOUNOV
On peut vrier que min
x=
V (x) 1, pour tout > 0. Ainsi, la construc-
tion prcdente est limite des ensembles E

2
x/V (x) 1/2 qui ne
couvrent pas lensemble du plan. On peut, en fait, garantir la possibilit
dune construction de E

2
aussi vaste que dsir si la fonction V est non
borne radialement, c.--d. si
lim
x x
V (x) = +
On obtient alors le thorme suivant, qui sera trs utile en pratique
Thorme 36 (Stabilit asymptotique globale par une fonction de Lyapou-
nov). Sil existe une fonction de Lyapounov V (x) dnie sur R
n
non borne
radialement telle que
d
dt
V < 0 pour tout x ,= x, alors x est un point dqui-
libre globalement asymptotiquement stable.
Dmonstration. Dnissons [0, +[ a r(a) = sup
{x / V (x)a}
|x|. Cette
fonction est bien dnie car V est non borne radialement. Le long dune
trajectoire ayant x(0) pour condition initiale, on a par hypothse
d
dt
V 0,
et donc V (x(t)) V (x(0)) pour tout t 0. Donc, pour tout t 0, |x(t)|
sup
{x / V (x)V (x(0))}
|x| = r(V (x(0)). De cette ingalit on dduit que pour
toute condition initiale x(0), on peut, en chantillonnant la trajectoire qui
en est issue, construire la suite (x(i))
iN
et que, pour tout t i on a
|x(t)| r(V (x(i))) (B.1)
De la mme manire que dans le Thorme 35, on a lim
t+
V (x(t)) = 0.
Dautre part, on va montrer que lim
a0
r(a) = 0. La fonction t r(1/t)
est dcroissante et minore donc elle converge lorsque t +. Notons
la limite lim
a0
r(a) = l 0. Supposons que cette limite est non nulle.
Alors, pour toute suite (a
n
)
nN
convergeant vers zro, il existe une suite
(x
n
)
nN
telle que |x
n
| l/2 et V (x
n
) a
n
. On dduit que, pour cette suite,
lim
n+
V (x
n
) = 0 avec |x
n
| l/2 ce qui est impossible car V est non nulle
en dehors de x. On a donc lim
a0
r(a) = 0.
On dduit donc de la suite dingalits (B.1) que lim
t+
x(t) = 0.
Bien souvent, on trouvera que la condition de stricte ngativit de la
drive
d
dt
V en dehors du point dquilibre x est trop contraignante. En eet,
on pourra souvent trouver une fonction de Lyapounov (ce qui est dj dicile)
telle que lensemble des points x o sa drive est nulle nest pas rduite un
point. Notons Z = x/
d
dt
V (x) = 0. Dans ce cas, le thorme suivant permet
de dterminer lensemble vers lequel le systme converge. Il utilise la notion
densemble positivement invariant (dj rencontre plus haut dans la preuve
du Thorme 35 mais que nous formalisons ici).
219
Dnition 22 (Ensemble positivement invariant). On dit que I est un
sous-ensemble positivement invariant de
d
dt
x = v(x), si quel que soit x
0
I
condition initiale du problme de Cauchy
d
dt
x = v(x), x(0) = x
0
, tous les
points de la trajectoire [0, +[ t x(t) appartiennent I.
Thorme 37 (Invariance de LaSalle (version locale)). Soit V fonction de
Lyapounov pour le systme
d
dt
x = v(x). Soient s > 0 et E
s
le sous-ensemble
x / V (x) s. On suppose que E
s
est borne et que
d
dt
V (x) 0 lintrieur
de E
s
. Notons Z lensemble des points de E
s
pour lesquels
d
dt
V (x) = 0. Toute
trajectoire issue dune condition initiale dans E
s
converge lorsque t +
vers le plus grand sous-ensemble positivement invariant contenu dans Z.
Exemple 29. Considrons loscillateur non linaire suivant
d
2
dt
2
x + k
d
dt
x + g(x) = 0
o k est un paramtre strictement positif et g est telle que xg(x) > 0 pour
x ,= 0. On peut rcrire ce systme sous forme dtat
d
dt
x = y
d
dt
y = ky g(x)
Une fonction candidate tre de Lyapounov est
V (x, y) =
_
x
0
g()d +
y
2
2
Cette fonction est continue et possde des drives partielles continues. V
possde un unique minimum en (x, y) = (0, 0). Calculons maintenant
d
dt
V (x, y) = g(x)
d
dt
x + y
d
dt
y = ky
2
0
On peut en dduire la stabilit de lorigine par le Thorme 35. Pour dduire
la stabilit asymptotique, il nous faut utiliser le Thorme 37.
Le cas particulier g(x) =
g
R
sin x, correspond un pendule de longueur R
soumis la gravit, tel que reprsent sur la Figure B.2.
220 ANNEXE B. AUTOUR DES FONCTIONS DE LYAPOUNOV
Figure B.2 Pendule amorti.
Annexe C
Moyennisation
C.1 Introduction
On suppose ici que les eets rapides ont un caractre oscillant. La m-
thode de moyennisation a t utilise en mcanique cleste depuis longtemps
pour dterminer lvolution des orbites plantaires sous linuence des per-
turbations mutuelles entre les plantes et tudier la stabilit du systme
solaire. Gauss en donne la dnition suivante qui est des plus intuitives : il
convient de rpartir la masse de chaque plante le long de son orbite propor-
tionnellement au temps pass dans chaque partie de lorbite et de remplacer
lattraction des plantes par celle des anneaux de matire ainsi dnis.
Dans ce cadre, les quations non perturbes du mouvement de la terre
sont celles qui ne prennent en compte que la force dattraction due au soleil.
Lorbite de la terre est alors une ellipse dont le soleil est lun des foyers. Les
quations perturbes sont celles o lon rajoute les forces dattraction entre
la terre et les autres plantes en supposant que ces dernires dcrivent toutes
des orbites elliptiques selon les lois de Kepler. Le paramtre correspond au
rapport de la masse du soleil celles des plantes : 1/1000. Lchelle
de temps rapide est de lordre dune priode de rvolution, quelques annes.
Lchelle de temps lente est de lordre de quelques millnaires. La question
est alors de savoir si ces petites perturbations dordre peuvent entraner
terme, i.e. lchelle du millnaire, une drive systmatique des longueurs
du grand axe et du petit axe de la trajectoire de la terre, ce qui aurait des
consquences catastrophiques pour le climat. En fait, les calculs (moyenni-
sation) montrent quil nen est rien. En revanche, lexcentricit des orbites
oscille lentement. Ces oscillations inuencent le climat.
221
222 ANNEXE C. MOYENNISATION
C.2 Le rsultat de base
Considrons le systme
_
_
_
dx
dt
= f(x, z, )
dz
dt
= g(x, z, )
On passe de cette forme la forme (

) choisie pour noncer le thorme


de Tikhonov (Thorme 15) par un simple changement dchelle de temps.
On remplace t par t/. Lchelle de temps rapide correspond maintenant t
dordre 1 et lchelle de temps lente t de lordre de 1/.
Le rgime oscillatoire le plus simple pour y est le rgime priodique, de
priode T :
y =
_
y
1
y
2
_
,
_
_
_
dy
1
dt
= y
2
= g
1
(x, y, )
dy
2
dt
=
_
2
T

2
y
1
= g
2
(x, y, ),
Sans changer de notation, on pose f(x, y(t), ) = f(x, t, ) : f est rgulire
en x et dpend de t de faon priodique (priode T). Le systme perturb
scrit alors
dx
dt
= f(x, t, ), 0 1 (C.1)
Le systme moyenn (ou systme lent) est alors
dz
dt
=
1
T
_
T
0
f(z, t, 0) dt
df
= f(z)
(C.2)
Remplacer les trajectoires du systme instationnaire (C.1) par celles du sys-
tme stationnaire (C.2), revient alors lisser les trajectoires de (C.1). Comme
pour le thorme 16, si le systme moyen admet un point dquilibre hyper-
boliquement stable (les valeurs propres du tangent sont toutes partie relle
strictement ngative) alors le systme perturb oscille lgrement autour de
cet quilibre moyen.
De faon plus rigoureuse, thorme suivant montre qu un point dqui-
libre hyperbolique du systme moyen correspond une petite orbite priodique
du systme perturb (C.1) (dmonstration dans [30]).
Thorme 38 (Moyennisation une frquence). Considrons le systme
perturb (C.1) avec f rgulire. Il existe un changement de variables, x =
z + w(z, t) avec w de priode T en t, tel que (C.1) devienne
dz
dt
= f(z) +
2
f
1
(z, t, )
avec f dnie par (C.2) et f
1
rgulire de priode T en t. De plus,
C.2. LE RSULTAT DE BASE 223
(i) si x(t) et z(t) sont respectivement solutions de (C.1) et (C.2) avec comme
conditions initiales x
0
et z
0
telles que |x
0
z
0
| = O(), alors |x(t)
z(t)| = O() sur un intervalle de temps de lordre de 1/.
(ii) Si z est un point xe hyperbolique stable du systme moyenn (C.2), alors
il existe > 0 tel que, pour tout ]0, ], le systme perturb (C.1) ad-
met une unique orbite priodique

(t), proche de z (

(t) = z + O())
et asymptotiquement stable (les trajectoires dmarrant prs de

(t)
ont tendance senrouler autour de cette dernire). Lapproximation,
O() prs, des trajectoires du systme perturb (C.1) par celles du
systme moyenn (C.2) devient valable pour t [0, +[.
Il est instructif de voir comment est construit le changement de coordon-
nes x = z + w(z, t) en enlevant x des termes oscillants dordre (w de
priode T en t). On a, dune part,
dx
dt
=
dz
dt
+
w
z
(z, t)
dz
dt
+
w
t
(z, t)
et, dautre part,
dx
dt
= f(z + w(z, t), t, )
Ainsi
dz
dt
=
_
I +
w
z
(z, t)
_
1
_
f(z + w(z, t), t, )
w
t
(z, t)

=
_
f(z, t, 0)
w
t
(z, t)

+ O(
2
)
Comme la dpendance en t de w est T-priodique, il nest pas possible dan-
nuler compltement le terme dordre 1 en car il ny a aucune raison pour
que la fonction dnie par
_
t
0
f(z, s, 0) ds
soit T-priodique en temps. En revanche, on peut liminer la dpendance en
temps du terme dordre 1 en . Il sut de poser
w(z, t) =
_
t
0
_
f(z, s, 0) f(z)
_
ds
(noter que w est bien de T-priodique) pour obtenir
dz
dt
= f(z) + O(
2
)
Si cette approximation nest pas susante, il faut prendre en compte les
termes dordre 2 et liminer leur dpendance en temps par un changement
de variable du type x = z +w
1
(z, t) +
2
w
2
(z, t) avec w
1
et w
2
T-priodique.
224 ANNEXE C. MOYENNISATION
C.3 Un exemple classique
Soit lquation du second ordre suivante :
d
2

dt
2
= + (1
2
)
d
dt
.
Cest lquation dun pendule pour lequel on a rajout un petit frottement
positif pour les grandes amplitudes ( > 1) et ngatif pour les petites ( < 1).
Mettons dabord ce systme sous la forme standard
dx
dt
= f(x, t, )
Le terme oscillant vient du systme non perturb
d
2

dt
2
=
dont les orbites sont des cercles. Les phnomnes lents (chelle de temps 1/)
sont clairement relatifs aux rayons de ces cercles (i.e. les amplitudes des
oscillations). Cest pourquoi il convient de passer en coordonnes polaires
en posant = r cos() et
d
dt
= r sin(). Dans ces coordonnes, le systme
perturb scrit
_
_
_
dr
dt
= [1 r
2
cos
2
()] sin
2
()
d
dt
= 1 + sin() cos()[1 r
2
cos
2
()]
est quasiment gal, une constante prs, au temps t. On peut crire
dr
d
=
dr
dt
dt
d
.
Ainsi, on se ramne la forme standard en prenant comme variable de
temps
dr
d
=
[1 r
2
cos
2
()] sin
2
()
1 + sin() cos()[1 r
2
cos
2
()]
= f(r, , )
Le systme moyenn est alors
du
d
=

8
u(4 u
2
)
u = 2 est un point dquilibre hyperbolique attracteur pour , i.e. t
+. Donc pour susamment petit, lquation perturbe possde un cycle
C.4. RECHERCHE DEXTREMUM (EXTREMUM SEEKING) 225
limite hyperbolique attracteur donc lquation est approximativement
2
+
d
dt

2
= 4 + O().
Linconvnient principal de la thorie des perturbations est quil faut, ds
le dpart, avoir une ide assez prcise de ce que lon cherche : il convient de
trouver un petit paramtre et disoler la partie rapide du systme. ce
niveau lintuition physique joue un rle important.
C.4 Recherche dextremum (extremum seeking)
Figure C.1 Boucle "extremum seeking" ; pour le systme statique y =
f(u) o f nest pas connue mais uniquement suppose KC
2
, u converge vers
un minimum local de f lorsque la pulsation est choisie assez grande et
lamplitude a assez petite ((k, h) sont deux autres paramtres > 0).
Pour conduire une optimisation en temps-rel, en ligne et sans modle,
les ingnieurs ont souvent recours une boucle de feedback dcrite sur la
gure C.1. Ce type de boucle est aussi couramment utilis en spectroscopie
pour ajuster, par exemple, la frquence u dun laser sur une frquence ato-
mique en cherchant le maximum dun signal de uorescence y = f(u), la
fonction f ayant la forme dune Lorentzienne dont on cherche le maximum :
f(u) =
p
1
(u u)
2
+p
2
+p
3
avec p
1
, p
2
, p
3
> 0 paramtres inconus et u, largument
du maximum de f, tant aussi inconnu.
Les quations associes au schma bloc de la gure C.1 sont
d
dt
v = k sin(t)(f(v + a sin(t)) ),
d
dt
= h(f(v + a sin(t)) ).
Supposons que f admette un minimum local en u = u, avec lapproximation
f(u)

f +

f

2
(u u)
2
o

f = f( u) et

f

= f

( u) > 0. Pour v autour de u


226 ANNEXE C. MOYENNISATION
on a le systme approch (a assez petit) :
d
dt
v = k sin(t)
_

f +

2
(v + a sin(t) u)
2

_
d
dt
= h
_

f +

2
(v + a sin(t) u)
2

_
Alors si les gains (k, a, h, ) sont tels que
ak

f

, h
on peut utiliser lapproximation sculaire et prendre la moyenne sur une
priode en temps. Le systme moyen est alors simplement
d
dt
v =
ak

f

2
( u v),
d
dt
= h
_

f +

2
_
( u v)
2
+
a
2
_

_
.
Ce systme triangulaire converge alors vers lquilibre hyperbolique v = u et
=
a

f

4
.. Comme u = v + a sin(t) on voit que u converge en moyenne vers
u.
C.5 Boucle verrouillage de phase PLL
On dispose dun signal dentre v(t) bruit dont on souhaite estimer en
temps rel la frquence : cette dernire se situe autour dune frquence de
rfrence note
0
> 0. Ainsi on a v(t) = a(t) cos((t)) + w(t) avec [

0
[
0
, a(t) > 0 avec [ a[
0
a et w(t) un bruit. Lcart type de w
peut tre bien plus grand que lamplitude a : le rapport signal sur bruit
peut tre trs dfavorable. Pour ce faire, on dispose de circuits lectroniques
analogiques ou de systmes digitaux, dits de type PLL
1
, qui donnent en
temps-rel une estimation non bruite de la frquence dentre
d
dt
: ce type de
circuits spcialiss se retrouve dans quasiment tous les systmes lectroniques
de tl-communication (tlphone portable, carte WiFi, bre optique, laser,
horloges atomiques, GPS,....). Les PLL sont aussi utiliss par les physiciens
pour mesurer trs prcisment les constantes fondamentales
2
. Le principe
de fonctionnement des PLL sanalyse trs bien avec la moyennisation une
frquence.
La gure C.2 donne un schma bloc simpli et de principe : chaque bloc
correspond soit un circuit spcique dans le cas dune PLL analogique, soit
une tape de lalgorithme pour une PLL digitale. La dynamique est rgie
1. PLL pour Phase-Locked Loop.
2. A.L. Schawlow (physicien, prix Nobel 1981 pour ses travaux sur la spectroscopie
laser) disait que pour avoir une mesure trs prcise, il faut mesurer une frquence.
C.5. BOUCLE VERROUILLAGE DE PHASE PLL 227
Figure C.2 Le schma bloc dune PLL : la quantit
0
(1 kx) est une
estimation ltre de la frquence
d
dt
du signal dentre v qui peut tre trs
fortement bruit et dont lamplitude a nest pas connue.
par
d
dt
x = k
f

0
(v(t) sin x),
d
dt
=
0
(1 kx)
o est un petit paramtre positif, k
f
et k deux gains positifs. On pose
v(t) = a cos avec
d
dt
=
0
(1 + p) o a > 0 et p sont des paramtres
inconnus mais constants. Comme 2 cos sin = sin( ) + sin( +), avec
= et = + , le systme
d
dt
x = k
f

0
(a cos sin x),
d
dt
=
0
(1 kx),
d
dt
=
0
(1 + p)
devient dans lchelle de temps (
d
dt
=
0
(2 + (p kx)))
d
d
x = k
f
a
2
sin +
a
2
sin x
2 + (p kx)
,
d
d
=
p + kx
2 + (p kx)
.
Ainsi, on est sous la forme standard du thorme 38 avec la place de t.
Le systme moyen est
d
d
x = k
f
a
2
sin x
2 + (p kx)
,
d
d
=
p + kx
2 + (p kx)
.
On nglige des termes dordre 2 en et on prend comme systme moyen :
d
d
x =
k
f
2
_
a
2
sin x
_
,
d
d
=

2
(p + kx).
Ce systme scrit aussi sous la forme dune seule quation du second ordre
avec / =
_
k
f
ka/8
d
2
d
2
=
_
2k
f
ka
d
d

_
sin
2p
ak
_
.
228 ANNEXE C. MOYENNISATION
On choisit le gain k assez grand pour que

2p
ak

< 1. Ainsi on pose sin



=
2p
ak
avec

]

2
,

2
[. Ce systme admet donc deux points dquilibre (angle
dni 2 prs) :
=

est un col (deux valeurs propres relles de signes opposs)
=

est localement asymptotiquement stable (deux valeurs propres
partie relle strictement ngative).
On reprend en partie les arguments utiliss pour le PI avec anti-emballement
(systmes autonomes dans la plan, section 1.3.5). Ici, il faut faire un peu
attention car lespace des phases est un cylindre et non un plan. Une tude
complte est faite au chapitre 7 de [6]. Nous en rsumons ici les grandes
lignes :
Le calcul de la divergence du champ de vecteur dans les coordonnes
(, =
d
d
) donne
_
2k
f
ka
< 0. Les trajectoires sont bornes dans le
cylindre (la vitesse est borne).
Ainsi, il ne peut y avoir au plus quune seule orbite priodique et de
plus elle fait un tour autour du cylindre.
Pour k et k
f
assez grands, on a deux points dquilibre et on na pas
dorbite priodique (bifurcation globale fonde sur lespace rentrant du
col

).
Pour k et k
f
assez grands = converge donc vers une constante.
Cest le verrouillage de phase : la dirence entre la phase de la PLL et
la phase du signal dentre analyser converge vers une valeur constante
dnie 2 prs : = + cte.
Ainsi
d
dt
converge vers
d
dt
, comme
d
dt
=
0
(1 kx), on voit que lon
a une estimation peu bruite de la frquence dentre
d
dt
avec
0
(1 kx).
Pour cela, nous navons pas eu besoin de connatre prcisment lamplitude a.
Noter que la mme PLL donne, lorsque la frquence reste xe, les modulations
de phase.
Annexe D
Automatique en temps discret
La reprsentation des systmes dynamiques sous forme discrte est sou-
vent ncessaire lorsquon doit raliser de manire pratique le contrle avec
un systme numrique dacquisition, de traitement des donnes et des algo-
rithmes ainsi que leur application. Alors que jusque dans les annes 1960,
les contrleurs utilisaient seulement des composants analogiques, avec des
circuits lectriques assurant les tches de mesure, de calcul et de transmis-
sion des ordres vers les actionneurs, aujourdhui la majorit des systmes de
contrle utilisent des convertisseurs analogiques-numriques, des micropro-
cesseurs, et des convertisseurs numriques-analogiques.
Dans un tel schma, les algorithmes de contrle sont excuts en temps
discret, avec une priodicit (constante) correspondant une frquence choi-
sie en fonction de la ractivit naturelle du systme contrler. On peut
considrer quen aronautique, les boucles de guidage-pilotage sont xcu-
tes tous les quelques (10) millisecondes, alors que dans le gnie des procds
de la chimie lourde, les priodes sont plutt de lordre de la minute.
Ainsi, dans la chane daction entourant le systme physique, on a des
signaux numriss utilisables par des microprocesseurs fonctionnant suivant
des cycles dhorloge cadencs une frquence dchantillonage 1/T
e
> 0.
En outre, on doit souvent considrer plusieurs horloges, dont les frquences
nont pas ncessairement de multiple commun. Nous laissons volontairement
de ct ces problmes diciles dits de multi-chantillonnage (multirate [3]),
mme sils ont une importance pratique certaine.
Dans la suite de ce chapitre, les mesures de signal sont supposes tre
eectues des instants nT
e
o n N. Elles vont tre utilises par le contr-
leur prenant la forme dun algorithme excut chaque pas de temps 0, T
e
,
2T
e
, ... suppos aboutir un rsultat de calcul en un temps infrieur
1
T
e
.
1. la question des problmes engendrs par des temps de calculs excdant T
e
est discute
229
230 ANNEXE D. AUTOMATIQUE EN TEMPS DISCRET
contrleur CNA
CAN
actionneur Systme capteur
Figure D.1 Schma dimplmentation numrique dun algorithme de
contrle.
Le rsultat de cet algorithme est ensuite utilis pour actionner un organe de
commande (comme un moteur, une gouverne, etc...).
La description prcdente correspond la Figure D.1. Dans ce schma,
reprsentant une utilisation dun algorithme de contrle en temps discret
la frquence 1/T
e
, deux lments nont pas encore t dcrits.
Le premier bloc est le CNA (convertisseur numrique-analogique), il sagit
dun sous-systme prenant en entre des grandeurs discrtes et les transfor-
mant en signal continu. Cette conversion peut se faire suivant la mthode du
bloqueur dordre zro
y
b
(t) = y(nTe) = y[n], nT
e
t < (n + 1)T
e
o y
b
est le signal de sortie en temps continu, y est le signal discret dentre
et n est la partie entire de t/T
e
. On peut utiliser dautres types de bloqueur
pour rendre le signal y
b
continu, direntiable, ou plus rgulier encore. Ainsi
le bloqueur dordre 1 est
y
b
(t) = y[n] +
t nT
e
T
e
(y[n] y[n 1]), nT
e
t < (n + 1)T
e
Le second bloc est le CAN (convertisseur analogique-numrique). Il sagit
dun systme ayant en entre un signal en temps continu (comme y
b
prc-
demment) et en sortie un signal en temps discret (comme y prcdemment).
Un autre problme important est que la reprsentation du signal y est faite
en utilisant un nombre ni de bits composant la reprsentation numrique
binaire du signal chantillonn. On pourra se reporter [35] pour une pr-
sentation des direntes technologies de conversion binaire. Laissant volon-
tairement de ct les problmes de reprsentation binaire de grandeurs
valeur relle, il reste se soucier des problmes lis lchantillonnage une
frquence 1/T
e
.
dans le cadre dalgorithmes numriquement intensifs comme la Model Predictive Control,
MPC [56]
231
Le thorme de Shannon prcise les liens entre un signal en temps continu
et sa reprsentation chantillonne.
Thorme 39 (Thorme de Shannon). Si le signal en temps continu y(t),
t R ne contient pas de frquence suprieure B Hertz, alors il peut tre
reconstruit de manire exacte partir dchantillons rgulirement espacs de
1/(2B) secondes (ou moins).
Ce thorme fondamental en thorie de linformation, voir [72], doit tre
compris en dtails pour en saisir la port, et les limitations. Le signal y(t) est
suppos tre dni pour tout t R, et les chantillons y[n] sont supposs tre
connus pour tout n Z. Lhypothse principale est que y(t) est un signal
contenu frquentiel born, c.--d. que sa transforme de Fourier
2
F(t y(t), N) =
_
+

y(t) exp(2iNt)dt
est support born inclus dans ] B, B[ (c.--d. quelle est nulle en dehors
de cet intervalle).
Lnonc ne sapplique pas des signaux en temps continu dni seule-
ment sur un intervalle de temps born, car ces signaux ne sont en gnral
pas contenu frquentiel support born
3
. Lhypothse de contenu frquen-
tiel nul en dehors du domaine ] B, B[ peut en pratique tre relche, au
prix dune reconstruction inexacte due au phnomne de repliement spectral
(aussi appel aliasing) expos ci-dessous.
Le phnomne daliasing peut-tre mis en vidence trs simplement sur un
signal sinusoidal de frquence suprieure 1/(2T
e
). Considrons la gure D.2
Si le signal chantillonner est pralablement ltr par un ltre anti-
aliasing ayant pour fonction dattnuer compltement toute frquence sup-
rieure 1/(2T
e
) (c.--d. davoir un gain nul toutes les frquences au dessus
de 1/(2T
e
)), ce signal ltr peut tre en thorie parfaitement reconstruit. Des
ltres de dimension nie peuvent approcher ce ltre anti-aliasing idal. On
peut ainsi utiliser les ltres de Butterworth, ou de Bessel rgls la bonne
frquence [35].
La formule de reconstruction est la formule de Shannon-Whittaker
y(t) =
+

n=
y[n]sinc
(t nT
e
)
T
e
2. on notera la notation trs proche de celle du cours [52] avec la correspondance
F(t y(t), N) = (Ty)(2N).
3. Si y est support compact, alors sa transforme de Fourier est une fonction analy-
tique, et donc ne peut pas tre support compact car sinon elle est nulle, voir [26][31.5.4]
232 ANNEXE D. AUTOMATIQUE EN TEMPS DISCRET
0 2 4 6 8 10 12 14 16 18 20
0
2
4
6
8
10
12
14
16
Figure D.2 Apparition du phnomne de repliement spectral lors de
lchantillonage dun signal sinusoidal. Des basses frquences apparaissent
lorsque la frquence dchantillonage choisie viole lhypothse du Tho-
rme 39 de Shannon (courbes du bas).
o sinc est la fonction sinus-cardinal sinc(t) =
sin(t)
t
. Cette formule de re-
construction est quivalente au ltrage dun signal constitu dimpulsions
de Dirac pondres par les chantillons y[n] avec un ltre passe bas idal
(ayant une fonction de transfert rectangle dans le domaine frquentiel) la
frquence 1/(2T
e
).
La formule de reconstruction prcdente est convergente sous la condi-
tion susante que la suite (y[n])
nZ
appartient lespace
p
(Z, R)) c.--d.

nZ
(y[n])
p
< , avec 1 < p < . Elle est aussi convergente si la suite est
constante.
Pour dmontrer le thorme de Shannon, on utilise un rsultat interm-
diaire utilisant le lemme suivant (formule de Poisson).
Lemme 5 (Formule de Poisson). Soit y une fonction valeur relle (ou
dans C) de classe (
2
telle que f,

f,

f sont sommables et dcroissance
[y(x)[
K
1+x
2
, K > 0. On note F(t y(t), N) sa transforme de Fourier.
Alors, on a la formule de sommation de Poisson
+

n=
y[n] =
+

k=
F(t y(t), k)
Ce rsultat est dmontr dans [68], voir aussi [52] pour un nonc dans
233
lespace de Schwartz, et [26] pour un nonc concernant les fonctions de classe
L
1
(R).
On utilise ce lemme pour donner une expression simple la fonction
suivante, nomme sommation priodique de la transforme de Fourier de la
fonction y
(N) =
+

k=
F(t y(t), N k/T
e
) (D.1)
En utilisant les proprits usuelles de la transforme de Fourier (modulation
et translation en frquence, voir [52]), on obtient
F(t y(t), N k/T
e
) = T
e
F(t exp(2tNT
e
)y(tT
e
), k)
En utilisant la formule de Poisson du lemme 5, il vient
(N) =T
e
+

n=
exp(2nNT
e
)y(nT
e
)
=T
e
+

n=
y[n] exp(2nNT
e
) (D.2)
Lorsque F(t y(t), N) est nulle en dehors de ]
1
2T
e
,
1
2T
e
[, alors, sous
lhypothse que B <
1
2T
e
, la formule (D.1) sinterprte comme une somme
(innie) de fonctions supports disjoints. On peut isoler chaque terme de la
somme en procdant ainsi
F(t y(t), N) = (N)
_
1 si [N[ < B
0 sinon
= (N) rect(
N
B
)
o rect est la fonction nulle partout sauf sur [1, 1] o elle vaut 1. En
utilisant (D.2), on a alors
F(t y(t), N) = T
e
+

n=
exp(2nNT
e
)y[n]rect(N/B)
or
exp(2nNT
e
)rect(N/B) = F(t
1
T
e
sinc(
t nT
e
T
e
), N)
comme cela est aisment montr par le calcul.
234 ANNEXE D. AUTOMATIQUE EN TEMPS DISCRET
Ainsi, on a
F(t y(t), N) = F(t
+

n=
sinc
_
t nT
e
T
e
_
y[n], N)
do lidentication
y(t) =
+

n=
sinc
_
t nT
e
T
e
_
y[n]
Ce rsultat ne peut plus tre tabli lorsquon a recouvrement des spectres
dans la sommation de Poisson. Des termes additionnels viennent sajouter
au signal y(t), ce phnomne est dsign aliasing [72].
En pratique, les principaux problmes lis lchantillonnage sont lis
la violation des hypothses du thorme de Shannon. Pour limiter leet
daliasing, il est ncessaire de ltrer les signaux avant leur chantillonnage.
Nanmoins, mme si le signal considr y(t) satisfait lhypothse, il advient
souvent que le signal eectivement accessible la mesure, c.--d. la conver-
sion CAN, viole cette hypothse. En eet, les bruits sont souvent spectre
haute frquence et viennent donc se replier en signaux basse-frquence par
le phnomne daliasing dcrit prcdemment. Ce phnomne renforce la n-
cessit de ltrer avec lchantillonnage.
D.1 Reprsentation externe et interne
Dans le domaine discret, les quations de rcurrence (appeles galement
quations aux dirences) remplacent les quations direntielles.
Comme dans le cas du temps continu, les relations entre les entres et les
sorties peuvent tre obtenues soient par une identication entre-sortie, on
parle alors de reprsentation externe, soit en modlisant avec des tats les
quations du fonctionnement du systme, cest la reprsentation interne.
Le passage de la reprsentation interne externe est direct, travers le
calcul algbrique de la transforme en z. Ainsi, au systme 1 seule entre,
et une seule sortie dni par les quations matricielles de rcurrence
x[k + 1] = A
d
x[k] + B
d
u[k] (D.3)
y[k] = Cx[k] + Du[k] (D.4)
o A
d
et B
d
sont, respectivement, une matrice n n, n > 0 et un vecteur
n 1, il correspond la fonction de transfert discrte
H(z) = C(zI A
d
)
1
B
d
+ D
D.1. REPRSENTATION EXTERNE ET INTERNE 235
On peut gnraliser ce calcul aux systmes plusieurs entres et plusieurs
sorties. Dans ce cas, H(z) est une matrice de fonctions de transfert discrtes.
Cette fonction de transfert est calcule partir de la transforme en z
des quations de la description interne (D.3) (D.4). Cette transforme est
prsente dans ce qui suit.
Les matrices A
d
, B
d
peuvent avoir un lien avec des quations diren-
tielles

X = AX + BU, Y = CX + DU quon aura discrtises la priode
dchantillonnage T
e
. Ainsi une manire de les discrtiser de manire dite
exacte (au sens du bloqueur dordre 0) est dutiliser les matrices
A
d
= exp(AT
e
), B
d
=
_
T
e
0
exp(At)Bdt
Dans la suite, on simpliera la notation A
d
, B
d
pour nutiliser que A et B
dans un cadre discret.
D.1.1 Transforme en z
Considrons un signal en temps continu y(t), pour lequel on sintresse
aux valeurs y(nT
e
) = y[n] aux instants dchantillonnage nT
e
, n N. On
appelle transforme en z du signal y la fonction
Z(t y(t), z) =
+

n=0
y(nT
e
)z
n
=
+

n=0
y[n]z
n
(D.5)
La dernire criture sera prfre dans la suite. Cette fonction de la variable z
dpend de la priode dchantillonnage T
e
. La transformation en z dun signal
nest pas une bijection (mme si on na pas encore prcis despace darrive
et despace de dpart) : tant donne un signal y, il existe une unique trans-
forme en z correspondante, mais une innit de signaux continus y ont pour
image une transforme en z donne. En eet, seules les valeurs aux instants
dchantillonnage dterminent le signal continu antcdent dune transforme
en z donne.
Une transforme en z dnie par (D.5) est une srie. Nous laissons de
ct les problmes de convergence, comme nous lavons dj fait pour la
transforme de Laplace, le lecteur intress pourra se reporter [20][Chap.
XVI]. Dans le domaine des signaux chantillonns, les proprits de la trans-
forme en z en font lquivalent de la transforme de Laplace pour les si-
gnaux en temps continu. Ses proprits principales sont : la linarit (D.6),
la translation par un rel (pour les systmes retard (D.8) ou avance (??)),
236 ANNEXE D. AUTOMATIQUE EN TEMPS DISCRET
lhomothtie exponentielle (D.9), la drivation (D.10) et la convolution
Z(a
1
y
1
(.) + a
2
y
2
(.), z) = a
1
Z(y
1
(.), z) + a
2
Z(y
2
(.), z) (D.6)
Z(t y(t nT
e
), z) = z
n
Z(t y(t), z), n N (D.7)
Z(t y(t + nT
e
), z) = z
n
_
Z(t y(t), z)
n1

i=0
y[i]z
i
_
, n N (D.8)
Z(t exp(at)y(t), z) = Z(t y(t), exp(aT
e
)z) (D.9)
Z(t ty(t), z) = T
e
zZ(t y(t), z) (D.10)
Enn, on notera que la transforme en z est une isomtrie car elle prserve
lnergie dun signal au sens de lgalit de Parseval
+

n=0
y
2
[n] =
1
2
_
C
z
1
Z(t y(t), z)Z(t y(t), z
1
)dz
o ( est un contour entourant lorigine dans le plan complexe.
D.1.2 Ralisation canonique dune fonction de transfert
discrte
Une ralisation de lquation aux dirences
y[k] + a
1
y[k 1] + ... + a
n
y[k n] = b
1
u[k 1] + ... + b
n
u[k n]
correspondant la fonction de transfert
4
G(z) =
b
1
z
1
+ ... + b
n
z
n
1 + a
1
z
1
+ ... + a
n
z
n
est
A
d
=
_
_
_
_
_
0 1 0
.
.
.
0 ... 0 1
a
n
a
n1
... a
1
_
_
_
_
_
,
_
_
_
_
_
0
.
.
.
0
1
_
_
_
_
_
C
d
= (b
n
, b
n1
, ..., b
2
, b
1
)
Dautres ralisations canoniques peuvent tre considres. De manire
gnrale, soit T une matrice (inversible) de changement de base, le triplet
TA
d
T
1
, TB
d
, C
d
T est une ralisation au mme ttre que A
d
, B
d
, C
d
.
4. dont certains coecients peuvent tre nuls sans perte de gnralit
D.2. ANALYSE DE LA STABILIT 237
D.2 Analyse de la stabilit
Considrons la fonction de transfert discrte
G(z) =
b
0
+ b
1
z
1
+ ... + b
n
z
n
1 + a
1
z
1
+ ... + a
n
z
n
=
N(z)
D(z)
En soumettant le signal des signaux dentre (y compris des conditions
initiales par exemple), on engendre des signaux de sortie qui peuvent se
calculer explicitement travers une dcomposition en lments simples de
la fraction rationnelle obtenue et identication de la transforme inverse de
chaque terme, pour obtenir une description complte de la sortie au cours du
temps (continu). Le comportement asymtotique de la solution, c.--d. lorsque
le temps tend vers linni, est dni comme suit.
Dnition 23. Un point dquilibre x de lquation aux dirences x[k+1] =
Ax[k] est asymptotiquement stable si, pour toute condition initiale x
0
, la
solution x[k] tend vers x lorsque k +. Le point est instable sil existe
une condition initiale telle que |x[k]| + lorsque k +. Il est stable
si x[k] reste born.
Il apparat la condition ncessaire et susante suivante.
Thorme 40 (Stabilit en temps discret [50]). Une condition ncessaire et
susante pour quun point dquilibre de lquation aux dirences x[k+1] =
Ax[k] soit asymptotiquement stable est que les valeurs propres de A soient
toutes lintrieur (strict) du cercle de rayon 1 ayant lorigine pour centre.
Si une valeur propre est en dehors de ce cercle, alors le systme est instable.
Comme dans le cas des systmes en temps continu, on dispose dun r-
sultat permettant de tester le fait que les racines dun polynme satisfont les
proprits requises pour les conditions ncessaires de stabilit asymptotique.
Thorme 41 (Critre de Jury,[16]). Soit un polynme P(z) = a
0
z
n
+
a
1
z
n1
+ ... + a
n
avec a
0
> 0. On forme le tableau
Ligne 1 a
0
a
1
... ... a
n
Ligne 2 a
n
a
n1
... ... a
0
Ligne 3
_
b
0
b
1
... b
n1
0
= Ligne 1
a
n
a
0
Ligne 2
Ligne 4 b
n1
b
n2
... b
0
0
Ligne 5
_
c
0
c
1
... c
n2
0 0
= Ligne 3
b
n1
b
0
Ligne 4
Ligne 6 ...
.
.
.
Ligne 2n+1 w
0
0 ... 0
238 ANNEXE D. AUTOMATIQUE EN TEMPS DISCRET
Une condition ncessaire et susante pour que les racines de P(z) soient
toutes (strictement) lintrieur du cercle de rayon 1 ayant lorigine comme
centre est que tous les lments de (a
0
, b
0
, ..., w
0
) soient strictement positifs.
D.3 Commandabilit en temps discret
Considrons maintenant lquation aux dirences o intervient la com-
mande
x[k + 1] = Ax[k] + Bu[k] (D.11)
o A est une matrice de dimension n n et B est une matrice de dimension
n m. Comme on va le voir, il faut distinguer, sauf dans le cas o A est
inversible, la notion de commandabilit (possibilit daller de nimporte quel
tat 0) de latteignabilit (possibilit daller de 0 nimporte quel tat).
Dnition 24 (Commandabilit en temps discret). Le systme en temps
discret(D.11) est dit commandable, si quel que soit ltat initial x
0
, il existe
une squence de commande u[0], u[1],..., u[n1] qui permet datteindre ltat
0.
Dnition 25 (Atteignabilit en temps discret). Le systme en temps dis-
cret(D.11) est dit atteignable, si quel que soit ltat nal dsir x
f
, il existe
une squence de commande u[0], u[1],..., u[n1] amenant le systme initialis
en 0 ltat x
f
.
Par un simple calcul, on tablit la relation gnrale entre un tat initial
x
0
, une squence de commande u[0], u[1], ..., u[n 1] et le point atteint x[k]
au bout de k itrations.
x[n] = A
n
x[0] + [B, AB, ..., A
n1
B] [u[n 1], ..., u[0]]
T
= A
n
x[0] +( [u[n 1], ..., u[0]]
T
(D.12)
o ( est la matrice de commandabilit de la paire (A, B) dj rencontre la
Proposition 6. En prenant comme inconnue la squence de commande dans
la dernire quation, on tablit directement le rsultat suivant (voir [38]).
Proposition 10 (Atteignabilit et commande en boucle ouverte atteignant
un point arbitraire en temps ni). Soit un systme discret x[k +1] = Ax[k] +
Bu[k] avec dimx = n. Ce systme est atteignable si et seulement si la matrice
( = [B, AB, ..., A
n1
B] est de rang plein. Soit x
f
un point arbitraire quon
souhaite atteindre. La commande en boucle ouverte
[u[n 1], ..., u[0]]
T
= (
1
(x
f
A
n
x[0])
permet de faire transiter en exactement n itrations le systme de x[0] x
f
.
D.3. COMMANDABILIT EN TEMPS DISCRET 239
Si on souhaite que le systme atteigne ltat 0, la condition que la matrice
de commandabilit ( est de rang plein est une condition susante mais pas
ncessaire. Ainsi ( peut tre singulire si A est nilpotente, et dans ce cas, la
commande u = 0 sut a atteindre 0. Ainsi la proprit de commandabilit
dans le cas discret nest pas quivalente au fait que la matrice ( est de rang
plein.
La condition ncessaire de commandabilit est que A
n
x
0
doit appartenir
lespace engendr par les vecteur B, AB, ..., A
n1
B qui est lespace accessible
la commande. Si A est inversible, on peut r-crire (D.12) sous la forme
A
n
x[n] = x[0] + A
n
( [u[n 1], ..., u[0]]
T
En considrant la squence de commande comme inconnue dans cette der-
nire quation, on voit que dans ce cas, la commandabilit est quivalente au
fait que la matrice A
n
( soit de rang plein, ce qui est quivalent ce que (
soit de rang plein.
D.3.1 Placement de ples
Considrons lquation aux dirences o intervient la commande
x[k + 1] = Ax[k] + Bu[k]
o A est une matrice de dimension n n et B est un vecteur de dimension
n. Comme dans le cas continu, il est possible lorsque le systme est comman-
dable, de choisir le polynme caractristique det(zI A+BK) de ABK
en le choisissant gal un polynme P(z) librement choisi (de premier terme
normalis z
n
). Ceci est ralis en choisissant le gain K daprs la formule
dAckermann (qui sert galement dans le cas continu)
K = [0, ..., 0, 1] (
1
P(A)
D.3.2 Rendre une matrice nilpotente par feedback
Pour stabiliser asymptotiquement le systme (commandable) il est suf-
sant de rendre la matrice A BK nilpotente. Ainsi, quelle que soit la
condition initiale, le systme atteint le point 0 en au plus n itrations.
Pour raliser ceci, il sut dutiliser la formule dAckermann avec P(z) =
z
n
. Ainsi un gain qui rend la matrice A BK nilpotente est
K = [0, ..., 0, 1] (
1
A
n
= [0, ..., 0, 1]
_
A
n
B, ..., A
1
B

1
aprs simplication.
240 ANNEXE D. AUTOMATIQUE EN TEMPS DISCRET
D.3.3 Synthse dune commande pour aller en temps
ni un point dquilibre arbitraire
En utilisant le rsultat prcdent, il est ais de calculer une loi de feedback
permettant datteindre en un nombre ni ditrations un point dquilibre x
f
arbitrairement choisi. Ceci rsoud le problme de planication de trajectoires
A ce point dquilibre il correspond une commande dquilibre u
f
solution de
lquation
x
f
= Ax
f
+ Bu
f
En utilisant le contrleur K prcdent, on forme la commande
u = K(x x
f
) + u
f
(D.13)
Ce qui donne lquation aux dirences
x[k + 1] = Ax[k] BK(x[k] x
f
) + Bu
f
do, aprs factorisation, et en utilisant (D.13),
(x[k + 1] x
f
) = (A BK)(x[k] x
f
)
La matrice (ABK) tant nilpotente, grce au choix de K, on atteint donc
x
f
en au plus n intrations, quelle que soit la condition initiale. Ceci tablit
le rsultat suivant.
Proposition 11 (Commande en feedback atteignant un point dquilibre en
temps ni). Soit un systme discret x[k+1] = Ax[k] +Bu[k] atteignable avec
dimx = n. Soit x
f
un point dquilibre quon souhaite atteindre, et soit u
f
la commande dquilibre correspondante. La commande en boucle ferme u =
K(xx
f
) +u
f
o K = [0, ..., 0, 1] [A
n
B, ..., A
1
B]
1
permet datteindre
le point x
f
en au plus n itrations.
D.3.4 Commande linaire quadratique LQR en temps
discret
Tout comme dans le cas continu, il est intressant de planier des tran-
sitoires optimaux entre deux points de lespace dtat, ainsi que de calculer
des rgulateurs stabilisants optimaux au sens dun critre quadratique. On se
reportera 3.4 pour des explications gnrales sur la formulation du critre
et lobtention des quations de stationnarit qui permettent de caractriser
la solution. Nous donnons ici la solution dans le cas du temps discret.
D.3. COMMANDABILIT EN TEMPS DISCRET 241
Proposition 12 (Commande quadratique en temps discret). Soit un systme
discret x[k+1] = Ax[k]+Bu[k], dimx = n, dimu = 1, et sa condition initiale
x
0
. Soit le critre minimiser
J
N
= x
T
[N]S
f
x[N] +
N1

i=1
x
T
[i]Rx[i] +
N1

i=0
u
T
[i]Qu[i]
avec N > 0, S
f
et R matrices symtriques positives, Q matrice symtrique
dnie positive. La loi de commande minimisant ce critre est la loi de feed-
back
u[i] = K[i]
1
k[i]x[i]
avec
k[i 1] = B
T
S[i]A,
K[i] = Q + B
T
S[i]B
S[i 1] = A
T
S[i]A + R k[i 1]
T
K[i]
1
k[i 1], i = N, ..., 0
S[N] = S
f
et le cot optimal associ est (x
0
)
T
S[0]x
0
.
Les formules permettant de calculer le gain optimal et la commande en
boucle ferme sont, comme dans le cas du temps continu, des formules en
temps rtrograde.
Le passage la limite lorsque N, lhorizon temporel sur lequel est formul
le critre, tend vers linni est trait par le rsultat suivant
Proposition 13 (Rgulateur LQR en temps discret). Soit un systme discret
x[k + 1] = Ax[k] + Bu[k], dimx = n, dimu = 1, et sa condition initiale x
0
.
Soit le critre minimiser
J =
+

i=1
x
T
[i]Rx[i] +
+

i=0
u
T
[i]Qu[i]
avec N > 0, P
f
et R matrices symtriques positives, Q matrice symtrique
dnie positive. La loi de commande minimisant ce critre est la loi de feed-
back
u[i] = (B
T
SB + Q)
1
B
T
SA x[i]
o S est lunique solution stabilisante de
0 = S A
T
SA + A
T
SB(B
T
SB + Q)
1
B
T
SA R
242 ANNEXE D. AUTOMATIQUE EN TEMPS DISCRET
( quation algbrique de Riccati en temps discret pour laquelle lexistence
et lunicit dune solution stabilisante est garantie sous des hypothses de
commandabilit et dcriture du critre semblables au cas en temps continu
du Thorme 26, i.e. (A, R
1/2
) observable)) et le cot (optimal) associ est
(x
0
)
T
S[0]x
0
.
D.4 Observabilit, reconstructibilit et ltrage
De mme quen ce qui concerne la commande, certaines subtilits appa-
raissent dans le domaine de la reconstruction dtat partir des mesures
lorsquon considre un systme sous sa forme en temps discret. Ainsi, on
doit distinguer la proprit dobservabilit et celle de reconstructibilit dun
systme (voir ci-dessous).
Considrons lquation aux dirences, o intervient la mesure y de ltat x
x[k + 1] = Ax[k] + Bu[k]
y[k] = Cx[k]
(D.14)
o A est une matrice de dimension n n, B est une matrice de dimension
n m, et C une matrice de dimension p n.
Dnition 26 (Observabilit en temps discret). Le systme en temps dis-
cret(D.14) est dit observable, si, pour tout k, on peut dterminer de manire
univoque ltat x[k] daprs les mesures futures y[k], ..., y[k + n 1] et les
commandes u[k], ..., u[k + n 2] futures.
Dnition 27 (Reconstructibilit en temps discret). Le systme en temps
discret(D.14) est dit reconstructible, si, pour tout k, on peut dterminer de
manire univoque ltat x[k] daprs les mesures passes y[k n + 1], ..., y[k]
et les commandes u[k n + 1], ..., u[k 1] passes.
La constructibilit nimplique pas lobservabilit, on peut trouver des
contre-exemples simples dans [38].
Considrons les quations suivantes, obtenues par un calcul direct depuis
un indice k quelconque.
y[k] = Cx[k]
y[k + 1] = C(Ax[k] + Bu[k])
y[k + 2] = C(A
2
x[k] + ABu[k] + Bu[k + 1])
.
.
.
y[k + n 1] = C(A
n1
x[k] + A
n2
Bu[k] + ... + Bu[k + n 2])
D.4. OBSERVABILIT, RECONSTRUCTIBILIT ET FILTRAGE 243
Il vient, en regroupant, sous la forme de vecteurs :
_
_
_
y[k]
.
.
.
y[k + n 1]
_
_
_
= Ox[k] +
_
_
_
_
_
_
_
0 ... ... 0
CB 0 ... 0
CAB CB 0
.
.
.
.
.
.
CA
n2
B CB
_
_
_
_
_
_
_
_
_
_
u[k]
.
.
.
u[k + n 2]
_
_
_
o O est la matrice dobservabilit de la paire (A, C) dj rencontre dans
le cas du temps continu au Thorme 28. Dans cette dernire quation, il
apparat directement le rsultat suivant
Proposition 14 (Observabilit et reconstructibilit). Soit un systme x[k +
1] = Ax[k] + Bu[k], y[k] = Cx[k] avec dimx = n. Ce systme est observable
si et seulement si la matrice dobservabilit O = [C; CA; ...; CA
n1
] est de
rang plein. Ce systme est reconstructible si la matrice dobservabilit est de
rang plein.
Comme ceci est prcis dans [38], les proprits de commandabilit et
de reconstructibilit sont duales, de mme que celle datteignabilit et et
dobservabilit.
D.4.1 Filtre de Kalman en temps discret
Lorsquon cherche eectivement reconstruire ltat partir de la connais-
sances des entres et des sorties du systme, on peut le faire par un observa-
teur asymptotique, en utilisant, par dualit avec les problmes de commande,
les thormes de placement de ples, o invoquer un principe doptimalit
pour prendre en compte au mieux les incertitudes sur le modle, les entres
et sur les mesures. Comme dans le cas du temps continu, loutil permet-
tant ce ltrage optimal au sens stochastique est le ltre de Kalman qui est
implment, dans le cas considr, sous forme dquations aux dirences.
Proposition 15 (Filtre de Kalman en temps discret). Soit un systme
x[k + 1] = Ax[k] + Bu[k] + D[k], y[k] = Cx[k] + [k], initialis en une
variable alatoire x
0
, o est un bruit gaussien centr de matrice de cova-
riance cov([k], [j]) =
j
k
M

, et est un bruit gaussien centr indpendant


de de matrice de covariance cov([k], [j]) =
j
k
M

. Le ltre de Kalman
reconstruit, travers les quations de propagation et de recalage qui suivent
une estimation x de ltat x. Notons x
p
[k] ltat des quations de propagation,
et x
r
[k] ltat des quations de recalage, ainsi que
p
[k] et
r
[k] les matrices
244 ANNEXE D. AUTOMATIQUE EN TEMPS DISCRET
de covariance pour les tapes de propagation et de recalage, respectivement.
Au cours des itrations, lestimation recherche de x[k] est simplement x
r
[k].
Initialisation
_
x
p
[0] = x
r
[0] = E(x
0
)

p
[0] =
r
[0] = var(x
0
)
(D.15)
Propagation
_
x
p
[k + 1] = A x
r
[k] + Bu[k]

p
[k + 1] = A
r
[k]A
T
+ DM

D
T
(D.16)
Recalage
_

_
K =
p
[k + 1]C
T
_
C
p
[k + 1]C
T
+ M

_
1
x
r
[k + 1] = x
p
[k + 1] + K(y[k + 1] C x
p
[k + 1])

r
[k + 1] =
_

p
[k + 1]
1
+ C
T
M
1

C
_
1
(D.17)
Ces formules sont celles usuellement considres (voir [69]) Avantageuse-
ment, on pourra remplacer la dernire formule dans lquation de recalage
par lune ou lautre des deux quations suivantes (formule de Joseph [14, 23])
obtenue par la formule de Sherman-Morrison-Woodbury applique linverse
de la matrice
p
[k + 1]
1
+ C
T
M
1

r
[k + 1] =
p
[k + 1]
p
[k + 1]C
T
_
C
p
[k + 1]C
T
+ M

_
1
C
p
[k + 1]
qui se rcrit encore

r
[k + 1] = (I
n
KC)
p
[k + 1](I
n
KC)
T
+ KM

K
T
qui garantit que la mise jour
r
[k + 1] est une matrice symtrique dnie
positive ds lors que
p
[k + 1] lest.
Bibliographie
[1] M. Abramowitz and I.A. Stegun. Handbook of Mathematical Functions.
Dover, New York, 1965.
[2] M. J. Abzug and E. Eugene Larrabee. Airplane stability and control.
Cambridge Aerospace Series. Cambridge University Press, 2002.
[3] Hamed M. Al-Rahmani and Gene F. Franklin. Techniques in multirate
digital control. In C.T. Leondes, editor, Digital Control Systems Im-
plementation Techniques, volume 70 of Control and Dynamic Systems,
pages 1 24. Academic Press, 1995.
[4] V. Alexeev, E. Galeev, and V. Tikhomirov. Receuil de Problmes dOp-
timisation. Editions Mir, Moscou, 1987.
[5] B.D.O. Anderson, R.R. Bitmead, C.R. Johnson, P.V. Kokotovic, R.L.
Kosut, I.M.Y. Mareels, L. Praly, and B.D. Riedle. Stability of adaptive
systems : Passivity and averaging analysis. MIT Press, 1986.
[6] A. Andronov, S. Khaikin, and A. Vitt. Theory of Oscillators. Dover,
1987. English Translation.
[7] A. Angot. Complments de mathmatiques. Editions de la revue dop-
tique, Paris, third edition, 1957.
[8] W. F. III Arnold and A. J. Laub. Generalized eigenproblem algorithms
and software for algebraic Riccati equations. Proc. IEEE, 72 :17461754,
1984.
[9] M. Athans. The Control Handbook, chapter Kalman ltering, pages 589
594. CRC Press and IEEE Press, 1996.
[10] R. Bellman and K. L. Cooke. Modern elementary dierential equations.
Addison-Wesley, 1971.
[11] J. T. Betts. Practical Methods for optimal control using nonlinear pro-
gramming. Advances in Design and Control. Society for Industrial and
Applied Mathematics (SIAM), Philadelphia, PA, 2001.
[12] F. Brauer and J. A. Nohel. The qualitative theory of ordinary dierential
equations. W. A. Benjamin, Inc., New York, 1969.
245
246 BIBLIOGRAPHIE
[13] A. E. Bryson and Y. C. Ho. Applied Optimal Control. Ginn and Com-
pany, 1969.
[14] R. S. Bucy and P. D. Joseph. Filtering for stochastic processes with
applications to guidance. Interscience, 1968.
[15] H. Cartan. Thorie lmentaire des fonctions analytiques. Hermann,
1961.
[16] C.-T. Chen. Signals and Systems. Oxford University Press, 2004.
[17] K. L. Chien, J. A. Hrones, and J. B. Reswick. On the automatic control
of generalized passive systems. Transactions ASME, 74 :175185, 1952.
[18] G. H. Cohen and G. A. Coon. Theoretical consideration of retarded
control. Trans. A.S.M.E., Vol. 75(No. 1) :pp. 827834, 1953.
[19] R. F. Curtain and H. J. Zwart. An Introduction to innite-Dimensional
Linear Systems Theory. Text in Applied Mathematics, 21. Springer-
Verlag, 1995.
[20] R. Dautray and J.-L. Lions. Analyse mathmatique et calcul numrique
pour les sciences et les techniques, volume 7. Masson, 1988.
[21] M. Demazure. Bifurcations and Catastrophes. Universitext. Springer,
2000.
[22] V. Ditkin and A. P. Prudnikov. Formulaire pour le calcul oprationnel.
Masson et Cie., 1967.
[23] P. Faurre. Navigation inertielle et ltrage stochastique. Mthodes ma-
thmatiques de linformatique. Dunod, 1971.
[24] F.R. Gantmacher. Thorie des Matrices : tome 1. Dunod, Paris, 1966.
[25] F.R. Gantmacher. Thorie des Matrices : tome 2. Dunod, Paris, 1966.
[26] C. Gasquet and P. Witomski. Analyse de Fourier et applications. Mas-
son, 1990.
[27] J.P. Gauthier and I. Kupka. Deterministic Observation Theory and
Applications. Cambridge University Press, 2001.
[28] C. Godbillon. Gomtrie direntielle et mcanique analytique. Her-
mann, Paris, 1969.
[29] K. Gu, V. L. Kharitonov, and J. Chen. Stability of time-delay systems.
Birkhuser, 2003.
[30] J. Guckenheimer and P. Holmes. Nonlinear Oscillations, Dynamical
Systems and Bifurcations of Vector Fields. Springer, New York, 1983.
[31] J. K. Hale and S. M. Verduyn Lunel. Introduction to functional die-
rential equations. Springer-Verlag, 1993.
BIBLIOGRAPHIE 247
[32] S. Haroche. Contrle de la dcohrence : thorie et ex-
priences, 2004. Notes de cours, Collge de France.
http ://www.lkb.ens.fr/recherche/qedcav/college/college.html.
[33] P. Hartman. Ordinary Dierential Equations. Birkuser, Boston, 1982.
[34] M.W. Hirsch and S. Smale. Dierential Equations, Dynamical Systems
and Linear Algebra. Acamedic Press : New-York, 1974.
[35] P. Horowitz and H. Wineld. The art of electronics. Cambdrige Uni-
versity Press, 2 edition, 1989.
[36] W. Hurewicz. Lectures on ordinary dierential equations. Dover Phoenix
Editions, 1990.
[37] J. Istas. Introduction aux modlisations mathmatiques pour les sciences
du vivant. Number 34 in Mathmatiques & Applications. Springer, 2000.
[38] T. Kailath. Linear Systems. Prentice-Hall, Englewood Clis, NJ, 1980.
[39] R. E. Kalman and R. S. Bucy. New results in linear ltering and pre-
diction problems. ASME Journal of Basic Engineering, pages 95108,
1961.
[40] H.K. Khalil. Nonlinear Systems. MacMillan, 1992.
[41] M. Krsti, I. Kanellakopoulos, and P.V. Kokotovic. Nonlinear and Adap-
tive Control Design. J. Wiley, New-York, 1995.
[42] O. Latte. Distributions et applications. Cours et exercices, cole Na-
tionale Suprieure des Mines de Paris, 2005.
[43] C. Lanczos. Linear Dierential Operators. Dover Publications, 1997.
[44] L. Landau and E. Lifshitz. Mcanique. Mir, Moscou, 4th edition, 1982.
[45] Y. Lee, S. Park, M. Lee, and C. Brosilow. PID controller for desired
closed-loop responses for SI/SO systems. AIChE Journal, Vol. 44(No.
1) :pp. 106115, 1998.
[46] W. Leonhard. Control of Electrical Drives. Elsevier, 1985.
[47] W. S. Levine. The Control Handbook. CRC Press and IEEE Press, 1996.
[48] J. Ligou. Introduction au gnie nuclaire. Presses Polytechniques et
Universitaires Romandes, 2 edition, 1997.
[49] W. Lohmiler and J.J.E. Slotine. On metric analysis and observers for
nonlinear systems. Automatica, 34(6) :683696, 1998.
[50] D. G. Luenberger. Introduction to Dynamic Systems : Theory, Models,
and Applications. John Wiley & Sons, 2 edition, 1979.
[51] F. Maisonneuve. Calcul direntiel. Cours et exercices, cole Nationale
Suprieure des Mines de Paris, 2006.
248 BIBLIOGRAPHIE
[52] F. Maisonneuve. Calcul intgral. Cours et exercices, cole Nationale
Suprieure des Mines de Paris, 2006.
[53] F. Maisonneuve. Fonctions dune variable complexe. Cours et exercices,
cole Nationale Suprieure des Mines de Paris, 2006.
[54] I. Mareels, S. Van Gils, J. W. Polderman, and A. Ilchmann. Asymptotic
dynamics in adaptive gain control. In P. M. Frank, editor, Advances in
Control, Highlights of ECC99, pages 391449. Springer, 1999.
[55] Ph. Martin, R. Murray, and P. Rouchon. Flat systems,
equivalence and trajectory generation, 2003. Technical Report
http ://www.cds.caltech.edu/reports/.
[56] D. Q. Mayne, J. B. Rawlings, C. V. Rao, and P. O. M. Scokaert.
Constrained model predictive control : stability and optimality. Au-
tomatica, 36 :789814, 2000.
[57] M. B. Milam. Real-time optimal trajectory generation for constrained
systems. PhD thesis, California Institute of Technology, 2003.
[58] R. Murray, Z. Li, and S. Sastry. A Mathematical Introduction to Robotic
Manipulation. CRC Press, 1993.
[59] N. E. Nahi. Estimation theory and applications. John Wiley & Sons,
Inc., 1969.
[60] Z. J. Palmor. Stability properties of Smith dead-time compensator
controller. Int. J. Control, 32(6) :937949, 1980.
[61] N. Petit. Optimisation. Notes de cours, cole Nationale Suprieure des
Mines de Paris, 2004.
[62] W. J. Rugh and J. S. Shamma. Research on gain scheduling. Automatica,
36 :14011425, 2000.
[63] R. Sepulchre, M. Jankovi, and P. Kokotovi. Constructive nonlinear
control. Springer Verlag, 1997.
[64] G. J. Silva, A. Datta, and S. P. Bhattacharyya. PID controllers for
time-delay systems. Birkhuser, 2005.
[65] L. Singre. Etude des instabilits dans les puits activs par gas-lift. PhD
thesis, cole des Mines de Paris, 2006.
[66] O. J. M. Smith. Closer control of loops with dead time. Chemical
Engineering Progress, 53(5) :217219, 1958.
[67] E. Sontag. Mathematical Control Theory. Springer Verlag, 1990.
[68] E. M. Stein and G. Weiss. Introduction to Fourier Analysis on Euclidean
Spaces. Princeton University Press, 1971.
BIBLIOGRAPHIE 249
[69] R. F. Stengel. Optimal control and estimation. Dover Publications, 1994.
[70] K. J. +strm and T. Hgglund. PID Controllers : Theory, Design, and
Tuning. Instrument Society of America, 1995.
[71] A. Tikhonov, A. Vasileva, and A. Sveshnikov. Dierential Equations.
Springer, New York, 1980.
[72] M. Unser. Sampling-50 years after Shannon. Proceedings of the IEEE,
88(4) :569 587, 2000.
[73] K. Yosida. Operational Calculus. Springer, Berlin, 1999.
[74] J. G. Ziegler and N. B. Nichols. Optimum settings for automatic control-
lers. Trans. A.S.M.E., Vol. 64 :pp. 759765, 1942. Available from
www.driedger.ca.
[75] J. G. Ziegler and N. B. Nichols. Process lags in automatic-control cir-
cuits. Transp. A.S.M.E., Vol. 65 :pp. 433444, 1943.
250 BIBLIOGRAPHIE
Index
anti-windup, 55, 58
approximation adiabatique, 47
approximation quasi-statique, 47
approximation sculaire, 48
atome trois niveaux, 124
atteignabilit en temps discret, 238
attracteur, 34
backstepping, 170
bassin dattraction, 50, 217
bouclage dynamique, 62
bouclage statique rgulier, 134, 136
boucle ferme, 62
boucle ouverte, 62
calcul direntiel intrinsque, 166
capteurs logiciels, 174
centre, 24
champs de vecteurs, 40, 166
CNS de stabilit asymptotique dun
systme linaire stationnaire,
19
CNS de stabilit dun systme linaire
stationnaire, 21
col, 24
commandabilit, 119, 129, 143
commandabilit en temps discret, 238
commandabilit linaire, 131
commandabilit non linaire, 128
commande, 7
commande adaptative, 30, 199, 201
commande en boucle ferme, 123
commande en boucle ouverte, 129
commande linaire quadratique, 120,
143, 145
commande linaire quadratique en temps
discret, 241
commande LQR, 143, 153
commande LQR en temps discret, 241
commande modale, 188
consigne, 56
contrleur P, 100
contrleur PI, 53, 87, 98
contraction, 202
contrainte nale, 153
contrle en boucle ferme, 123
contrle en boucle ouverte, 122
contrle hirarchis, 74
convergence exponentielle, 21, 157
convertisseur analogique-numrique, 229,
230
convertisseur numrique-analogique, 229,
230
critre de Nyquist, 94, 99
critre de Routh, 26
critre du revers, 98
critre datteignabilit en temps dis-
cret, 238
critre dobservabilit, 184
critre dobservabilit en temps dis-
cret, 243
critre de Bendixon, 41
critre de commandabilit, 135
critre de Jury, 237
crochet de Lie, 166
cycle limite, 39, 42
251
252 INDEX
distinguabilit, 179
dpendance de la solution en la condi-
tion initiale, 13
ensemble positivement invariant, 34,
64, 216, 218, 219
entrelacement, 26
entre, 7
quation de Lyapounov, 29, 193
quation de Riccati algbrique, 157,
158, 160, 161
quation de sortie, 8
quation direntielle de Riccati, 151,
153, 154, 158
quivalence statique, 164
estimation, 176, 182
tat, 7, 61
tat adjoint, 150, 151
excitation sinusodale, 83
existence dune solution au problme
de Cauchy, 211
existence et unicit des solutions dune
quation direntielle, 12
exponentielle de matrice, 18
exposants caractristiques, 39
facteur damortissement, 74
feedback, 8, 56, 119, 123
feedback optimal, 153
feedforward, 56, 70, 72, 73, 140, 154
ltrage, 176
ltrage de consigne, 71
ltre de Kalman, 173
ltre de Kalman en temps discret, 243
fonction Lipschitz, 209
fonction Lipschitz vectorielle, 209
fonction de transfert, 80
fonction de Lyapounov, 34, 215, 218
fonction de transfert, 81, 86
fonction mromorphe, 94
fonction non borne radialement, 218
fonction non borne radialement, 33,
34
fonctions mromorphes, 94
forme dtat, 61
forme canonique dun systme linaire,
23, 25
forme dtat, 86
forme dtat canonique, 89
forme dtat canonique minimale, 87
forme dtat, 7
forme de Brunovsky, 119, 136, 141,
143, 165, 188
forme de Jordan, 19
forme normale, 136
forme standard du thorme de Ti-
khonov, 50
formule de Joseph, 244
formule de Poisson, 232
formule de reconstruction de Shannon-
Whittaker, 231
formule de Sherman-Morrison-Woodbury,
244
foyer instable, 24, 43
foyer stable, 24
fraction rationnelle causale, 86
fraction rationnelle propre, 86
frquence dchantillonage, 229
gain danti-emballement, 63
gain intgral, 57
identication, 176
indices de commandabilit, 135, 136
intgrale premire, 129, 131, 132, 134
intgrale premire triviale, 131
invariance de LaSalle, 33, 219
invariant chimique, 130
Lagrangien, 147, 148
lieu de Nyquist, 99, 100, 102, 105, 107,
162, 163
INDEX 253
linarisation par bouclage dynamique,
169
linarisation par injection de sortie,
201
loi dArrhenius, 130
marge de gain, 105, 106
marge de phase, 102, 104
marges de robustesse, 79, 94
marges de stabilit du rgulateur LQR,
161
matrice dobservabilit, 184, 243
matrice de commandabilit, 132136,
238
matrice de transfert, 86
matrice de transition, 193
matrice Hurwitz, 25, 29, 50, 141
mesure, 8
moteur courant continu, 175
moyennisation, 48, 222
multiplicateurs de Lagrange, 146
nud instable, 24, 43
nud stable, 24
observabilit, 175
observabilit en temps discret, 242
observabilit globale, 179
observabilit locale, 180, 181
observable, 156
observateur, 8, 182
observateur asymptotique, 175, 176,
186
observateur rduit de Luenberger, 187
observateur-contrleur, 175, 187, 188
orbite homocline, 40
orbite htrocline, 40
orbite priodique, 42
oscillateur de Van der Pol, 45
oscillateur harmonique, 16
oscillateurs, 120
perturbation, 61
perturbations singulires, 47
phnomne daliasing, 231
pic de rsonance, 84
placement de ples, 120, 142, 157, 186
placement de ples en temps discret,
239
placement de ples pour lobservateur,
177
plan de phases, 22, 64
planication de trajectoire en temps
discret, 240
planication de trajectoires, 119122,
128, 129, 142, 153, 156
point dquilibre asymptotiquement sta-
ble, 79
point dquilibre globalement asymp-
totiquement stable, 19, 217
point dquilibre hyperbolique, 52, 222,
224
point dquilibre, 9
point dquilibre globalement asymp-
totiquement stable, 16, 34
point dquilibre hyperbolique, 30, 42
point dquilibre instable, 15
point dquilibre localement asymp-
totiquement stable, 15, 31
point dquilibre stable (au sens de
Lyapounov), 15
point stationnaire, 9
ple, 82
ple dune fonction mromorphe, 94
ple instable, 95
ples dune fonction de transfert, 86
ples dominants, 107, 108
polynme caractristique, 19, 23, 25
polynme Hurwitz, 25
portrait de phases, 2225
prdicteur de Smith, 114, 115
principe de superposition, 9
principe de sparation, 174, 188
254 INDEX
problme aux deux bouts, 150, 151
problme de Cauchy, 11, 12, 129, 150,
207, 211
pr-compensation, 56, 70, 71
pulsation de coupure, 74
priode dchantillonnage, 57
quasi-polynmes, 110
rponse une entre sinusodale, 87
racteur exothermique, 130
ralisation, 87
ralisation dun transfert rationnel, 87
reconstructibilit en temps discret, 242
rduction de Jordan, 19
rentre atmosphrique, 144
rgime asymptotique forc, 83
rglages de Ziegler-Nichols, 111, 112
rgulateur LQR, 155, 156
rgulateur PI, 80, 94, 102, 108
rgulateur PI, 55, 57
rgulateur PI avec anticipation, 72
rgulateur PID, 108
rejet de lerreur statique, 87
rponse un chelon, 111
rponse inverse, 116
rsolution de lquation de Riccati al-
gbrique, 161
rsonance, 84
retard critique, 94, 104
retour dtat, 141
retour de sortie, 8
retour dynamique de sortie, 91
rtro-action, 8
robuste, 37
robustesse, 79, 80, 115
robustesse au retard, 108
robustesse par rapport aux dynamiques
ngliges, 52
robustesse paramtrique, 54
robustesse paramtrique, 37
ralisation dune fonction de transfert
discrte, 236
schma blocs, 90
simplications ples-zros, 84, 87
solution approchante, 207, 208, 210
sortie, 8
sortie de Brunovsky, 119, 136, 139
sortie de Brunovsky non linaire, 164
sous-varit invariante, 49
stabilisation, 119, 122, 123, 141
stabilit asymptotique, 86, 215, 218
stabilit EBSB, 86
stabilit Entre-Borne-Sortie-Borne,
86
stabilit, 15
stabilit asymptotique, 15, 31
stabilit en temps discret, 237
suivi asymptotique, 142
suivi asymptotique de trajectoire, 123
suivi de trajectoire, 119, 120, 122, 123,
142
systme nominal, 79
systme non minimum de phase, 116
systme linaris tangent, 79, 92
systme perturb, 79
systme sous-actionn, 127
systme autonome, 40, 66
systme commandable, 129
systme command, 119
systme discrtis exact, 235
systme du second ordre, 75
systme instationnaire, 9
systme libre, 9
systme linaire commandable, 141
systme linaire instationnaire, 143,
153
systme linaire stationnaire, 176
systme linaire cot quadratique,
150
INDEX 255
systme linarisable par bouclage sta-
tique, 165
systme linaris tangent, 9, 17, 37,
38
systme plan, 39
systme sous-dtermin, 119
systme stationnaire, 9, 56
systmes de Linard, 44
systmes plats, 169
terme intgral, 57
thorme de Cauchy, 96
thorme de Hermite-Biehler, 26
thorme de Sylvester, 29
thorme de Tikhonov, 49
thorie des bifurcations et des catas-
trophes, 79
thorme dinvariance de LaSalle, 33
thorme de Cauchy-Lipschitz, 12
thorme de Poincar, 39
thorme de Poincar-Bendixon, 42
thorme de Shannon, 231
trajectoire, 129, 141
trajectoire dun systme command,
129
trajectoire de rfrence, 142
trajectoire en boucle ouverte, 142
transforme de Fourier, 231
transforme de Laplace, 80
transforme en z, 235
unicit de la solution au problme de
Cauchy, 211
utilisation pratique de la commande
LQR, 160
zro dune fonction mromorphe, 94
zros dune fonction de transfert, 86
quation algbrique de Riccati en temps
discret, 242
tat adjoint, 147

You might also like