Commande LQ
En automatique, la Commande linéaire quadratique, dite Commande LQ, est une méthode qui permet de calculer la matrice de gains d'une commande par retour d'état. L'initiateur de cette approche est Kalman, auteur de trois articles fondamentaux entre 1960 et 1964[1] - [2] - [3]. Les résultats de Kalman ont été complétés par de nombreux auteurs[4] - [5] - [6] - [7] - [8] - [9] - [10] - [11] - [12]. Nous ne traiterons ici que de la commande linéaire quadratique à horizon infini dans le cas d'un système linéaire stationnaire (ou « invariant »), renvoyant à l'article Commande optimale pour le cas d'un horizon fini et d'un système linéaire dont les matrices varient en fonction du temps.
L'idée consiste à minimiser un critère de performance , quadratique en l'état x et la commande u, et qui est une somme pondérée de l'énergie de x et de celle de u. Le but de la commande consiste, à la suite d'une perturbation, à ramener, de préférence aussi rapidement que possible, l'état à sa valeur d'équilibre 0, compte tenu des contraintes liées à un cahier des charges. Si, dans , on privilégie l'énergie de x, c'est celle-ci qui va être essentiellement minimisée, au détriment de l'énergie de la commande, qui pourra donc être très grande: c'est l'adage « qui veut la fin veut les moyens »; dans ce cas la commande sera très nerveuse (à grands gains). Si au contraire on privilégie dans l'énergie de u, on met l'accent sur l'économie des moyens; on obtiendra donc une commande de faible énergie, molle, pour laquelle la dynamique de la boucle fermée sera lente. Le rôle du concepteur consiste à choisir habilement les matrices de pondérations qui interviennent dans le critère, de manière à obtenir in fine, après un certain nombre d'essais-erreurs, le comportement souhaité du système en boucle fermée. Notons que, quelle que soit la méthode employée pour la conception d'un régulateur, des essais-erreurs sont inévitables. Dans le cas de la commande linéaire quadratique, avec un minimum d'expérience, les essais-erreurs convergent très rapidement. La commande linéaire quadratique, comparée à la méthode de placement de pôles, est très précieuse dans le cas d'un système ayant plusieurs entrées, car il n y a pas alors de solution unique au problème de placement de pôles : pour les mêmes pôles en boucle fermée, certaines lois de commandes peuvent être très robustes, et d'autres pas du tout[13]. La commande linéaire quadratique possède quant à elle, intrinsèquement, de très bonnes propriétés de robustesse[3] - [12] - [14].
Théorie de la commande linéaire quadratique
Cas d'un critère quadratique classique
Considérons le système linéaire stationnaire ayant pour équation d'état
où est l'état, est la commande, et A et B sont des matrices constantes appartenant à et respectivement. Considérons d'autre part le critère
où et sont des matrices symétriques réelles, semi-définie positive et définie positive respectivement.
Généralisation
Il peut être utile de considérer un critère un peu plus général, de la forme[12]
où . On se ramène au cas précédent en posant , . L'équation d'état devient
où .
Existence d'une commande optimale stabilisante
Notons d'abord que si une commande optimale existe, elle est unique, car l'intégrande du critère est strictement convexe en u.
Considérons la matrice hamiltonienne de dimension
et la condition
- (a): H n'a pas de valeur propre imaginaire.
On montre facilement que si est une valeur propre de H, l'est aussi[9]. Par conséquent, si la condition (a) est satisfaite, il existe une matrice de changement de base telle que soit sous forme de Jordan, les n premiers (resp. derniers) blocs étant associés à des valeurs propres telles que (resp. ). Soit alors
- , , , .
Si la matrice est inversible, est une solution de l'« équation algébrique de Riccati »[9] - [13]
- .
Soit les conditions
- (b): La paire est stabilisable.
- (c): La matrice est inversible, est une solution symétrique réelle semi-définie positive de l'équation algébrique de Riccati ci-dessus, la matrice (avec ) a toutes ses valeurs propres dans le demi-plan gauche ouvert, et la commande en boucle fermée , , est la commande optimale.
On a le résultat suivant[9] - [15] - [13] - [16]:
Solution à l'équation algébrique de Riccati et pôles du système bouclé —
On a l'équivalence .
D'autre part, en supposant la condition (b) satisfaite, une condition suffisante pour que la condition (a) soit satisfaite est
- (d): la paire est détectable
où la matrice C est telle que .
De plus, est une condition nécessaire et suffisante pour que la matrice de (c) soit l'unique solution symétrique réelle semi-définie positive de l'équation algébrique de Riccati considérée.
Si les conditions (a) et (b) sont satisfaites,
(1) la matrice est définie positive si, et seulement si est observable;
(2) en désignant par () les valeurs propres distinctes de H dont la partie réelle est négative, les valeurs propres distinctes de sont , et par conséquent les valeurs propres distinctes de (i.e. les pôles du système bouclé) sont .
On notera que, du point de vue numérique, il est préférable, pour résoudre l'équation algébrique de Riccati, d'utiliser la forme de Schur de H plutôt que sa forme de Jordan[11].
Égalité de Kalman et conséquences
Dans tout ce qui suit on suppose les conditions (a) et (b) satisfaites. Le nombre de composantes du vecteur d'état (resp. de commande) est n (resp. m).
Soit la matrice de transfert de la boucle ouverte, quand l'ouverture a lieu à l'entrée du système. Soit également, pour simplifier les écritures, , , et . Kalman a montré l'égalité suivante[3]:
- .
En remplaçant s par on en conclut que pour tout
où désigne la plus grande valeur singulière, est la « matrice de sensibilité » en entrée du système, à savoir , et désigne la racine carrée symétrique de la matrice symétrique réelle (semi-)définie positive . En utilisant la « norme Hinfini » on en déduit par le principe du module maximum que[13]
d'où encore
où (resp. ) désigne la plus petite (resp. la plus grande) valeur propre de . La quantité est la marge de module (en entrée du système) et est notée . On a donc obtenu[17]
- .
Dans le cas (une seule entrée), la marge de module s'interprète géométriquement comme étant la distance entre le lieu de Nyquist de la fonction de transfert de la boucle ouverte et le point critique -1. Par un raisonnement géométrique élémentaire, on en déduit que, pour un système bouclé ayant une marge de module , la marge de gain inclut l'intervalle et que la marge de phase est d'au moins rad. Le minorant donné ci-dessus pour dans le cas de la commande LQ (avec ) est égal à 1, d'où on déduit[12] que la commande LQ monovariable produit une marge de gain d'au moins et une marge de phase d'au moins 60°.
Dans le cas , l'interprétation géométrique ci-dessus n'est plus valide; en revanche, on peut encore donner un sens à la marge de gain et à la marge de phase[18], dont un minorant fonction de la marge de module est encore donné par les relations ci-dessus[13]. En particulier, si R est une « matrice scalaire » (i.e. , où r est un réel strictement positif), la marge de gain est de nouveau d'au moins et la marge de phase d'au moins 60°. Ces propriétés de robustesse font l'un des intérêts majeurs de la commande linéaire quadratique.
Mise en œuvre
Le concepteur d'une commande linéaire quadratique doit choisir de manière habile les paramètres de synthèse , Q et R. Tout d'abord, le concepteur aura soin de raisonner sur des variables réduites, sans unité, qu'il s'agisse des composantes de l'état x, de la commande u, ou même de la variable temporelle t.
Méthode alpha
Une fois la réduction ci-dessus réalisée, la méthode la plus simple consiste à prendre , , et à prendre pour un réel strictement positif qui ne soit la partie réelle d'aucune des valeurs propres de . En effet, la matrice hamiltonienne s'écrit alors
et elle n'a pas de valeurs propres imaginaires si, et seulement si n'a pas de valeurs propres imaginaires. Soit alors les valeurs propres distinctes de A (c'est-à-dire les pôles du système en boucle ouverte). Alors les pôles du système en boucle fermée sont où
On peut donc adopter une démarche assez analogue au placement de pôles (avec, toutefois, la différence que les pôles du système bouclé ne sont pas arbitrairement placés), en ajustant, par quelques essais-erreurs, la valeur du paramètre de manière que le comportement du système bouclé soit conforme au cahier des charges.
Méthode LQ traditionnelle
Si, par la méthode précédente, on ne peut pas aboutir à un résultat satisfaisant, on prendra et on choisira
où les et sont des réels strictement positifs. Plus la pondération (resp. ) sera grande, plus on contraindra la variable (resp. ) à ne prendre que des petites valeurs dans le régime transitoire. Il est à noter que si l'on multiplie Q et R par le même réel , le critère est multiplié par et la commande optimale est donc inchangée (en effet, est minimal si, et seulement si est minimal). Il faut tenir compte de ce phénomène pour ne pas « tourner en rond » dans le processus de choix des pondérations.
Augmentations d'état
Comme pour toute commande par retour d'état, le concepteur aura pris soin, dès le début, de faire les augmentations d'état nécessaires si le problème à résoudre est un problème d’asservissement (et non pas seulement de stabilisation ou d'amortissement de pôles oscillants)[13] - [17].
Notes et références
Notes
- Kalman 1960
- Kalman 1963
- Kalman 1964
- MacFarlane 1963
- Potter 1966
- Wonham 1968
- Fath 1969
- Martensson 1971
- Kucera 1972
- Kwakernaak et Sivan 1972
- Laub 1979
- Anderson et Moore 1989
- Bourlès 2010
- Bourlès 1981
- Kucera 1973
- Voir le lien avec la commande linéaire quadratique à horizon fini dans l'article Commande optimale.
- Bourlès et Guillard 2012
- Safonov et Athans 1977
Bibliographie
- (en) Brian D.O. Anderson et John B. Moore, Optimal Control, Prentice-Hall, , 391 p. (ISBN 0-13-638651-2)
- Henri Bourlès, « Sur la robustesse des régulateurs linéaires quadratiques multivariables, optimaux pour une fonctionnelle de coût quadratique », C.R. Acad. Sc. Paris, i, vol. 252, , p. 971-974
- (en) Henri Bourlès, Linear Systems, John Wiley & Sons, , 544 p. (ISBN 978-1-84821-162-9 et 1-84821-162-7)
- Henri Bourlès et Hervé Guillard, Commande des systèmes. Performance et robustesse, Paris, Ellipses, , 305 p. (ISBN 978-2-7298-7535-0)
- (en) A.F. Fath, « Computational Aspects of the Linear Optimal Regulator Problem », IEEE Trans. on Automat. Control, vol. 14, , p. 547-550
- (en) R. E. Kalman, « Contributions to the Theory of Optimal Control », Bol. Soc. Matem. Mex., , p. 102-119
- (en) R. E. Kalman, « When is a Linear Control System Optimal? », Trans. ASME, Ser.D: J. Basic Eng., vol. 86, , p. 1-10
- (en) R. E. Kalman, « Mathematical description of linear systems », SIAM J. Control, série A, vol. 1(2), , p. 152-192
- (en) Vladimir Kucera, « A contribution to matrix quadratic equations », IEEE Trans. on Automat. Control, vol. 17(3)), , p. 344-347
- (en) Vladimir Kucera, « A review of the matrix Riccati equation », Kybernetika, vol. 9(2)), , p. 42-61 (lire en ligne)
- (en) Huibert Kwakernaak et Raphael Sivan, Linear Optimal Control Systems, John Wiley & Sons Inc, , 575 p. (ISBN 0-471-51110-2)
- (en) Alan Laub, « A Schur Method for Solving Algebraic Riccati Equations », IEEE Trans. on Automat. Control, vol. 24(6), , p. 913-921 (lire en ligne)
- (en) A.G.J. MacFarlane, « An Eigenvector Solution of the Optimal Linear Regulator », J. Electron., vol. 14, , p. 643-654
- (en) K. Martensson, « On the Matrix Riccati Equation », Information Sci., vol. 3, , p. 17-49
- (en) J. E. Potter, « Matrix Quadratic Solutions », SIAM J. Applied Math., vol. 14, , p. 496-501
- (en) Michael G. Safonov et Michael Athans, « Gain and Phase Margins for Multiloop LQG Regulators », IEEE Trans. on Automat. Control, vol. 22, , p. 415-422
- (en) W. Murray Wonham, « On a Matrix Riccati Equation of Stochastic Control », SIAM J. Control, vol. 6(4), , p. 681-697