Commande LQ

En automatique, la Commande linéaire quadratique, dite Commande LQ, est une méthode qui permet de calculer la matrice de gains d'une commande par retour d'état. L'initiateur de cette approche est Kalman, auteur de trois articles fondamentaux entre 1960 et 1964[1] - [2] - [3]. Les résultats de Kalman ont été complétés par de nombreux auteurs[4] - [5] - [6] - [7] - [8] - [9] - [10] - [11] - [12]. Nous ne traiterons ici que de la commande linéaire quadratique à horizon infini dans le cas d'un système linéaire stationnaire (ou « invariant »), renvoyant à l'article Commande optimale pour le cas d'un horizon fini et d'un système linéaire dont les matrices varient en fonction du temps.

L'idée consiste à minimiser un critère de performance $J\left(u\right)$ , quadratique en l'état x et la commande u, et qui est une somme pondérée de l'énergie de x et de celle de u. Le but de la commande consiste, à la suite d'une perturbation, à ramener, de préférence aussi rapidement que possible, l'état à sa valeur d'équilibre 0, compte tenu des contraintes liées à un cahier des charges. Si, dans $J\left(u\right)$ , on privilégie l'énergie de x, c'est celle-ci qui va être essentiellement minimisée, au détriment de l'énergie de la commande, qui pourra donc être très grande: c'est l'adage « qui veut la fin veut les moyens »; dans ce cas la commande sera très nerveuse (à grands gains). Si au contraire on privilégie dans $J\left(u\right)$ l'énergie de u, on met l'accent sur l'économie des moyens; on obtiendra donc une commande de faible énergie, molle, pour laquelle la dynamique de la boucle fermée sera lente. Le rôle du concepteur consiste à choisir habilement les matrices de pondérations qui interviennent dans le critère, de manière à obtenir in fine, après un certain nombre d'essais-erreurs, le comportement souhaité du système en boucle fermée. Notons que, quelle que soit la méthode employée pour la conception d'un régulateur, des essais-erreurs sont inévitables. Dans le cas de la commande linéaire quadratique, avec un minimum d'expérience, les essais-erreurs convergent très rapidement. La commande linéaire quadratique, comparée à la méthode de placement de pôles, est très précieuse dans le cas d'un système ayant plusieurs entrées, car il n y a pas alors de solution unique au problème de placement de pôles : pour les mêmes pôles en boucle fermée, certaines lois de commandes peuvent être très robustes, et d'autres pas du tout[13]. La commande linéaire quadratique possède quant à elle, intrinsèquement, de très bonnes propriétés de robustesse[3] - [12] - [14].

Théorie de la commande linéaire quadratique

Cas d'un critère quadratique classique

Considérons le système linéaire stationnaire ayant pour équation d'état

{\dot {x}}=Ax+Bu

où $x\left(t\right)\in \mathbb {R} ^{n}$ est l'état, $u\left(t\right)\in \mathbb {R} ^{m}$ est la commande, et A et B sont des matrices constantes appartenant à $\mathbb {R} ^{n\times n}$ et $\mathbb {R} ^{n\times m}$ respectivement. Considérons d'autre part le critère

J\left(u\right)=\int _{0}^{+\infty }\left(x^{T}\left(t\right)Qx\left(t\right)+u^{T}\left(t\right)Ru\left(t\right)\right)dt

où $Q\ \in \mathbb {R} ^{n\times n}$ et $R\ \in \mathbb {R} ^{m\times m}$ sont des matrices symétriques réelles, semi-définie positive et définie positive respectivement.

Généralisation

Il peut être utile de considérer un critère un peu plus général, de la forme[12]

J\left(u\right)=\int _{0}^{+\infty }e^{2\alpha t}\left(x^{T}\left(t\right)Qx\left(t\right)+u^{T}\left(t\right)Ru\left(t\right)\right)dt

où $\alpha \geq 0$ . On se ramène au cas précédent en posant $x_{\alpha }\left(t\right)=e^{\alpha t}x\left(t\right)$ , $u_{\alpha }\left(t\right)=e^{\alpha t}u\left(t\right)$ . L'équation d'état devient

{\dot {x}}_{\alpha }=A_{\alpha }x_{\alpha }+Bu_{\alpha }

où $A_{\alpha }=A+\alpha I_{n}$ .

Existence d'une commande optimale stabilisante

Notons d'abord que si une commande optimale existe, elle est unique, car l'intégrande du critère est strictement convexe en u.

Considérons la matrice hamiltonienne de dimension $2n\times 2n$

H=\left[{\begin{array}{cc}A_{\alpha }&-BR^{-1}B^{T}\\-Q&-A_{\alpha }^{T}\end{array}}\right]

et la condition

(a): H n'a pas de valeur propre imaginaire.

On montre facilement que si $\lambda$ est une valeur propre de H, $-\lambda$ l'est aussi[9]. Par conséquent, si la condition (a) est satisfaite, il existe une matrice de changement de base $N=\left[{\begin{array}{cc}N_{1}&N_{2}\end{array}}\right]$ telle que $N^{-1}HN$ soit sous forme de Jordan, les n premiers (resp. derniers) blocs étant associés à des valeurs propres $\lambda _{i}$ telles que $\Re \left(\lambda _{i}\right)<0$ (resp. $\Re \left(\lambda _{i}\right)>0$ ). Soit alors

N_{1}=\left[{\begin{array}{ccc}\nu _{1}&\ldots &\nu _{n}\end{array}}\right]

\nu _{i}=\left[{\begin{array}{c}\xi _{i}\\\eta _{i}\end{array}}\right]

\left(1\leq i\leq n\right)

\eta =\left[{\begin{array}{ccc}\eta _{1}&\ldots &\eta _{n}\end{array}}\right]

\xi =\left[{\begin{array}{ccc}\xi _{1}&\ldots &\xi _{n}\end{array}}\right]

Si la matrice $\xi$ est inversible, $P_{\infty }=\eta \xi ^{-1}$ est une solution de l'« équation algébrique de Riccati »[9] - [13]

A_{\alpha }^{T}P+PA_{\alpha }-PBR^{-1}B^{T}P+Q=0

Soit les conditions

(b): La paire

\left(A_{\alpha },B\right)

est stabilisable.

(c): La matrice

\xi

est inversible,

P_{\infty }

est une solution symétrique réelle semi-définie positive de l'équation algébrique de Riccati ci-dessus, la matrice

A_{\alpha }-BK

(avec

K=R^{-1}B^{T}{\bar {P}}

) a toutes ses valeurs propres dans le demi-plan gauche ouvert, et la commande en boucle fermée

{\hat {u}}=-Kx

K=R^{-1}B^{T}{\bar {P}}

, est la commande optimale.

On a le résultat suivant[9] - [15] - [13] - [16]:

Solution à l'équation algébrique de Riccati et pôles du système bouclé —

On a l'équivalence $\left(a\right)\&\left(b\right)\Leftrightarrow \left(c\right)$ .

D'autre part, en supposant la condition (b) satisfaite, une condition suffisante pour que la condition (a) soit satisfaite est

(d): la paire

\left(C,A_{\alpha }\right)

est détectable

où la matrice C est telle que $Q=C^{T}C$ .

De plus, $\left(b\right)\&\left(d\right)$ est une condition nécessaire et suffisante pour que la matrice $P_{\infty }$ de (c) soit l'unique solution symétrique réelle semi-définie positive de l'équation algébrique de Riccati considérée.

Si les conditions (a) et (b) sont satisfaites,

(1) la matrice $P_{\infty }$ est définie positive si, et seulement si $\left(C,A_{\alpha }\right)$ est observable;

(2) en désignant par $\lambda _{1},...,\lambda _{q}$ ( $q\leq n$ ) les valeurs propres distinctes de H dont la partie réelle est négative, les valeurs propres distinctes de $A_{\alpha }-BK$ sont $\lambda _{1},...,\lambda _{q}$ , et par conséquent les valeurs propres distinctes de $A-BK$ (i.e. les pôles du système bouclé) sont $\lambda _{1}-\alpha ,...,\lambda _{q}-\alpha$ .

On notera que, du point de vue numérique, il est préférable, pour résoudre l'équation algébrique de Riccati, d'utiliser la forme de Schur de H plutôt que sa forme de Jordan[11].

Égalité de Kalman et conséquences

Dans tout ce qui suit on suppose les conditions (a) et (b) satisfaites. Le nombre de composantes du vecteur d'état (resp. de commande) est n (resp. m).

Soit $L\left(s\right)=K\left(sI_{n}-A\right)^{-1}B$ la matrice de transfert de la boucle ouverte, quand l'ouverture a lieu à l'entrée du système. Soit également, pour simplifier les écritures, $L_{\alpha }\left(s\right)=L\left(s-\alpha \right)$ , $\Phi _{\alpha }\left(s\right)=\left(sI_{n}-A_{\alpha }\right)^{-1}$ , et $\left(.\right)^{\sim }\left(s\right)=\left(.\right)^{T}\left(-s\right)$ . Kalman a montré l'égalité suivante[3]:

\left[I_{m}+L_{\alpha }\left(s\right)\right]^{\sim }R\left[I_{m}+L_{\alpha }\left(s\right)\right]=R+B^{T}\Phi _{\alpha }^{\sim }\left(s\right)Q\Phi _{\alpha }\left(s\right)B

En remplaçant s par $i\omega$ on en conclut que pour tout $\omega$

{\bar {\sigma }}\left({\sqrt {R}}S_{i}\left(i\omega -\alpha \right){\sqrt {R^{-1}}}\right)\leq 1

où ${\bar {\sigma }}$ désigne la plus grande valeur singulière, $S_{i}\left(s\right)$ est la « matrice de sensibilité » en entrée du système, à savoir $S_{i}=\left(I_{m}+L\right)^{-1}$ , et ${\sqrt {\left(.\right)}}$ désigne la racine carrée symétrique de la matrice symétrique réelle (semi-)définie positive $\left(.\right)$ . En utilisant la « norme Hinfini » on en déduit par le principe du module maximum que[13]

\left\Vert {\sqrt {R}}S_{i}{\sqrt {R^{-1}}}\right\Vert _{\infty }=1

d'où encore

\left\Vert S_{i}\right\Vert _{\infty }\leq {\sqrt {\frac {\lambda _{max}\left(R\right)}{\lambda _{min}\left(R\right)}}}

où $\lambda _{min}\left(.\right)$ (resp. $\lambda _{max}\left(.\right)$ ) désigne la plus petite (resp. la plus grande) valeur propre de $\left(.\right)$ . La quantité ${\frac {1}{\left\Vert S_{i}\right\Vert _{\infty }}}$ est la marge de module (en entrée du système) et est notée $Mm_{i}$ . On a donc obtenu[17]

Mm_{i}\geq {\sqrt {\frac {\lambda _{min}\left(R\right)}{\lambda _{max}\left(R\right)}}}

Dans le cas $m=1$ (une seule entrée), la marge de module s'interprète géométriquement comme étant la distance entre le lieu de Nyquist de la fonction de transfert de la boucle ouverte et le point critique -1. Par un raisonnement géométrique élémentaire, on en déduit que, pour un système bouclé ayant une marge de module $Mm_{i}$ , la marge de gain inclut l'intervalle $\left]{\frac {1}{1+Mm_{i}}},{\frac {1}{1-Mm_{i}}}\right[$ et que la marge de phase est d'au moins $2\arcsin \left({\frac {Mm_{i}}{2}}\right)$ rad. Le minorant donné ci-dessus pour $Mm_{i}$ dans le cas de la commande LQ (avec $m=1$ ) est égal à 1, d'où on déduit[12] que la commande LQ monovariable produit une marge de gain d'au moins $\left]{\frac {1}{2}},+\infty \right[$ et une marge de phase d'au moins 60°.

Dans le cas $m>1$ , l'interprétation géométrique ci-dessus n'est plus valide; en revanche, on peut encore donner un sens à la marge de gain et à la marge de phase[18], dont un minorant fonction de la marge de module est encore donné par les relations ci-dessus[13]. En particulier, si R est une « matrice scalaire » (i.e. $R=rI_{m}$ , où r est un réel strictement positif), la marge de gain est de nouveau d'au moins $\left]{\frac {1}{2}},+\infty \right[$ et la marge de phase d'au moins 60°. Ces propriétés de robustesse font l'un des intérêts majeurs de la commande linéaire quadratique.

Mise en œuvre

Le concepteur d'une commande linéaire quadratique doit choisir de manière habile les paramètres de synthèse $\alpha$ , Q et R. Tout d'abord, le concepteur aura soin de raisonner sur des variables réduites, sans unité, qu'il s'agisse des composantes de l'état x, de la commande u, ou même de la variable temporelle t.

Méthode alpha

Une fois la réduction ci-dessus réalisée, la méthode la plus simple consiste à prendre $Q=0$ , $R=I_{m}$ , et à prendre pour $\alpha$ un réel strictement positif qui ne soit la partie réelle d'aucune des valeurs propres de $-A$ . En effet, la matrice hamiltonienne s'écrit alors

H=\left[{\begin{array}{cc}A_{\alpha }&-BB^{T}\\0&-A_{\alpha }^{T}\end{array}}\right]

et elle n'a pas de valeurs propres imaginaires si, et seulement si $A_{\alpha }$ n'a pas de valeurs propres imaginaires. Soit alors $\pi _{1},...,\pi _{q}$ les valeurs propres distinctes de A (c'est-à-dire les pôles du système en boucle ouverte). Alors les pôles du système en boucle fermée sont ${\check {\lambda }}_{1},...,{\check {\lambda }}_{q}$ où

{\check {\lambda }}_{i}=\left\{{\begin{array}{c}\pi _{i}{\text{ si }}\Re \left(\pi _{i}\right)<-\alpha ,\\-\pi _{i}-2\alpha {\text{ si }}\Re \left(\pi _{i}\right)>-\alpha .\end{array}}\right.

On peut donc adopter une démarche assez analogue au placement de pôles (avec, toutefois, la différence que les pôles du système bouclé ne sont pas arbitrairement placés), en ajustant, par quelques essais-erreurs, la valeur du paramètre $\alpha$ de manière que le comportement du système bouclé soit conforme au cahier des charges.

Méthode LQ traditionnelle

Si, par la méthode précédente, on ne peut pas aboutir à un résultat satisfaisant, on prendra $\alpha =0$ et on choisira

Q=diag\left(q_{1},...,q_{n}\right),\ R=diag\left(r_{1},...,r_{m}\right)

où les $q_{i}$ et $r_{i}$ sont des réels strictement positifs. Plus la pondération $q_{i}$ (resp. $r_{i}$ ) sera grande, plus on contraindra la variable $x_{i}$ (resp. $u_{i}$ ) à ne prendre que des petites valeurs dans le régime transitoire. Il est à noter que si l'on multiplie Q et R par le même réel $\eta >0$ , le critère est multiplié par $\eta$ et la commande optimale est donc inchangée (en effet, $J\left(u\right)$ est minimal si, et seulement si $\eta J\left(u\right)$ est minimal). Il faut tenir compte de ce phénomène pour ne pas « tourner en rond » dans le processus de choix des pondérations.

Augmentations d'état

Comme pour toute commande par retour d'état, le concepteur aura pris soin, dès le début, de faire les augmentations d'état nécessaires si le problème à résoudre est un problème d’asservissement (et non pas seulement de stabilisation ou d'amortissement de pôles oscillants)[13] - [17].

Notes et références

Notes

Kalman 1960
Kalman 1963
Kalman 1964
MacFarlane 1963
Potter 1966
Wonham 1968
Fath 1969
Martensson 1971
Kucera 1972
Kwakernaak et Sivan 1972
Laub 1979
Anderson et Moore 1989
Bourlès 2010
Bourlès 1981
Kucera 1973
Voir le lien avec la commande linéaire quadratique à horizon fini dans l'article Commande optimale.
Bourlès et Guillard 2012
Safonov et Athans 1977

Bibliographie

(en) Brian D.O. Anderson et John B. Moore, Optimal Control, Prentice-Hall, 1989, 391 p. (ISBN 0-13-638651-2)
Henri Bourlès, « Sur la robustesse des régulateurs linéaires quadratiques multivariables, optimaux pour une fonctionnelle de coût quadratique », C.R. Acad. Sc. Paris, i, vol. 252,‎ 1981, p. 971-974
(en) Henri Bourlès, Linear Systems, John Wiley & Sons, 2010, 544 p. (ISBN 978-1-84821-162-9 et 1-84821-162-7)
Henri Bourlès et Hervé Guillard, Commande des systèmes. Performance et robustesse, Paris, Ellipses, 2012, 305 p. (ISBN 978-2-7298-7535-0)
(en) A.F. Fath, « Computational Aspects of the Linear Optimal Regulator Problem », IEEE Trans. on Automat. Control, vol. 14,‎ 1969, p. 547-550
(en) R. E. Kalman, « Contributions to the Theory of Optimal Control », Bol. Soc. Matem. Mex.,‎ 1960, p. 102-119
(en) R. E. Kalman, « When is a Linear Control System Optimal? », Trans. ASME, Ser.D: J. Basic Eng., vol. 86,‎ 1964, p. 1-10
(en) R. E. Kalman, « Mathematical description of linear systems », SIAM J. Control, série A, vol. 1(2),‎ 1963, p. 152-192
(en) Vladimir Kucera, « A contribution to matrix quadratic equations », IEEE Trans. on Automat. Control, vol. 17(3)),‎ 1972, p. 344-347
(en) Vladimir Kucera, « A review of the matrix Riccati equation », Kybernetika, vol. 9(2)),‎ 1973, p. 42-61 (lire en ligne)
(en) Huibert Kwakernaak et Raphael Sivan, Linear Optimal Control Systems, John Wiley & Sons Inc, 1972, 575 p. (ISBN 0-471-51110-2)
(en) Alan Laub, « A Schur Method for Solving Algebraic Riccati Equations », IEEE Trans. on Automat. Control, vol. 24(6),‎ 1979, p. 913-921 (lire en ligne)
(en) A.G.J. MacFarlane, « An Eigenvector Solution of the Optimal Linear Regulator », J. Electron., vol. 14,‎ 1963, p. 643-654
(en) K. Martensson, « On the Matrix Riccati Equation », Information Sci., vol. 3,‎ 1971, p. 17-49
(en) J. E. Potter, « Matrix Quadratic Solutions », SIAM J. Applied Math., vol. 14,‎ 1966, p. 496-501
(en) Michael G. Safonov et Michael Athans, « Gain and Phase Margins for Multiloop LQG Regulators », IEEE Trans. on Automat. Control, vol. 22,‎ 1977, p. 415-422
(en) W. Murray Wonham, « On a Matrix Riccati Equation of Stochastic Control », SIAM J. Control, vol. 6(4),‎ 1968, p. 681-697

Articles connexes

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.