AccueilđŸ‡«đŸ‡·Chercher

Pseudo-inverse

En mathĂ©matiques, et plus prĂ©cisĂ©ment en algĂšbre linĂ©aire, la notion de pseudo-inverse (ou inverse gĂ©nĂ©ralisĂ©) gĂ©nĂ©ralise celle d’inverse d’une application linĂ©aire ou d’une matrice[1] aux cas non inversibles en lui supprimant certaines des propriĂ©tĂ©s demandĂ©es aux inverses, ou en l’étendant aux espaces non algĂ©briques plus larges.

En gĂ©nĂ©ral, il n’y a pas unicitĂ© du pseudo-inverse. Son existence, pour une application linĂ©aire entre espaces de dimension Ă©ventuellement infinie, est Ă©quivalente Ă  l'existence de supplĂ©mentaires du noyau et de l'image. Selon les propriĂ©tĂ©s demandĂ©es, le pseudo-inverse dĂ©fini permet toutefois de gĂ©nĂ©raliser la notion d'inverse en se restreignant au semi-groupe associatif multiplicatif seul, mĂȘme s'il ne respecte pas les autres contraintes du corps ou de l'algĂšbre (en particulier les propriĂ©tĂ©s de distributivitĂ© ou de commutativitĂ© ne sont plus vraies dans le cas gĂ©nĂ©ral, lĂ  oĂč le vĂ©ritable inverse peut les respecter).

Ont été étudiés en particulier les types de pseudo-inverses suivants :

  • le pseudo-inverse de Moore-Penrose dans le cas des matrices carrĂ©es non inversibles, mais gĂ©nĂ©ralisable Ă  toute algĂšbre de matrices Ă  valeurs dans un corps.
  • le pseudo-inverse de Drazin qui dĂ©termine la matrice qui constitue un point fixe dans la multiplication par l'exponentiation de matrices carrĂ©es au-delĂ  d'un degrĂ© fini.
  • le pseudo-inverse Ă  gauche et le pseudo-inverse Ă  droite, utiles dans le cas des matrices non carrĂ©es qui ne sont jamais inversibles pour dĂ©terminer la factorisation en valeurs singuliĂšres, et qui ne sont pas nĂ©cessairement Ă©gaux non plus dans le cas de transformĂ©es non commutatives comme les opĂ©rateurs fonctionnels et distributions non discrĂštes.

Le pseudo-inverse se calcule Ă  l’aide d’une gĂ©nĂ©ralisation du thĂ©orĂšme spectral aux matrices non carrĂ©es.

Il est notamment utile dans le calcul de régressions (méthode des moindres carrés) pour un systÚme d'équations linéaires.

Historique

Pour une matrice à coefficients réels ou complexes (pas nécessairement carrée), ou pour une application linéaire entre espaces euclidiens ou hermitiens, en ajoutant certaines conditions supplémentaires, on a unicité du pseudo-inverse, appelé pseudo-inverse de Moore-Penrose (ou simplement « pseudo-inverse »), décrit par Eliakim Hastings Moore[2] dÚs 1920 et redécouvert indépendamment par Roger Penrose[3] en 1955. Erik Ivar Fredholm avait déjà introduit le concept de pseudo-inverse pour un opérateur intégral en 1903.

Cas général pour une application linéaire

Définition et premiÚres propriétés

Soient une application linéaire entre deux espaces vectoriels et et une application linéaire de dans . Ces deux applications sont pseudo-inverses l'une de l'autre si les deux conditions suivantes sont satisfaites :

et .

Dans ce cas, les propriétés suivantes sont vérifiées :

  • l'espace est la somme directe du noyau de et de l'image de ;
  • l'espace est la somme directe du noyau de et de l'image de ;
  • les applications et induisent des isomorphismes rĂ©ciproques entre leurs images ;
  • si l'application est inversible, alors son inverse est l'application .

Cette définition se traduit naturellement sous forme matricielle dans le cas d'espaces vectoriels de dimension finie.

Existence et construction

Réciproquement, soit une application linéaire entre deux espaces vectoriels et , dont le noyau admette un supplémentaire dans et dont l'image admette un supplémentaire dans . Alors la restriction de à induit un isomorphisme entre et son image. L'application réciproque de l'image de vers s'étend de façon unique par l'application nulle sur , en une application linéaire de dans qui est par construction pseudo-inverse de .

Il y a donc correspondance biunivoque entre les pseudo-inverses d'une application linéaire et les couples de supplémentaires pour son noyau et son image.

Remarque : ceci s'applique Ă©videmment aux cas oĂč l'un des supplĂ©mentaires et est rĂ©duit Ă  l'origine ou Ă  l'espace vectoriel tout entier, ce qui a lieu en particulier lorsque est inversible : est alors Ă©gal Ă  et est rĂ©duit Ă  l'origine.

Choix des supplémentaires

Il n'y a pas de choix canonique d'un supplémentaire en général, mais une structure d'espace euclidien ou hermitien sur les espaces vectoriels source et but permet d'en déterminer un par la définition de l'orthogonal. Cette définition du pseudo-inverse correspond au « pseudo-inverse de Moore-Penrose » pour les matrices.

Cas matriciel

DĂ©finition

Étant donnĂ© une matrice Ă  coefficients rĂ©els ou complexes avec lignes et colonnes, son pseudo-inverse est l'unique matrice Ă  lignes et colonnes vĂ©rifiant les conditions suivantes :

  1. ;
  2. ( est un inverse pour le semi-groupe multiplicatif) ;
  3. ( est une matrice hermitienne) ;
  4. ( est Ă©galement hermitienne).

Ici, la notation désigne la matrice adjointe à , donc la transposée pour le cas réel.

Cette matrice peut s'obtenir comme une limite :

qui existe mĂȘme si les matrices produits () et () ne sont pas inversibles.

Propriétés

Identités valables pour toute matrice
(à coefficients réels ou complexes)

L’opĂ©ration de pseudo-inversion :

  • est involutive ;
  • commute avec la transposition et la conjugaison ;
  • est un antimorphisme sur le produit, sous certaines hypothĂšses : soient et deux matrices dont le produit existe. Si l’une au moins est unitaire, ou si les deux matrices sont de rang Ă©gal Ă  leur dimension commune, alors ;
  • n’est pas continue en 0 (la matrice nulle). En effet, elle est homogĂšne de degrĂ© –1 : pour tout scalaire non nul, . Plus gĂ©nĂ©ralement, elle n’est continue qu’au voisinage des matrices inversibles (ou de rang maximum pour des matrices non carrĂ©es[4]).

Projections

Dans le cas matriciel, et sont des projecteurs orthogonaux, c'est-à-dire des matrices hermitiennes (, ) et idempotentes ( et ), et l'on a les résultats suivants[5] :

  • et ;
  • est le projecteur orthogonal sur l'image de (Ă©gale Ă  l'orthogonal du noyau de ) ;
  • est le projecteur orthogonal sur l'image de (Ă©gal Ă  l'orthogonal du noyau de ) ;
  • est le projecteur orthogonal sur le noyau de ;
  • est le projecteur orthogonal sur le noyau de .

Calcul effectif

Si la matrice , avec lignes et colonnes, est de rang , alors elle peut s'Ă©crire comme un produit de matrices de mĂȘme rang , oĂč possĂšde lignes et colonnes et possĂšde lignes et colonnes. Dans ce cas les produits () et () sont inversibles et la relation suivante est vĂ©rifiĂ©e :

.

Des approches optimisées existent pour le calcul de pseudo-inverses de matrices par blocs.

Algorithmiquement, le pseudo-inverse s'obtient à partir de la décomposition en valeurs singuliÚres : muni de cette décomposition , on calcule

,

oĂč est le pseudo-inverse de . La matrice est constituĂ©e de deux blocs : une matrice diagonale et une matrice nulle. Son pseudo-inverse est une matrice dont les Ă©lĂ©ments non nuls sont obtenus en inversant les Ă©lĂ©ments non nuls (de la diagonale) de , et en prenant le transposĂ© de la matrice ainsi obtenue.

À partir d'une matrice dont le pseudo-inverse est connu, il existe des algorithmes spĂ©cialisĂ©s qui effectuent le calcul plus rapidement pour des matrices en rapport avec la premiĂšre. En particulier, si la diffĂ©rence n'est que d'une ligne ou colonne changĂ©e, supprimĂ©e ou ajoutĂ©e, des algorithmes itĂ©ratifs peuvent exploiter cette relation.

Cas particuliers

Pseudo-inverse d'un vecteur colonne

  • Le pseudo-inverse d’une matrice nulle est sa transposĂ©e (Ă©galement nulle).
  • Le pseudo-inverse d’un vecteur colonne non nul est son vecteur adjoint divisĂ© par sa norme au carrĂ©.
  • Plus gĂ©nĂ©ralement, si le rang de est Ă©gal Ă  son nombre de lignes[1], la matrice peut ĂȘtre choisie Ă©gale Ă  l’identitĂ© et dans ce cas :
    .
  • De mĂȘme, si le rang de est Ă©gal Ă  son nombre de colonnes,
    .
  • A fortiori si la matrice est inversible, son pseudo-inverse est son inverse.
  • Si le pseudo-inverse de est connu, on peut en dĂ©duire par l’égalitĂ© :
    ;
  • De mĂȘme, si est connu, le pseudo-inverse de est donnĂ© par :
    .

Exemple d’utilisation

Le pseudo-inverse donne une solution approchĂ©e Ă  un systĂšme d’équations linĂ©aires : celle que donnerait la mĂ©thode des moindres carrĂ©s[6].

Le systĂšme a des solutions si et seulement si , et les solutions sont alors[7] tous les vecteurs de la forme

, oĂč le vecteur est arbitraire (si ce n'est sa dimension).

En effet (voir supra), l'image de est Ă©gale au noyau de , et le noyau de est Ă©gal Ă  l'image de .

Notes et références

(en)/(de) Cet article est partiellement ou en totalitĂ© issu des articles intitulĂ©s en anglais « Moore–Penrose inverse » (voir la liste des auteurs) et en allemand « Pseudoinverse » (voir la liste des auteurs).
  1. (en) Adi Ben-Israel et Thomas N. E. Greville, Generalized Inverses : Theory and Applications, Springer-Verlag, , 2e Ă©d. (1re Ă©d. 1974) (ISBN 0-387-00293-6)
  2. (en) Eliakim Hastings Moore, « On the reciprocal of the general algebraic matrix », Bull. AMS, vol. 26,‎ , p. 394-395 (lire en ligne, consultĂ© le )
  3. (en) Roger Penrose, « A generalized inverse for matrices », Proceedings of the Cambridge Philosophical Society, vol. 51,‎ , p. 406-413
  4. (en) Vladimir Rakočević, « On continuity of the Moore–Penrose and Drazin inverses », Matematički Vesnik, vol. 49,‎ , p. 163-72 (lire en ligne).
  5. (en) Gene H. Golub et Charles F. Van Loan, Matrix Computations, Baltimore/London, Johns Hopkins, , 3e Ă©d. (ISBN 0-8018-5414-8), p. 257-258.
  6. (en) Roger Penrose, « On best approximate solution of linear matrix equations », Proceedings of the Cambridge Philosophical Society, vol. 52,‎ , p. 17-19.
  7. (en) M. James, « The generalised inverse », Mathematical Gazette, vol. 62, no 420,‎ , p. 109-114 (DOI 10.1017/S0025557200086460).

Voir aussi

Article connexe

RĂ©gularisation Tychonoff

Liens externes

Bibliographie

  • (de) W. Mackens et H. Voß , « Mathematik I fĂŒr Studierende der Ingenieurwissenschaften »
  • (de) A. Kielbasinski et H.Schwetlick, « Numerische lineare Algebra », Deutscher Verlag der Wissenschaften, 1988
Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplĂ©mentaires peuvent s’appliquer aux fichiers multimĂ©dias.