La version la plus générale du théorème est la suivante :
Théorème de la projection sur un convexe complet—
Il existe une unique application PC de E dans C, dite projection sur le convexe, qui à x associe le point PC(x) de C, tel que la distance de x à C soit égale à celle de x à PC(x). Le vecteur PC(x) est l'unique point de C vérifiant les deux propositions équivalentes :
Dans le cas où l'espace E est de Hilbert, c'est-à-dire complet, supposer que C est complet équivaut à supposer qu'il est fermé. L'application PC est parfois dénommée projecteur de meilleure approximation[1].
Démonstration
Existence et unicité de PC(x) vérifiant (1) : Soient δ la distance entre x et C et pour tout entier n > 0, Fn l'intersection de C et de la boule fermée de centre x et de rayon δ + 1/n. D'après le théorème des fermés emboîtés, il suffit de démontrer que le diamètre de Fn tend vers 0. Or si y et z sont deux points de Fn, d'après l'identité du parallélogramme,ce qui se réécrit :En remarquant que le milieu de y et z est un point de C donc à une distance supérieure ou égale à δ de x, on obtient :
ce qui conclut.
(1) implique (2) : Soient y un élément de C et θ un réel compris entre 0 et 1, alors le barycentre θ y + (1 – θ) PC(x), élément de C, est plus éloigné de x que PC(x), d'après la propriété (1), donc :
On en déduit la majoration :
Il suffit alors de diviser par θ puis de passer à la limite quand θ tend vers 0 (par valeurs strictement positives) pour obtenir le résultat.
(2) implique (1) :Remarquons qu'ici, la convexité de C n'est pas utile.
L'application PC est idempotente : En effet, si x est un élément de E, PC(x) est élément du convexe C, son image est donc lui-même.
L'application PC est « monotone » : C'est une conséquence directe du fait que 〈PC(x1) – x1, PC(x1) – PC(x2)〉 et 〈PC(x2) – x2, PC(x2) – PC(x1)〉 sont tous deux négatifs ou nuls. En sommant ces deux inégalités on obtient que
L'application PC est 1-lipschitzienne : se déduit aussi de la minoration ci-dessus, grâce à l'inégalité de Cauchy-Schwarz.
Principaux corollaires
Dans ce paragraphe, E désigne un espace de Hilbert réel.
Supplémentaire orthogonal
Le théorème de projection est l'un des outils possibles pour prouver l'existence d'un supplémentaire orthogonal pour tout sous-espace vectoriel fermé d'un Hilbert (ou plus généralement, pour tout sous-espace vectoriel complet d'un espace préhilbertien), donc l'existence d'une projection orthogonale sur ce sous-espace. (Une autre approche pour prouver ce corollaire est d'utiliser simplement l'inégalité de Bessel.)
Il existe une autre forme du théorème de Hahn-Banach :
Premier théorème de séparation—
Soient A et B deux parties de E non vides et disjointes telles que A – B soit un convexe fermé. Il existe alors une forme linéaire continue ftelle que :
.
Ce résultat s'exprime encore sous la forme suivante :
Deuxième théorème de séparation—Soient A et B deux parties de E non vides et disjointes telles que A soit un convexe fermé et B un convexe compact. Alors il existe une forme linéaire continue ftelle que :
.
Dans le cas de la dimension finie, une forme du théorème de la séparation ne nécessite plus le caractère fermé du convexe :
Séparation en dimension finie—
Si E est de dimension finie, soient x un élément de E et C un convexe ne contenant pas x, alors il existe une forme linéaire fnon nulle telle que :
.
Démonstration
Pour démontrer les théorèmes de séparation, montrons tout d'abord un résultat préliminaire (qui est, dans les deux théorèmes, le cas particulier où B est un singleton) :
Soient C un convexe fermé non vide de E et x un élément de E hors de C. Alors il existe une forme linéaire continue f telle que
.
Soient PC la projection sur C et f la forme linéaire définie par :
.
La deuxième caractérisation du projecteur montre que
.
D'autre part, les vecteurs x et PC(x) ne sont pas confondus car x n'est pas élément de C, par conséquent le carré de la norme de leur différence est strictement positif, d'où :
,
ce qui démontre le résultat préliminaire.
Soient A et B deux parties de E non vides et disjointes telles que A – B soit un convexe fermé. Il existe alors une forme linéaire continue f telle que
.
L'ensemble A – B est un convexe fermé non vide ne contenant pas le vecteur nul. Le résultat précédent montre l'existence d'une forme f telle que
ce qui démontre la proposition.
Le résultat précédent reste vrai si A est un convexe fermé et B un convexe compact. Montrons que A – B est fermé. Soit c un élément de l'adhérence de cet ensemble, alorsPar compacité de A et continuité de l'application qui à tout a associe d(a, c + B), il existe donc un élément a de A tel queComme B est fermé, il contient alors a – c, donc c appartient à A – B. Ceci démontre que A – B est fermé. Les hypothèses de la proposition précédente sont rassemblées car A – B est convexe ; elles permettent de conclure.
Si E est de dimension finie, soient x un élément de E et C un convexe ne contenant pas x, alors il existe une forme linéaire non nulle f telle que :
Pour tout élément y de C, notons Tyl'ensemble des formes linéaires f de norme 1 telles que f(x) – f(y) soit positif ou nul. L'objectif est donc de montrer que l'intersection de tous ces Tyest non vide. Or la sphère unité des formes linéaires est compacte car la dimension est finie, et chaque Tyest un fermé de ce compact (comme image réciproque d'un fermé par une application continue). D'après la propriété de Borel-Lebesgue, pour montrer que l'intersection des Tyest non vide, il suffit donc de montrer que pour toute partie finie non vide D de C, l'intersection des Tyquand y varie dans D est non vide. Soit K l'enveloppe convexe d'une telle partie finie D. Elle forme un convexe fermé non vide et ne contient pas x. Le résultat préliminaire montre l'existence d'une forme linéaire f telle que f(x) > f(y) pour tout y dans K, en particulier pour tout y dans D, ce qui termine la démonstration.
Autres applications
Ce théorème possède de multiples autres applications.
Il est utilisé en analyse fonctionnelle. Il peut donner lieu à des algorithmes programmables en dimension finie. Un exemple est donné par le théorème de Stampacchia.
En théorie des jeux, John von Neumann établit un théorème fondamental montrant l'existence de stratégies optimales pour les différents joueurs dans un contexte très général[2]. Ce résultat est une conséquence du théorème de projection dans le cadre d'un Hilbert. Il possède de nombreuses conséquences, dont l'une célèbre est l'existence d'un optimum de Pareto sous des hypothèses pas trop contraignantes en sciences économiques[3].
Ce théorème est utilisé pour trouver des expressions équivalentes à l'existence de solutions de systèmes d'inéquations linéaires[4] (théorèmes de l'alternative).
Cependant, en un point n'appartenant pas à C, PCn'a pas nécessairement de dérivée directionnelle. On connait en effet des contre-exemples dus à Joseph Kruskal[5] avec E = R3, puis à Arnold Shapiro(en)[6] avec E = R2.
Les textes sur ce sujet sont nombreux, par exemple : (en) M. Voorneveld, « Pareto-Optimal Security Strategies as Minimax Strategies of a Standard Matrix Game », Journal of Optimization Theory and Applications, , p. 203-210.
(en) G. Dantzig et M. Thapa, Linear Programming 2 : Theory and Extensions, Springer, , 448 p. (ISBN978-0-387-98613-5, lire en ligne).
(en) J. Krusakl, « Two convex counterexamples: a discontinuous envelope function and a nondifferentiable nearest-point mapping », Proc. Amer. Math. Soc., vol. 23, , p. 697-703.
(en) A. Shapiro, « Directionally nondifferentiable metric projection », Journal of Optimization Theory and Applications, vol. 1, , p. 203-204.
Références
Jean-Pierre Aubin, Analyse fonctionnelle appliquée, PUF, (ISBN978-2-13-039264-4)— L'essentiel des démonstrations et des exemples provient de ce livre.
Haïm Brezis, Analyse fonctionnelle : théorie et applications [détail des éditions]— Ce sujet est rapidement traité en page 79.