Théorème de Mercer
En mathématiques et plus précisément en analyse fonctionnelle, le théorème de Mercer est une représentation d'une fonction symétrique de type positif par le carré d'une série convergente de produits de fonctions. Ce théorème est l'un des résultats phares de James Mercer[1]. C'est un outil théorique important dans la théorie des équations intégrales. Il est aussi utilisé dans la théorie hilbertienne des processus stochastiques (voir Théorème de Karhunen-Loève (en) et Transformée de Karhunen-Loève).
Introduction
Pour expliquer le théorème de Mercer, commençons par un cas particulier important ; voir plus bas pour une formulation plus générale.
Le terme noyau, dans ce contexte, est une fonction continue
telle que K(x, s) = K(s, x).
K est dit de type positif[2] - [3] si
pour toute suites finies de points x1, …,xn de [a, b] et tout choix des réels c1, …,cn (cf. Noyau de type positif (en)).
À K on associe l'opérateur intégral défini par :
Pour des raisons techniques nous supposerons que φ peut parcourir l'espace L2[a, b] des fonctions réelles de carré intégrable.
Théorème — Soit K une fonction noyau continue symétrique de type positif. Alors :
- les valeurs propres de TK sont des réels positifs ;
- il existe une base hilbertienne (ei)i de L2[a,b] constituée de fonctions propres ;
- les fonctions propres correspondant à des valeurs propres strictement positives sont continues sur [a, b] ;
- K admet la représentation
où la convergence est absolue et uniforme.
Détails
Donnons avec force détails la structure de la preuve du théorème de Mercer, particulièrement dans ses rapports avec la théorie spectrale des opérateurs compacts normaux.
- L'application est injective.
- TK est un opérateur compact autoadjoint positif sur L2[a,b] ; de plus K(x, x) ≥ 0.
Pour montrer la compacité, on remarque d'abord que l'image de la boule unité de L2[a,b] par TK est équicontinue. Le théorème d'Ascoli permet d'en déduire que cette image est relativement compacte dans C([a,b]) muni de la norme de la convergence uniforme et a fortiori dans L2[a,b].
La théorie spectrale des opérateurs compacts normaux sur un espace de Hilbert montre qu'il existe une base hilbertienne (ei)i de L2[a,b] propre pour TK :
Pour tout λi > 0, le vecteur propre ei est donc une fonction continue sur [a,b] (comme toutes les images par TK d'éléments de L2[a,b]). Or[3]
et d'après le théorème de Dini pour les suites croissantes de fonctions continues cette convergence est uniforme, ce qui permet, grâce à l'inégalité de Cauchy-Schwarz et au critère de Cauchy, de montrer[3] que la série
converge absolument et uniformément en t vers un noyau K0 dont il est aisé de voir qu'il définit le même opérateur que le noyau K. Donc K = K0, d'où le théorème de Mercer.
Trace
On déduit de ce qui précède :
Théorème — Soit K un noyau continu symétrique de type positif. Alors les valeurs propres strictement positives de l'opérateur TK (comptées avec leurs multiplicités) forment une famille dénombrable (λi)i et l'on a :
Cela montre que l'opérateur TK est à trace et
Généralisations
Le théorème se généralise en remplaçant l'intervalle [a, b] par un espace compact, la mesure de Lebesgue sur [a, b] étant remplacée par une mesure finie dénombrablement additive μ sur les boréliens de X. Supposons que le support de μ est X, c'est-à-dire que μ(U) > 0 pour tout ouvert U non vide de X. Alors on a essentiellement le même résultat :
Théorème — Soit K un noyau continu symétrique de type positif sur X. Alors les valeurs propres de TK sont des réels positifs ou nuls et il existe une base hilbertienne (ei)i de L2μ(X) constituée de fonctions propres pour TK. Les fonctions propres correspondant aux valeurs propres non nulles sont continues sur X et K s'écrit
où la convergence est absolue et uniforme sur X.
La généralisation suivante porte sur la représentation des noyaux mesurables.
Soit (X, M, μ) un espace mesuré σ-fini. Un noyau L2 sur X est une fonction
Tout noyau L2 définit un opérateur borné TK, par la formule :
TK est un opérateur compact (c'est même un opérateur de Hilbert-Schmidt (en)). Si le noyau K est symétrique, par le théorème spectral pour les opérateurs compacts normaux sur un espace de Hilbert, il existe une base hilbertienne constituée de vecteurs propres pour TK. Les vecteurs de cette base correspondant aux valeurs propres non nulles forment une famille dénombrable (ei)i (même si le Hilbert n'est pas séparable).
Théorème — Si K est un noyau symétrique de type positif sur (X, M, μ), alors
où la convergence est en norme L2.
Noter que si le noyau n'est plus supposé continu, le développement ne converge plus nécessairement uniformément.
Utilisations
Le théorème de Mercer est utilisé en apprentissage automatique, pour l'astuce du noyau.
Notes et références
- (en) James Mercer, « Functions of positive and negative type and their connection with the theory of integral equations », Philos. Trans. Roy. Soc. London, a, vol. 209, , p. 415-446.
- Srishti D. Chatterji, Cours d'analyse, vol. 3 : Équations différentielles ordinaires et aux dérivées partielles, PPUR, 1998 (ISBN 978-288074350-5), p. 411 et suivantes sur Google Livres.
- Houcine Chebli, Analyse Hilbertienne, éd. université de Tunis (ISBN 9789973370136), p. 170 et suivantes.
Bibliographie
- (en) Alain Berlinet et Christine Thomas, Reproducing Kernel Hilbert Spaces in Probability and Statistics, Kluwer Academic Publishers, 2004
- (en) Adriaan Cornelis Zaanen (en), Linear Analysis, North Holland, 1960
- (en) Konrad Jörgens, Linear Integral Operators, Pitman, Boston, 1982
- (de) Richard Courant et David Hilbert, Methoden der mathematischen Physik (en), vol 1, Interscience, 1953
- (en) Robert B. Ash, Information Theory, Dover, 1990
- (en) Hermann König (de), Eigenvalue Distribution of Compact Operators, Birkhäuser, 1986 — Donne une généralisation du théorème de Mercer pour une mesure finie μ.