Distance de Hausdorff
En mathématiques, et plus précisément en géométrie, la distance de Hausdorff[1] est un outil topologique qui mesure les dissemblances entre deux sous-ensembles d’un espace métrique sous-jacent. Cette distance apparait dans deux contextes bien différents : dans le domaine du traitement de l'image et en mathématiques.
Champs d'intervention de la distance de Hausdorff
Pour le traitement d'images, elle est un outil aux propriétés multiples, source de nombreux algorithmes. Elle indique si deux formes sont les mêmes et, si elles sont différentes, la distance quantifie ces dissemblances. En dimension 2, la distance de Hausdorff permet de numériser une image ou encore de reconnaître une forme. Cet outil, issu des mathématiques pures, n'est pas toujours adapté pour les traitements industriels. Par exemple, deux formes aux contours de longueurs différentes peuvent être proches, au sens de cette distance. Pour ces raisons, on utilise parfois des variantes, comme la distance de Hausdorff modifiée.
Pour le mathématicien, cette distance est à la géométrie ce que la norme de la convergence uniforme est à l'analyse. La convergence uniforme, en analyse fonctionnelle, procède d'une démarche qui consiste à travailler sur un nouvel ensemble. On n'étudie plus le comportement des nombres, réels ou complexes, sur lesquels est définie la fonction, mais celui d'un ensemble de fonctions. Typiquement, on cherche à résoudre une question à l'aide d'une suite de fonctions, qui sont vues comme des points d'un vaste espace, et qui convergent vers la solution. Les séries de Fourier procèdent d'une démarche de cette nature. Il est tentant d'aborder un problème de géométrie de la même manière. Un point de l'espace devient un solide, on recherche à trouver une solution à l'aide d'une suite de solides convergeant vers la solution. La notion de convergence demande une topologie, celle induite par la distance de Hausdorff offre une réponse.
Un exemple d'application est le problème isopérimétrique dans le plan euclidien. La question est de savoir quelle est la surface de plus grande aire possible, pour un périmètre donné, la réponse est le disque. Une méthode consiste à construire une suite, par exemple de polygones, qui converge vers la solution.
Les premières questions qui se posent sont un peu de même nature que celles de l'analyse fonctionnelle. Dans quel cas l'espace est complet, quels sont les compacts, dispose-t-on d'applications continues, existe-t-il des sous-espaces aisément manipulables et denses, un peu à l'image des polynômes ? Les réponses sont suffisamment positives pour que la démarche soit féconde. Si l'espace sous-jacent est complet, l'espace utilisant la distance de Hausdorff l'est aussi. Les compacts, si l'espace métrique est euclidien, sont les ensembles fermés bornés, les polygones forment un ensemble dense, enfin la somme de Minkowski est continue.
Dans ce domaine, le travail mathématique a un effet direct sur la mise au point d'algorithmes répondant spécifiquement aux besoins de l'industrie.
Construction de la distance
Approche intuitive
L'idée intuitive de Hausdorff est de définir la distance entre deux ensembles C et D comme indiqué sur la figure de droite. C représente le carré rouge et D le disque bleu de même surface et de même centre. À l'endroit où les deux figures coïncident, la couleur est violette, sinon elle est bleue ou rouge. Les différences entre les deux figures se matérialisent sous la forme de 4 lunules bleues et 4 presque triangles rouges.
On considère le point du carré le plus éloigné du disque, c'est un sommet du carré, à une distance a du disque. On considère ensuite le point du disque le plus éloigné du carré, c'est le sommet de la lunule et sa distance au carré est notée b. La distance de Hausdorff est la plus grande valeur des deux, en l'occurrence a, pour l'exemple choisi. Les valeurs a et b sont parfois appelées distance de Hausdorff relative.
La distance de Hausdorff, pour l'ingénieur en imagerie, est un indicateur de similarité entre deux formes géométriques, c'est la raison même de son utilité[2].
Pour que cette distance puisse vérifier le premier axiome, c'est-à-dire celui indiquant que la distance entre deux figures distinctes n'est jamais nulle, on ne peut considérer tous les ensembles. Deux boules, une ouverte et l'autre fermée, de même centre et de même rayon seraient deux ensembles différents à une distance nulle. Une autre raison pousse à limiter les ensembles considérés. La distance entre une droite et une boule serait infinie, ce qui n'est pas possible d'après les axiomes de la distance. Pour cette raison, Hausdorff limite l'ensemble aux bornés. Cette distance est souvent utilisée pour étudier des géométries proches de celles d'un espace de dimension finie, pour cette raison, on impose parfois aux ensembles d'être compacts[3]. Enfin, la distance d’un point à l'ensemble vide n'est pas bien définie (l’application rigoureuse de la définition la voudrait infinie[4]) ; pour cette raison, l'ensemble vide n'est pas considéré.
Formulations de la distance
Il existe différentes manières d'exprimer la distance d(X, Y) entre deux ensembles fermés bornés non vides X et Y d'un espace métrique (E, δ). La première correspond à la définition du paragraphe précédent :
Une autre formulation consiste à considérer les ensembles Xr et Yr, où r est un réel positif. Ici, Xr (resp. Yr) désigne l'ensemble des points de E à une distance inférieure ou égale à r de X (resp. Y)[6], aussi appelés r-voisinages de X et de Y[7]. La distance prend alors la forme suivante[8] :
Définition formelle
Soient (E, δ) un espace métrique et EH l'ensemble des fermés bornés non vides de E. La distance de Hausdorff d sur EH est l'application d, de EH × EH dans ℝ+, définie par la formule ci-dessus.
Ces notations sont utilisées dans tout le reste de l'article.
Remarque : la distance δ s'applique à deux points, ou à un point et une partie, tandis que la distance de Hausdorff d s'applique à deux parties (fermées, bornées et non vides). Par exemple dans ℝ :
Si la distance sur E est bornée, la distance de Hausdorff est définie sur tous les fermés non vides de E (tous sont bornés). Dans le cas contraire, la « distance » étendue aux fermés non bornés peut prendre des valeurs infinies.
Il est également possible de définir la distance de Hausdorff entre deux sous-ensembles non fermés de E comme la distance de Hausdorff entre leurs adhérences. On munit ainsi l’ensemble des sous-ensembles de E d’un écart (puisque deux sous-ensembles distincts mais partageant la même adhérence auront une distance de Hausdorff nulle).
Exemple
La distance de Hausdorff entre un triangle et sa frontière est égale au rayon du cercle inscrit dans le triangle. L'application au calcul de la distance de Hausdorff entre deux itérés successifs de la suite classique de compacts convergeant vers le triangle de Sierpinski est immédiate. On peut multiplier les exemples avec d'autres attracteurs de systèmes de fonctions itérées.
Continuité
Ensemble dense
L'existence d'ensembles denses intéresse autant le mathématicien que l'ingénieur en traitement d'images. Pour l'ingénieur, un sous ensemble dense permet d'approximer n'importe quel point de EH (le terme point désigne un élément de l'ensemble étudié, ici des figures géométriques). Ainsi FH est dense dans EH lorsque pour tout point X de EH et pour tout nombre réel ε strictement positif, il existe un point Y de FH à une distance inférieure à ε de X.
L'ensemble dense est choisi plus petit pour pouvoir être travaillé plus commodément. La figure de droite illustre deux ensembles denses, si E est un espace euclidien, comme le plan pour le traitement d'images. Le premier exemple correspond aux pixels. L'espace est quadrillé par un ensemble de droites (des hyperplans en dimension quelconque) dont les directions sont toutes orthogonales à un vecteur d'une base orthonormale et les droites parallèles entre elles sont régulièrement espacées. Cette grille définit un ensemble de petits carrés (d'hypercubes si la dimension est quelconque), le premier ensemble dense est celui constitué d'un ensemble fini de petits carrés de cette nature. Les ingénieurs parlent d'image matricielle
En mathématiques, on choisit souvent le pas de la grille égal à 1/2n, où n est un entier quelconque, il existe ainsi une infinité de « tailles de grille » possibles, de plus en plus précises à mesure que n augmente. Une forme, par exemple le cercle violet sur la figure de droite, est approximée par ces petits carrés. Un algorithme consiste à sélectionner un petit carré s'il possède une intersection non vide avec la figure qu'il doit approximer.
Une deuxième méthode consiste à choisir comme ensemble dense les polygones, ou encore les polyèdres dans le cas d'une dimension quelconque. Pour un ingénieur, beaucoup moins d'informations sont nécessaires pour décrire une figure géométrique avec cette méthode. Cette approche permet, soit un gain de temps, soit une précision accrue. La deuxième figure de droite est une approximation polygonale, aussi appelée image vectorielle. Pour le mathématicien, les polyèdres forment un ensemble contenant strictement le précédent, il est donc naturel qu'il soit dense, lui aussi.
Il est parfois utile de conserver la convexité, une fois encore, les polyèdres convexes forment un ensemble dense parmi les convexes de EH.
Fonctions continues
Si une fonction est continue, ce qu'elle représente est bien conservée par de petites modifications. Un exemple essentiel est la somme de Minkowski. À deux ensembles X et Y, on associe l'ensemble des vecteurs de la forme x + y où x est élément de X et y de Y. En imagerie, sommer une figure avec un petit disque permet d'atténuer les contours. En mathématiques pures, la somme de Minkowski intervient dans de nombreux théorèmes isopérimétriques. Le fait que C soit un compact convexe implique l'égalité C + C = 2C (ce qui n'est pas une évidence, la première partie correspondant à une somme de Minkowski et la deuxième à une homothétie de rapport 2). C'est un élément clé de la démonstration du théorème de Minkowski, utilisé en théorie algébrique des nombres.
Un deuxième exemple est donné par la fonction mesure, si E est un espace euclidien. La mesure de Lebesgue associe à une figure son volume. Elle possède une forme de continuité pour la distance de Hausdorff, elle est semi continue supérieurement. Cela indique que si un algorithme construit une figure à l'aide d'approximations de plus en plus précises, la figure finale possède une mesure qui ne fait pas de saut vers le bas. Mathématiquement, on le modélise par une suite (Xn) de figures qui converge vers une figure X, au sens de Hausdorff. Le volume de la figure X n'est pas beaucoup plus petit que celui de Xn, si n est grand. Si μ désigne la mesure de Lebesgue, c'est-à-dire la fonction qui à une figure associe son volume :
S'il n'existe pas de possibilité de saut vers le bas, il peut y en avoir vers le haut. On peut s'en rendre compte en construisant une image à l'aide d'étapes successives, notées (Xn). On suppose que l'image est composée de pixels trop petits pour être visibles. À chaque étape, l'algorithme ajoute quelques points isolés dans une surface C. Comme ils sont isolés, les images Xn ne contiennent rien de visible dans C tant que n reste petit. En revanche, si n devient très élevé, on peut voir apparaître une surface visible dans C, de mesure non nulle, qui est souvent un artéfact indésirable. Mathématiquement, cela provient du fait qu'il existe un ensemble dénombrable de points, qui forment chacun un ensemble de mesure nulle, dont l'adhérence n'est pas de mesure nulle. On peut prendre par exemple les points de C à coordonnées rationnelles.
À la différence du volume, la fonction périmètre, ou plus précisément la mesure de la frontière, ne possède aucune continuité. Il est possible de construire deux figures très proches, au sens de Hausdorff, et de périmètres aussi éloignés qu'on le souhaite. À l'aide de la courbe de Koch, il est possible de construire une suite convergente de figures géométriques, dont les périmètres successifs divergent. Cette discontinuité, pour l'ingénieur, signifie qu'un algorithme uniquement fondé sur la distance de Hausdorff risque de ne pas respecter précisément les contours. C'est une des raisons qui poussent à utiliser des distances modifiées[9].
Ici, E désigne un espace euclidien.
- La somme de Minkowski est continue:
- Soit X et Y deux éléments de EH. L'objectif est de montrer que la somme de Minkowski est continue en (X, Y), c'est-à-dire :
- On choisit η égal à ε/2. Soit x + y un point de X + Y. Il existe un point x1 (resp. y1) de X1 (resp. Y1) à distance inférieure à ε/2 de X (resp. Y). Le point x1 + y1 de X1 + Y1 est nécessairement à une distance inférieure à ε de X + Y. On montre de même que tout point de X1 + Y1 est à une distance inférieure de ε à X + Y, ce qui montre la proposition.
Avant d'étudier la continuité de la mesure de Lebesgue, deux propositions intermédiaires simplifient la démonstration.
- Une suite de fermés bornés (Xn) de EH, décroissante au sens de l'inclusion, est convergente au sens de Hausdorff. La limite est l'intersection des éléments de la suite :
- Soit X l'intersection des éléments de la suite. L'ensemble X est borné, car il est inclus dans un ensemble borné, par exemple X1. L'ensemble est fermé car l'intersection de fermés est un fermé.
- Il ne reste plus qu'à montrer que si ε est un réel strictement positif, il existe un entier N tel que pour tout n plus grand que N, un élément de Xn n'est jamais à une distance plus grande de X que ε. Par contraposé, cela revient à montrer que tout élément y qui est à une distance plus grande de X que ε n'est dans aucun Xn, si n est plus grand que n, ou simplement que y n'est pas dans Yn. Comme y n'est pas dans X et que X est l'intersection des différents Xn, au moins l'un de ces ensembles ne le contient pas. Notons XN, l'un de ceux-là, si n est plus grand que N, Xn est inclus dans XN et ne peut contenir y. On en déduit que X contient la limite de la suite (Xn). Réciproquement la limite contient nécessairement X, qui est inclus dans chaque Xn.
Une fois connu le comportement d'une suite décroissante pour l'inclusion, on peut démontrer la convergence de sa mesure.
- Soit une suite de fermés bornés (Xn) d'éléments mesurables de EH, décroissante au sens de l'inclusion. La limite X est mesurable et la mesure de X est la limite de la suite des mesures de Xn :
- X est une intersection dénombrable d'ensembles mesurables, c'est un ensemble mesurable. Considérons la suite de fonctions (χn) de E dans R, où χn est la fonction qui à x associe 0, si x n'est pas élément de X1 ou si x est élément de Xn et 1 sinon. C'est une suite de fonctions croissantes positives et qui converge simplement vers une fonction χ. Le théorème de convergence monotone montre que :
- Ce qui, en termes de mesure ensembliste prend la forme suivante et démontre la proposition :
Les deux propositions intermédiaires permettent de conclure. Pour montrer la semi-continuité de la mesure, il suffit de montrer que si une suite Xn de figures mesurables de EH convergent vers une figure X alors la limite supérieure des mesures de Xn ne dépasse pas celle de X. C'est la méthode utilisée dans la démonstration.
- La mesure de Lebesgue est semi-continue supérieurement:
- On commence par construire une suite sur lequel il est possible d'appliquer les deux lemmes. Soit Yn l'adhérence de l'union de tous les Xp pour p supérieur à n. La suite (Yn) est bien une suite décroissante de fermés. Il reste à montrer qu'elle est bornée et que sa limite est bien la figure X. À partir d'un certain rang, tout élément de la suite Xp est inclus dans X + B, où B désigne la boule unité. L'union des Xp, si p dépasse ce rang est borné car X l'est. L'ensemble Yn est une union fini ensembles bornés, les premiers Xp et d'un autre ensemble borné, l'union des Xp, quand p dépasse le rang précédent, Yn est bien borné.
- Montrons que la limite de (Yn) est X. Soit x un élément de X et ε un réel strictement positif. Comme x est élément de l'ensemble X, il existe un N tel que pour tout n plus grand que N la boule de centre x et de rayon ε rencontre Xn. On en déduit que cette boule intersecte tous les éléments de la suite Yn. Cette propriété est vraie pour tout ε, ce qui montre que x est dans l'adhérence de toutes ces unions, et nécessairement dans chaque Yn, ce qui signifie qu'il appartient à l'ensemble limite. Supposons maintenant que y n'est pas dans X, il n'est pas non plus dans son adhérence car X est fermé, il existe un réel ε tel que la boule de centre y et de rayon 2ε ne rencontre pas X. Autrement dit, la boule de centre y et de rayon ε ne rencontre aucun membre d'une section finissante de la suite (Xn). Ceci montre qu'à partir d'un certain rang, y n'est pas dans l'adhérence de l'union de cette section finissante et n'est dans aucun Yn, si n est suffisamment élevé.
- Finalisons la démonstration. On cherche à prouver que, si ε est un réel strictement positif, il existe un entier N tel que si n est un entier plus grand que N, alors la mesure de Xn ne dépasse pas la somme de la mesure de X et de ε. La suite des mesures de Yn est une suite décroissante qui tend vers la mesure de X. À partir d'un certain rang N, elle ne dépasse pas somme de la mesure de X et de ε. Or aucune mesure de Xn ne dépasse celle de YN ce qui termine la démonstration :
Propriétés
La distance de Hausdorff sur E définit une distance sur l’ensemble K(E) des compacts non vides de E. K(E) est alors un espace métrique et sa topologie dépend de celle de E.
Si E est un espace complet, alors K(E) est complet[10]. Le théorème du point fixe de Banach s'applique donc. L'application du théorème du point fixe à K(E) est à la base de l'étude d'un système de fonctions itérées. On en déduit également le théorème de collage.
Si E est un espace compact, alors K(E) est compact[5].
Par conséquent, toute suite d’ensembles de K(E) décroissante au sens de l’inclusion admet une limite au sens de la distance de Hausdorff, à savoir
Propriété
Le calcul de la distance de Hausdorff peut se faire en utilisant une carte de distances.
Comparaison de squelettes
Selon Choi et Seidel (de)[11], la distance de Hausdorff telle qu'elle est définie n'est pas adaptée à la comparaison de formes par leur squelette pondéré. En effet, la squelettisation est une transformation très sensible aux perturbations apparaissant dans les formes. Même si la distance de Hausdorff de deux formes est très faible (les formes sont très similaires), leurs squelettes respectifs peuvent être très différents. Ainsi, la distance de Hausdorff entre des squelettes peut ne pas correspondre à la similarité de leur formes d'origine.
Afin de résoudre ce problème, Choi et Seidel ont proposé de remplacer la distance euclidienne par la distance hyperbolique dans le calcul de la distance de Hausdorff.
Notes et références
- Également appelée distance de Hausdorff-Pompeiu, par exemple dans (en) R. Tyrrell Rockafellar et Roger J.-B. Wets, Variational analysis, Springer, 1998 (ISBN 9783540627722) lire en ligne.
- (en) W. Rucklidge, Efficient Visual Recognition Using the Hausdorff Distance, LNCS 1173, Berlin, Springer, 1996 (ISBN 978-3-540-61993-2).
- Le choix de la compacité n'est pas toujours pris, on accepte alors tous les fermés bornés : (en) J. Henrikson, « Completeness and Total Boundedness of the Hausdorff Metric », MIT Undergraduate Journal of Mathematics, vol. 1, , p. 69-79 (lire en ligne).
- (en) Reinhard Klette et Azriel Rosenfeld (en), Digital Geometry: Geometric Methods for Digital Picture Analysis, Elsevier, (lire en ligne), p. 87.
- Jean Dieudonné, Éléments d'analyse, t. I : Fondements de l'analyse moderne, Paris, Gauthier-Villars, (ISBN 978-2-04-010410-8, OCLC 489875029), p. 61 (exercice 3).
- Par exemple dans un espace vectoriel normé, l'ensemble Xr est la somme de Minkowski de X et de rB, où B désigne la boule unité fermée.
- (en) Kenneth Falconer, Fractal Geometry: Mathematical Foundations and Applications, Wiley, , 2e éd. (lire en ligne), p. 124.
- Les deux dernières expressions sont utilisées par exemple dans (en) Andrejs Treibergs, Inequalities that Imply the Isoperimetric Inequality, University of Utah, 2002.
- Un exemple de cette nature est donné dans É. Baudrier et al., « Une méthode de comparaison d'images… », Colloque GRETSI, 11-14 septembre 2007, Troyes, p. 1309-1312.
- (en) Gerald Edgar, Measure, Topology, and Fractal Geometry, Springer, (OCLC 255688131, lire en ligne), p. 72.
- (en) Sung Woo Choi et Hans-Peter Seidel, « Hyperbolic Hausdorff distance for medial axis transform », Graphics Models, vol. 63, no 5, 2001, p. 369-384.
Voir aussi
Articles connexes
Bibliographie
- (en) Herbert Federer, Geometric Measure Theory, Springer, rééd. 1996 (ISBN 978-3-540-60656-7)
- (en) James Munkres, Topology; A First Course, Prentice Hall, 2e impr., 1997 (ISBN 978-9-81307682-2)