Distance de Hausdorff

En mathématiques, et plus précisément en géométrie, la distance de Hausdorff[1] est un outil topologique qui mesure les dissemblances entre deux sous-ensembles d’un espace métrique sous-jacent. Cette distance apparait dans deux contextes bien différents : dans le domaine du traitement de l'image et en mathématiques.

Felix Hausdorff (1868-1942) est le mathématicien à l'origine de la distance portant maintenant son nom.

Champs d'intervention de la distance de Hausdorff

Pour le traitement d'images, elle est un outil aux propriétés multiples, source de nombreux algorithmes. Elle indique si deux formes sont les mêmes et, si elles sont différentes, la distance quantifie ces dissemblances. En dimension 2, la distance de Hausdorff permet de numériser une image ou encore de reconnaître une forme. Cet outil, issu des mathématiques pures, n'est pas toujours adapté pour les traitements industriels. Par exemple, deux formes aux contours de longueurs différentes peuvent être proches, au sens de cette distance. Pour ces raisons, on utilise parfois des variantes, comme la distance de Hausdorff modifiée.

Pour le mathématicien, cette distance est à la géométrie ce que la norme de la convergence uniforme est à l'analyse. La convergence uniforme, en analyse fonctionnelle, procède d'une démarche qui consiste à travailler sur un nouvel ensemble. On n'étudie plus le comportement des nombres, réels ou complexes, sur lesquels est définie la fonction, mais celui d'un ensemble de fonctions. Typiquement, on cherche à résoudre une question à l'aide d'une suite de fonctions, qui sont vues comme des points d'un vaste espace, et qui convergent vers la solution. Les séries de Fourier procèdent d'une démarche de cette nature. Il est tentant d'aborder un problème de géométrie de la même manière. Un point de l'espace devient un solide, on recherche à trouver une solution à l'aide d'une suite de solides convergeant vers la solution. La notion de convergence demande une topologie, celle induite par la distance de Hausdorff offre une réponse.

Un exemple d'application est le problème isopérimétrique dans le plan euclidien. La question est de savoir quelle est la surface de plus grande aire possible, pour un périmètre donné, la réponse est le disque. Une méthode consiste à construire une suite, par exemple de polygones, qui converge vers la solution.

Les premières questions qui se posent sont un peu de même nature que celles de l'analyse fonctionnelle. Dans quel cas l'espace est complet, quels sont les compacts, dispose-t-on d'applications continues, existe-t-il des sous-espaces aisément manipulables et denses, un peu à l'image des polynômes ? Les réponses sont suffisamment positives pour que la démarche soit féconde. Si l'espace sous-jacent est complet, l'espace utilisant la distance de Hausdorff l'est aussi. Les compacts, si l'espace métrique est euclidien, sont les ensembles fermés bornés, les polygones forment un ensemble dense, enfin la somme de Minkowski est continue.

Dans ce domaine, le travail mathématique a un effet direct sur la mise au point d'algorithmes répondant spécifiquement aux besoins de l'industrie.

Construction de la distance

Approche intuitive

Distance de Hausdorff entre deux ensembles C et D.

L'idée intuitive de Hausdorff est de définir la distance entre deux ensembles C et D comme indiqué sur la figure de droite. C représente le carré rouge et D le disque bleu de même surface et de même centre. À l'endroit où les deux figures coïncident, la couleur est violette, sinon elle est bleue ou rouge. Les différences entre les deux figures se matérialisent sous la forme de 4 lunules bleues et 4 presque triangles rouges.

On considère le point du carré le plus éloigné du disque, c'est un sommet du carré, à une distance a du disque. On considère ensuite le point du disque le plus éloigné du carré, c'est le sommet de la lunule et sa distance au carré est notée b. La distance de Hausdorff est la plus grande valeur des deux, en l'occurrence a, pour l'exemple choisi. Les valeurs a et b sont parfois appelées distance de Hausdorff relative.

La distance de Hausdorff, pour l'ingénieur en imagerie, est un indicateur de similarité entre deux formes géométriques, c'est la raison même de son utilité[2].

Pour que cette distance puisse vérifier le premier axiome, c'est-à-dire celui indiquant que la distance entre deux figures distinctes n'est jamais nulle, on ne peut considérer tous les ensembles. Deux boules, une ouverte et l'autre fermée, de même centre et de même rayon seraient deux ensembles différents à une distance nulle. Une autre raison pousse à limiter les ensembles considérés. La distance entre une droite et une boule serait infinie, ce qui n'est pas possible d'après les axiomes de la distance. Pour cette raison, Hausdorff limite l'ensemble aux bornés. Cette distance est souvent utilisée pour étudier des géométries proches de celles d'un espace de dimension finie, pour cette raison, on impose parfois aux ensembles d'être compacts[3]. Enfin, la distance d’un point à l'ensemble vide n'est pas bien définie (l’application rigoureuse de la définition la voudrait infinie[4]) ; pour cette raison, l'ensemble vide n'est pas considéré.

Formulations de la distance

Il existe différentes manières d'exprimer la distance d(X, Y) entre deux ensembles fermés bornés non vides X et Y d'un espace métrique (E, δ). La première correspond à la définition du paragraphe précédent :

d(X,Y):=\max \;\{\sup _{y\in Y}\delta (X,y),\quad \sup _{x\in X}\delta (x,Y)\}=\max \;\{\sup _{y\in Y}\inf _{x\in X}\delta (x,y),\quad \sup _{x\in X}\inf _{y\in Y}\delta (x,y)\}

[5].

Une autre formulation consiste à considérer les ensembles X_r et Y_r, où r est un réel positif. Ici, X_r (resp. Y_r) désigne l'ensemble des points de E à une distance inférieure ou égale à r de X (resp. Y)[6], aussi appelés r-voisinages de X et de Y[7]. La distance prend alors la forme suivante[8] :

d(X,Y)=\min\{r\in \mathbb {R} _{+}\mid X\subset Y_{r}\quad {\text{et}}\quad Y\subset X_{r}\}.

Définition formelle

Soient (E, δ) un espace métrique et E_H l'ensemble des fermés bornés non vides de E. La distance de Hausdorff d sur E_H est l'application d, de E_H × E_H dans ℝ₊, définie par la formule ci-dessus.

Ces notations sont utilisées dans tout le reste de l'article.

Remarque : la distance δ s'applique à deux points, ou à un point et une partie, tandis que la distance de Hausdorff d s'applique à deux parties (fermées, bornées et non vides). Par exemple dans ℝ :

\delta (0,[-1,1])=0\quad {\text{et}}\quad d(\{0\},[-1,1])=1.

Si la distance sur E est bornée, la distance de Hausdorff est définie sur tous les fermés non vides de E (tous sont bornés). Dans le cas contraire, la « distance » étendue aux fermés non bornés peut prendre des valeurs infinies.

Il est également possible de définir la distance de Hausdorff entre deux sous-ensembles non fermés de E comme la distance de Hausdorff entre leurs adhérences. On munit ainsi l’ensemble des sous-ensembles de E d’un écart (puisque deux sous-ensembles distincts mais partageant la même adhérence auront une distance de Hausdorff nulle).

Exemple

La distance entre deux itérés successifs d'un triangle de Sierpinski égale ici à 1.

La distance de Hausdorff entre un triangle et sa frontière est égale au rayon du cercle inscrit dans le triangle. L'application au calcul de la distance de Hausdorff entre deux itérés successifs de la suite classique de compacts convergeant vers le triangle de Sierpinski est immédiate. On peut multiplier les exemples avec d'autres attracteurs de systèmes de fonctions itérées.

Continuité

Ensemble dense

Exemple d'image matricielle.

Les polygones et les carrés choisis sur une grille définissent deux ensembles denses.

L'existence d'ensembles denses intéresse autant le mathématicien que l'ingénieur en traitement d'images. Pour l'ingénieur, un sous ensemble dense permet d'approximer n'importe quel point de E_H (le terme point désigne un élément de l'ensemble étudié, ici des figures géométriques). Ainsi F_H est dense dans E_H lorsque pour tout point X de E_H et pour tout nombre réel ε strictement positif, il existe un point Y de F_H à une distance inférieure à ε de X.

L'ensemble dense est choisi plus petit pour pouvoir être travaillé plus commodément. La figure de droite illustre deux ensembles denses, si E est un espace euclidien, comme le plan pour le traitement d'images. Le premier exemple correspond aux pixels. L'espace est quadrillé par un ensemble de droites (des hyperplans en dimension quelconque) dont les directions sont toutes orthogonales à un vecteur d'une base orthonormale et les droites parallèles entre elles sont régulièrement espacées. Cette grille définit un ensemble de petits carrés (d'hypercubes si la dimension est quelconque), le premier ensemble dense est celui constitué d'un ensemble fini de petits carrés de cette nature. Les ingénieurs parlent d'image matricielle

En mathématiques, on choisit souvent le pas de la grille égal à 1/2ⁿ, où n est un entier quelconque, il existe ainsi une infinité de « tailles de grille » possibles, de plus en plus précises à mesure que n augmente. Une forme, par exemple le cercle violet sur la figure de droite, est approximée par ces petits carrés. Un algorithme consiste à sélectionner un petit carré s'il possède une intersection non vide avec la figure qu'il doit approximer.

Une deuxième méthode consiste à choisir comme ensemble dense les polygones, ou encore les polyèdres dans le cas d'une dimension quelconque. Pour un ingénieur, beaucoup moins d'informations sont nécessaires pour décrire une figure géométrique avec cette méthode. Cette approche permet, soit un gain de temps, soit une précision accrue. La deuxième figure de droite est une approximation polygonale, aussi appelée image vectorielle. Pour le mathématicien, les polyèdres forment un ensemble contenant strictement le précédent, il est donc naturel qu'il soit dense, lui aussi.

Il est parfois utile de conserver la convexité, une fois encore, les polyèdres convexes forment un ensemble dense parmi les convexes de E_H.

Démonstration

Ici, E désigne un espace euclidien de dimension d. Ici, G_H désigne l'ensemble hypercubes fermés de la grille et d'arêtes de longueur 2^-n et X désigne un fermé borné de E_H. La démonstration est un peu plus riche que celle annoncée dans le paragraphe.

Il existe une suite de polygones (P_n), décroissante pour l'inclusion, telle que P_n contienne X et telle que la distance entre X et P_n soit inférieure à (d/2²ⁿ)^1/2 :

On considère l'ensemble des hypercubes de G_n ayant une intersection non nulle avec X, l'union des éléments de cet ensemble est noté P_n. Deux des ensembles sont illustrés sur la figure de droite. La figure X est un polygone dont la frontière est dessinée en noir. Le premier ensemble illustré correspond aux carrés bleus, le deuxième, deux fois plus fin et qui cache en partie les carrés bleus, est illustré par la couleur rouge.

La décroissance de la suite ainsi que le fait que P_n contienne X sont garantis par construction.

La plus grande distance possible est obtenue si X intersecte un hypercube uniquement en un sommet, le sommet le plus éloigné est le point de P_n le plus éloigné de X, la distance est celle de la plus grande diagonale, égale à (d/2²ⁿ)^1/2.

La distance entre P_n et X tend vers 0, par définition de la limite, 4X est bien celle de la suite des polygones.

Si X est convexe, la suite des enveloppes convexes (K_n) des polygones P_n est une suite décroissante pour l'inclusion, tel que Q_n contienne X et tel que la distance entre X et Q_n soit inférieure à (d/2^2n-2)^1/2 :

Le raisonnement est le même que le précédent, il suffit de remarquer qu'ajouter une couche de petits cubes construit une figure qui contient l'enveloppe convexe K_n.

Fonctions continues

La courbe de Koch permet de construire une suite convergente pour la distance de Hausdorff et dont le périmètre diverge.

Si une fonction est continue, ce qu'elle représente est bien conservée par de petites modifications. Un exemple essentiel est la somme de Minkowski. À deux ensembles X et Y, on associe l'ensemble des vecteurs de la forme x + y où x est élément de X et y de Y. En imagerie, sommer une figure avec un petit disque permet d'atténuer les contours. En mathématiques pures, la somme de Minkowski intervient dans de nombreux théorèmes isopérimétriques. Le fait que C soit un compact convexe implique l'égalité C + C = 2C (ce qui n'est pas une évidence, la première partie correspondant à une somme de Minkowski et la deuxième à une homothétie de rapport 2). C'est un élément clé de la démonstration du théorème de Minkowski, utilisé en théorie algébrique des nombres.

Un deuxième exemple est donné par la fonction mesure, si E est un espace euclidien. La mesure de Lebesgue associe à une figure son volume. Elle possède une forme de continuité pour la distance de Hausdorff, elle est semi continue supérieurement. Cela indique que si un algorithme construit une figure à l'aide d'approximations de plus en plus précises, la figure finale possède une mesure qui ne fait pas de saut vers le bas. Mathématiquement, on le modélise par une suite (X_n) de figures qui converge vers une figure X, au sens de Hausdorff. Le volume de la figure X n'est pas beaucoup plus petit que celui de X_n, si n est grand. Si μ désigne la mesure de Lebesgue, c'est-à-dire la fonction qui à une figure associe son volume :

\limsup _{n\to \infty }\mu (X_{n})\leq \mu (X).

S'il n'existe pas de possibilité de saut vers le bas, il peut y en avoir vers le haut. On peut s'en rendre compte en construisant une image à l'aide d'étapes successives, notées (X_n). On suppose que l'image est composée de pixels trop petits pour être visibles. À chaque étape, l'algorithme ajoute quelques points isolés dans une surface C. Comme ils sont isolés, les images X_n ne contiennent rien de visible dans C tant que n reste petit. En revanche, si n devient très élevé, on peut voir apparaître une surface visible dans C, de mesure non nulle, qui est souvent un artéfact indésirable. Mathématiquement, cela provient du fait qu'il existe un ensemble dénombrable de points, qui forment chacun un ensemble de mesure nulle, dont l'adhérence n'est pas de mesure nulle. On peut prendre par exemple les points de C à coordonnées rationnelles.

À la différence du volume, la fonction périmètre, ou plus précisément la mesure de la frontière, ne possède aucune continuité. Il est possible de construire deux figures très proches, au sens de Hausdorff, et de périmètres aussi éloignés qu'on le souhaite. À l'aide de la courbe de Koch, il est possible de construire une suite convergente de figures géométriques, dont les périmètres successifs divergent. Cette discontinuité, pour l'ingénieur, signifie qu'un algorithme uniquement fondé sur la distance de Hausdorff risque de ne pas respecter précisément les contours. C'est une des raisons qui poussent à utiliser des distances modifiées[9].

Démonstrations

Ici, E désigne un espace euclidien.

La somme de Minkowski est continue:

Soit X et Y deux éléments de E_H. L'objectif est de montrer que la somme de Minkowski est continue en (X, Y), c'est-à-dire :

\forall \epsilon >0\quad \exists \eta >0\quad \forall X_{1},Y_{2}\in E_{H}\quad d(X,X_{1})\leq \eta \quad {\text{et}}\quad d(Y,Y_{1})\leq \eta \;\Rightarrow \;d(X+Y,X_{1}+Y_{1})\leq \epsilon

On choisit η égal à ε/2. Soit x + y un point de X + Y. Il existe un point x₁ (resp. y₁) de X₁ (resp. Y₁) à distance inférieure à ε/2 de X (resp. Y). Le point x₁ + y₁ de X₁ + Y₁ est nécessairement à une distance inférieure à ε de X + Y. On montre de même que tout point de X₁ + Y₁ est à une distance inférieure de ε à X + Y, ce qui montre la proposition.

Avant d'étudier la continuité de la mesure de Lebesgue, deux propositions intermédiaires simplifient la démonstration.

Une suite de fermés bornés (X_n) de E_H, décroissante au sens de l'inclusion, est convergente au sens de Hausdorff. La limite est l'intersection des éléments de la suite :

Soit X l'intersection des éléments de la suite. L'ensemble X est borné, car il est inclus dans un ensemble borné, par exemple X₁. L'ensemble est fermé car l'intersection de fermés est un fermé.

Il ne reste plus qu'à montrer que si ε est un réel strictement positif, il existe un entier N tel que pour tout n plus grand que N, un élément de X_n n'est jamais à une distance plus grande de X que ε. Par contraposé, cela revient à montrer que tout élément y qui est à une distance plus grande de X que ε n'est dans aucun X_n, si n est plus grand que n, ou simplement que y n'est pas dans Y_n. Comme y n'est pas dans X et que X est l'intersection des différents X_n, au moins l'un de ces ensembles ne le contient pas. Notons X_N, l'un de ceux-là, si n est plus grand que N, X_n est inclus dans X_N et ne peut contenir y. On en déduit que X contient la limite de la suite (X_n). Réciproquement la limite contient nécessairement X, qui est inclus dans chaque X_n.

Une fois connu le comportement d'une suite décroissante pour l'inclusion, on peut démontrer la convergence de sa mesure.

Soit une suite de fermés bornés (X_n) d'éléments mesurables de E_H, décroissante au sens de l'inclusion. La limite X est mesurable et la mesure de X est la limite de la suite des mesures de X_n :

X est une intersection dénombrable d'ensembles mesurables, c'est un ensemble mesurable. Considérons la suite de fonctions (χ_n) de E dans R, où χ_n est la fonction qui à x associe 0, si x n'est pas élément de X₁ ou si x est élément de X_n et 1 sinon. C'est une suite de fonctions croissantes positives et qui converge simplement vers une fonction χ. Le théorème de convergence monotone montre que :

\lim _{n\to \infty }\int _{E}\chi _{n}=\int _{E}\chi

Ce qui, en termes de mesure ensembliste prend la forme suivante et démontre la proposition :

\lim _{n\to \infty }\mu (X_{1})-\mu (X_{n})=\mu (X_{1})-\mu (X)\;

Les deux propositions intermédiaires permettent de conclure. Pour montrer la semi-continuité de la mesure, il suffit de montrer que si une suite X_n de figures mesurables de E_H convergent vers une figure X alors la limite supérieure des mesures de X_n ne dépasse pas celle de X. C'est la méthode utilisée dans la démonstration.

La mesure de Lebesgue est semi-continue supérieurement:

On commence par construire une suite sur lequel il est possible d'appliquer les deux lemmes. Soit Y_n l'adhérence de l'union de tous les X_p pour p supérieur à n. La suite (Y_n) est bien une suite décroissante de fermés. Il reste à montrer qu'elle est bornée et que sa limite est bien la figure X. À partir d'un certain rang, tout élément de la suite X_p est inclus dans X + B, où B désigne la boule unité. L'union des X_p, si p dépasse ce rang est borné car X l'est. L'ensemble Y_n est une union fini ensembles bornés, les premiers X_p et d'un autre ensemble borné, l'union des X_p, quand p dépasse le rang précédent, Y_n est bien borné.

Montrons que la limite de (Y_n) est X. Soit x un élément de X et ε un réel strictement positif. Comme x est élément de l'ensemble X, il existe un N tel que pour tout n plus grand que N la boule de centre x et de rayon ε rencontre X_n. On en déduit que cette boule intersecte tous les éléments de la suite Y_n. Cette propriété est vraie pour tout ε, ce qui montre que x est dans l'adhérence de toutes ces unions, et nécessairement dans chaque Y_n, ce qui signifie qu'il appartient à l'ensemble limite. Supposons maintenant que y n'est pas dans X, il n'est pas non plus dans son adhérence car X est fermé, il existe un réel ε tel que la boule de centre y et de rayon 2ε ne rencontre pas X. Autrement dit, la boule de centre y et de rayon ε ne rencontre aucun membre d'une section finissante de la suite (X_n). Ceci montre qu'à partir d'un certain rang, y n'est pas dans l'adhérence de l'union de cette section finissante et n'est dans aucun Y_n, si n est suffisamment élevé.

Finalisons la démonstration. On cherche à prouver que, si ε est un réel strictement positif, il existe un entier N tel que si n est un entier plus grand que N, alors la mesure de X_n ne dépasse pas la somme de la mesure de X et de ε. La suite des mesures de Y_n est une suite décroissante qui tend vers la mesure de X. À partir d'un certain rang N, elle ne dépasse pas somme de la mesure de X et de ε. Or aucune mesure de X_n ne dépasse celle de Y_N ce qui termine la démonstration :

\forall n\geq N\quad \mu (X_{n})\leq \mu (Y_{N})\leq \mu (X)+\epsilon \quad {\text{et}}\quad \limsup _{n\to \infty }\mu (X_{n})\leq \mu (X)

Propriétés

La distance de Hausdorff sur E définit une distance sur l’ensemble K(E) des compacts non vides de E. K(E) est alors un espace métrique et sa topologie dépend de celle de E.

Si E est un espace complet, alors K(E) est complet[10]. Le théorème du point fixe de Banach s'applique donc. L'application du théorème du point fixe à K(E) est à la base de l'étude d'un système de fonctions itérées. On en déduit également le théorème de collage.

Si E est un espace compact, alors K(E) est compact[5].

Par conséquent, toute suite $(A_{n})_{n\in \mathbb {N} }$ d’ensembles de K(E) décroissante au sens de l’inclusion admet une limite au sens de la distance de Hausdorff, à savoir $\bigcap _{n\in \mathbb {N} }{A_{n}}.$

Propriété

Le calcul de la distance de Hausdorff peut se faire en utilisant une carte de distances.

Comparaison de squelettes

Selon Choi et Seidel (de)[11], la distance de Hausdorff telle qu'elle est définie n'est pas adaptée à la comparaison de formes par leur squelette pondéré. En effet, la squelettisation est une transformation très sensible aux perturbations apparaissant dans les formes. Même si la distance de Hausdorff de deux formes est très faible (les formes sont très similaires), leurs squelettes respectifs peuvent être très différents. Ainsi, la distance de Hausdorff entre des squelettes peut ne pas correspondre à la similarité de leur formes d'origine.

Afin de résoudre ce problème, Choi et Seidel ont proposé de remplacer la distance euclidienne par la distance hyperbolique dans le calcul de la distance de Hausdorff.

Notes et références

Également appelée distance de Hausdorff-Pompeiu, par exemple dans (en) R. Tyrrell Rockafellar et Roger J.-B. Wets, Variational analysis, Springer, 1998 (ISBN 9783540627722) lire en ligne.
(en) W. Rucklidge, Efficient Visual Recognition Using the Hausdorff Distance, LNCS 1173, Berlin, Springer, 1996 (ISBN 978-3-540-61993-2).
Le choix de la compacité n'est pas toujours pris, on accepte alors tous les fermés bornés : (en) J. Henrikson, « Completeness and Total Boundedness of the Hausdorff Metric », MIT Undergraduate Journal of Mathematics, vol. 1,‎ 1999, p. 69-79 (lire en ligne).
(en) Reinhard Klette et Azriel Rosenfeld (en), Digital Geometry: Geometric Methods for Digital Picture Analysis, Elsevier, 2004 (lire en ligne), p. 87.
Jean Dieudonné, Éléments d'analyse, t. I : Fondements de l'analyse moderne, Paris, Gauthier-Villars, 1979 (ISBN 978-2-04-010410-8, OCLC 489875029), p. 61 (exercice 3).
Par exemple dans un espace vectoriel normé, l'ensemble X_r est la somme de Minkowski de X et de rB, où B désigne la boule unité fermée.
(en) Kenneth Falconer, Fractal Geometry: Mathematical Foundations and Applications, Wiley, 2003, 2^e éd. (lire en ligne), p. 124.
Les deux dernières expressions sont utilisées par exemple dans (en) Andrejs Treibergs, Inequalities that Imply the Isoperimetric Inequality, University of Utah, 2002.
Un exemple de cette nature est donné dans É. Baudrier et al., « Une méthode de comparaison d'images… », Colloque GRETSI, 11-14 septembre 2007, Troyes, p. 1309-1312.
(en) Gerald Edgar, Measure, Topology, and Fractal Geometry, Springer, 2008 (OCLC 255688131, lire en ligne), p. 72.
(en) Sung Woo Choi et Hans-Peter Seidel, « Hyperbolic Hausdorff distance for medial axis transform », Graphics Models, vol. 63, n^o 5, 2001, p. 369-384.

Voir aussi

Bibliographie

(en) Herbert Federer, Geometric Measure Theory, Springer, rééd. 1996 (ISBN 978-3-540-60656-7)
(en) James Munkres, Topology; A First Course, Prentice Hall, 2^e impr., 1997 (ISBN 978-9-81307682-2)

Lien externe

(en) Hausdorff distance between convex polygons

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.