Arbre (théorie des graphes)
En théorie des graphes, un arbre est un graphe acyclique et connexe[1]. Sa forme évoque en effet la ramification des branches d'un arbre. Par opposition aux arbres simples, arbres binaires, ou arbres généraux de l'analyse d'algorithme ou de la combinatoire analytique[2], qui sont des plongements particuliers d'arbres (graphes) dans le plan, on appelle parfois les arbres (graphes) arbres de Cayley, car ils sont comptés par la formule de Cayley.
Un ensemble d'arbres est appelĂ© une forĂȘt.
DĂ©finition
DĂ©finition intuitive
Un graphe reprĂ©sente un ensemble de points, appelĂ©s sommets ou nĆuds, reliĂ©s ou non entre eux par des traits, appelĂ©s arĂȘtes.
Il s'agit donc d'un concept trÚs simple et d'un outil de modélisation trÚs général, utile dans de nombreux domaines.
- Par exemple une carte routiĂšre peut ĂȘtre modĂ©lisĂ©e par un graphe : les villes sont les sommets et on reliera deux sommets par un trait si et seulement si les villes qu'ils reprĂ©sentent ont une route les connectant directement.
- Un réseau social est un autre exemple : les utilisateurs sont les sommets et on reliera deux utilisateurs si et seulement s'ils sont chacun ami avec l'autre.
Ă noter que la disposition des sommets (position dans l'espace) n'a pas d'importance, ni mĂȘme la forme des arĂȘtes reliant Ă©ventuellement ces sommets (ligne droite, courbe etc). La seule chose qui compte est la relation entre les sommets.
Un arbre est un graphe qui vérifie les propriétés suivantes :
- ConnexitĂ© : il est toujours possible d'aller d'un sommet Ă l'autre par un chemin d'arĂȘtes. Dans le cas de la carte routiĂšre, cela revient Ă dire qu'il est toujours possible d'aller d'une ville Ă l'autre par la route.
- Acyclique : il est impossible de partir d'un sommet et d'y revenir sans rebrousser chemin Ă un moment.
DĂ©finition formelle
Un graphe est un couple tel que
- est un ensemble non vide quelconque dont les Ă©lĂ©ments sont appelĂ©s sommets ou nĆuds.
- . Les Ă©lĂ©ments de sont appelĂ©s les arĂȘtes.
Un arbre est un graphe tel que
- (Connexité) .
- (Acyclique) .
Définition par récurrence pour les arbres finis
Dans le cas d'arbres finis, c'est-à -dire quand l'ensemble des sommets est fini, il existe une définition alternative. En effet, il est possible de définir par récurrence l'ensemble des arbres finis dont les sommets appartiennent à un ensemble non vide donné E (fini ou infini) :
- si s est un Ă©lĂ©ment de E alors ({s},â ) est un arbre ;
- si (S, A) est un arbre alors (S âȘ {x}, A âȘ { {x,s} }) est un arbre pour x quelconque dans E n'appartenant pas Ă S et s appartenant Ă S ;
- aucun autre graphe n'est un arbre.
Autrement dit, l'ensemble des arbres dont les sommets appartiennent à E est le plus petit ensemble de graphes qui vérifie les deux premiÚres rÚgles ci-dessus.
Vocabulaire et notions associées
Il existe plusieurs notions trÚs utiles associées aux arbres, certaines sont données dans le tableau ci-dessous. Les notions données ici sont en fait toutes valables dans le cadre général de graphes. Dans le tableau on se fixe un arbre (S,A).
Notion | DĂ©finition intuitive | DĂ©finition formelle |
---|---|---|
Sommets adjacents | Deux sommets x et y sont adjacents s'ils sont reliĂ©s par une arĂȘte. | |
ArĂȘtes adjacentes | Deux arĂȘtes a1 et a2 sont adjacentes si elles partagent une extrĂ©mitĂ© en commun. | |
Degré d'un sommet x | Nombre de sommets adjacents à x. | |
Feuille | Sommet x dont le degré vaut 1. | |
Sommet interne | Sommet x dont le degré est strictement supérieur à 1. | |
Chemin d'arĂȘtes | Chemin constituĂ© de plusieurs arĂȘtes adjacentes mises bout Ă bout. | |
Distance entre deux sommets x et y | Taille du plus court chemin reliant x et y. | Si x et y sont distincts alors la distance d(x,y) vaut
et sinon la distance vaut 0. |
Types d'arbres
Il existe plusieurs types d'arbres qui peuvent ĂȘtre des cas particuliers d'arbres ou alors des arbres sur lesquels de la structure a Ă©tĂ© rajoutĂ©e.
Arbre fini
Un arbre fini est un arbre tel que l'ensemble de ses sommets est fini. Formellement, un arbre (S,A) est fini si S est de cardinal fini.
On peut remarquer les propriétés suivantes :
- Un arbre fini est un graphe connexe dont le nombre de sommets excĂšde le nombre d'arĂȘtes d'une unitĂ© exactement. Autrement dit le graphe (S,A) est un arbre si et seulement s'il est connexe et |S| = |A|+1.
- Un arbre fini est un graphe sans cycles dont le nombre de sommets excĂšde le nombre d'arĂȘtes d'une unitĂ© exactement. Autrement dit le graphe (S,A) est un arbre si et seulement s'il est acyclique et |S| = |A|+1.
Dans le cas particulier oĂč S est l'ensemble des entiers entre 1 et n alors on dit que l'arbre (S,A) est un arbre de Cayley (avec n sommets).
Arbre localement fini
Un arbre localement fini est un arbre tel que le degré de chaque sommet est fini. Formellement, un arbre (S,A) est localement fini si pour tout sommet x de S, deg(x) est fini.
Un arbre fini est toujours localement fini mais la réciproque n'est pas vraie. Le nombre de sommets d'un arbre localement fini est fini ou dénombrable.
Arbre enraciné
Un arbre enracinĂ© est simplement un arbre dont un sommet porte le statut particulier de racine. Formellement, un arbre enracinĂ© est un triplet (S,A,r) oĂč (S,A) est un arbre et r est un Ă©lĂ©ment de S appelĂ© racine.
Cette notion de racine permet de se munir d'un ordre de type ancĂȘtre/descendant entre les sommets de l'arbre. Les arbres enracinĂ©s sont utiles pour modĂ©liser la gĂ©nĂ©alogie d'une population.
Notion | DĂ©finition intuitive | DĂ©finition formelle |
---|---|---|
Hauteur d'un sommet x | Distance entre x et la racine r. | |
Enfant (ou fils) d'un sommet x | Sommet adjacent Ă x dont la hauteur vaut celle de x plus 1. | |
Parent d'un sommet x | Sommet tel que x est son enfant. | |
Descendant d'un sommet x[3] | Sommet qui découle d'une lignée parent/enfant partant de x. |
|
AncĂȘtre d'un sommet x[3] | Sommet tel que x est un descendant. |
|
ArĂȘte dĂ©coulant d'un sommet x | ArĂȘte qui relie x Ă un de ses enfants. |
Arbre étiqueté
Un arbre Ă©tiquetĂ© est un arbre dont les sommets (ou les arĂȘtes) possĂšdent une Ă©tiquette, c'est-Ă -dire un Ă©lĂ©ment d'un ensemble non vide quelconque (souvent les Ă©tiquettes sont des entiers ou des nombres rĂ©els).
Un arbre possĂšde toujours un Ă©tiquetage de sommets canonique : chaque sommet reçoit lui-mĂȘme en tant qu'Ă©tiquĂšte. Ainsi un arbre de Cayley de n sommets peut ĂȘtre vu comme un arbre Ă©tiquetĂ© de maniĂšre injective avec les entiers de 1 Ă n. Avec cet Ă©tiquetage canonique, les sommets ont tous des Ă©tiquettes diffĂ©rentes. L'avantage du concept d'Ă©tiquette est qu'il est possible de donner des Ă©tiquettes identiques Ă plusieurs sommets diffĂ©rents.
Arbre orienté
Un arbre orientĂ© est un arbre oĂč les arĂȘtes sont orientĂ©es, c'est-Ă -dire qu'elles ont une direction (elles partent d'un sommet pour arriver Ă un autre). Formellement un arbre orientĂ© est un couple tel que
- .
- Si on note alors est un arbre.
Un arbre enraciné possÚde deux orientations canoniques :
- les arĂȘtes sont orientĂ©es du descendant le plus Ă©loignĂ© de la racine vers le descendant le plus proche. Formellement, on prend .
- les arĂȘtes sont orientĂ©es du descendant le plus proche de la racine vers le descendant le plus Ă©loignĂ©. Formellement, on prend .
Un arbre orienté est toujours connexe par définition (on dit aussi faiblement connexe) mais n'est pas forcément fortement connexe. En fait le seul arbre orienté fortement connexe est l'arbre trivial qui ne possÚde qu'un seul sommet.
Arbre ordonné
Un arbre ordonné est un arbre enraciné tel que pour chaque sommet, un ordre total a été spécifié pour l'ensemble des enfants de ce sommet.
Combinatoire des arbres
Formule de Cayley
On peut dĂ©montrer qu'il y a nn â 2 arbres numĂ©rotĂ©s Ă n sommets. La dĂ©couverte de cette formule a Ă©tĂ© attribuĂ©e un temps Ă Arthur Cayley. Pour cette raison, les arbres comme graphes sont parfois appelĂ©s arbres de Cayley. Parmi de nombreuses dĂ©monstrations, citons celle qui utilise la bijection de Joyal : pour compter les Ă©lĂ©ments de l'ensemble des arbres de Cayley Ă n sommets, Joyal Ă©tablit une bijection entre et l'ensemble des applications de dans , notĂ© usuellement . On a ainsi
Orientation
Si on choisit un sommet r quelconque dans un arbre, il est possible d'enraciner l'arbre en r, c'est-Ă -dire orienter toutes les arĂȘtes de sorte qu'il existe un chemin de r Ă tous les autres nĆuds. On obtient alors un arbre enracinĂ©.
Arbre comme carte
Un arbre est un graphe planaire : un graphe qu'on peut dessiner dans le plan sans que ses arĂȘtes ne se touchent, sauf Ă leurs extrĂ©mitĂ©s. Un tel dessin est parfois appelĂ© plongement d'un graphe. La plupart des graphes planaires ont plusieurs plongements non homĂ©omorphes, au sens oĂč, pour au moins deux de ces plongements, il n'existe pas d'homĂ©omorphisme du plan entier vers lui-mĂȘme qui envoie un plongement sur l'autre plongement[4] : les classes d'homĂ©omorphismes de ces plongements sont appelĂ©s cartes planaires. Les classes d'homĂ©omorphismes des plongements des arbres (graphes) sont aussi appelĂ©s arbres (planaires, gĂ©nĂ©raux, de Catalan). Pour le dĂ©nombrement, il est commode de les munir d'une racine, Ă savoir une arĂȘte orientĂ©e : on parle alors d'arbres planaires enracinĂ©s. Ainsi le nombre d'arbres planaires enracinĂ©s Ă n arĂȘtes est le n-iĂšme nombre de Catalan :
Exemple : arbres Ă 3 arĂȘtes (et 4 sommets)
Les arbres planaires sont non Ă©tiquetĂ©s, alors que les arbres de Cayley le sont (les n sommets sont Ă©tiquetĂ©s de 1 Ă n). Par exemple, il y a deux arbres non enracinĂ©s et non Ă©tiquetĂ©s Ă 3 arĂȘtes, celui qui possĂšde un sommet de degrĂ© 3 et 3 feuilles (Ă©toile Ă 3 branches) et celui qui possĂšde 2 sommets de degrĂ© 2 et deux feuilles (ligne).
- L'Ă©toile peut ĂȘtre Ă©tiquetĂ©e de 4 maniĂšres (en choisissant librement l'Ă©tiquette du centre, parmi 4 possibilitĂ©s, le choix des Ă©tiquettes des 3 feuilles conduisant alors toujours au mĂȘme arbre). La ligne peut ĂȘtre Ă©tiquetĂ©e de 4!=24 maniĂšres, Ă©quivalentes 2 par 2 (par exemple 1234 et 4321 sont Ă©quivalents), donc de 12 maniĂšres en rĂ©alitĂ©, ce qui donne 12 + 4 = 16 = 42 arbres de Cayley Ă 3 arĂȘtes.
- L'Ă©toile peut ĂȘtre enracinĂ©e de deux maniĂšres : la racine peut ĂȘtre une des trois arĂȘtes, peu importe laquelle, les deux choix non homĂ©omorphes sont les choix d'une arĂȘte rentrante (vers le centre) ou sortante. La ligne peut ĂȘtre enracinĂ©e de 3 maniĂšres, extrĂ©mitĂ© sortante ou rentrante, ou arĂȘte centrale, d'oĂč 5 arbres planaires :
L'arbre peut ĂȘtre reprĂ©sentĂ© avec l'origine de l'arĂȘte racine en bas ou en haut (en informatique, la racine est souvent figurĂ©e en haut), et l'arĂȘte racine soit complĂštement Ă droite soit complĂštement Ă gauche (dans la figure ci-dessus l'arĂȘte racine commence au point rouge et aboutit au point bleu).
Notation de Neveu
Un arbre planaire enracinĂ© peut ĂȘtre dĂ©crit de maniĂšre non ambigĂŒe par la liste de ses sommets, chacun dĂ©signĂ© par une suite finie d'entiers, qui sont les positions, au sein de leur fratrie, des ancĂȘtres du sommet : c'est la notation de Neveu[5]. On utilise ici l'arbre gĂ©nĂ©alogique comme mĂ©taphore pour l'arbre planaire : le sommet 2|4|3 dĂ©signe le 3e fils du 4e fils du 2e fils de l'ancĂȘtre (l'ancĂȘtre Ă©tant lui-mĂȘme dĂ©signĂ© par la suite vide, notĂ©e ). Par convention, l'ancĂȘtre est le sommet initial de l'arĂȘte racine, et le sommet final de l'arĂȘte racine est le fils ainĂ© de l'ancĂȘtre : en tant que tel, il est notĂ© 1. La longueur de la suite associĂ©e Ă un sommet est la hauteur (ou la profondeur) du sommet, i.e. la distance entre ce sommet et le dĂ©but de la racine, qui reprĂ©sente l'ancĂȘtre : en filant la mĂ©taphore, un sommet de hauteur n reprĂ©sente un individu appartenant Ă la n-Ăšme gĂ©nĂ©ration de la population fondĂ©e par l'ancĂȘtre.
Les 5 arbres Ă 3 arĂȘtes sont ainsi dĂ©crits par les 5 ensembles de mots
Le parcours des sommets dans l'ordre lexicographique est alors le parcours en profondeur prĂ©fixĂ© (ou parcours prĂ©fixe) d'un arbre vu comme structure de donnĂ©es en informatique. Par ailleurs, Ă travers la notation de Neveu, on perçoit comment un arbre planaire encode commodĂ©ment une rĂ©alisation de processus de Galton-Watson avec extinction : l'arbre alĂ©atoire obtenu en encodant une rĂ©alisation de processus de Galton-Watson est parfois appelĂ© arbre de Galton-Watson. Rien ne s'oppose Ă dĂ©finir un arbre planaire infini Ă l'aide de la notation de Neveu, ce qui permet d'encoder les rĂ©alisations de processus de Galton-Watson oĂč la population ne s'Ă©teint pas.
Arbre et décomposition
Du fait des propriĂ©tĂ©s intĂ©ressantes des arbres notamment en informatique thĂ©orique, il est parfois utile de dĂ©composer des graphes gĂ©nĂ©raux en arbres. Ainsi on dĂ©finit par exemple la largeur arborescente en faisant des groupes de nĆuds organisĂ©s en arbre et l'arboricitĂ© en faisant une partition des arĂȘtes en forĂȘts.
Notes et références
- Plus gĂ©nĂ©ralement, les graphes non orientĂ©s acycliques, qui sont des rĂ©unions d'arbres disjoints, s'appellent des forĂȘts.
- cf. An Introduction to the Analysis of Algorithms, par Robert Sedgewick et Philippe Flajolet, Ch.6, particuliĂšrement page 329.
- La dĂ©finition donnĂ©e ici implique qu'un sommet n'est pas son propre descendant mais certaines dĂ©finitions incluent ce cas. Cette remarque reste valable pour la notion d'ancĂȘtre.
- En fait, on plonge les graphes planaires dans la sphÚre, vue comme le plan plus un point à l'infini, et on discute l'existence d'homéomorphismes de la sphÚre envoyant un plongement sur l'autre plongement.
- J. Neveu, « Arbres et processus de Galton-Watson », Ann. de l'IHP, vol. 22, no 2,â (lire en ligne) (section 2).
Voir aussi
Articles connexes
Bibliographie
- (en) Martin Aigner et GĂŒnter M. Ziegler, Proofs from THE BOOK, Berlin, Springer, , 3e Ă©d., 240 p. (ISBN 978-3-540-40460-6, BNF 39082186), p. 141-146
- Philippe Flajolet et Robert Sedgewick, An Introduction to the Analysis of Algorithms, Addison-Wesley, (ISBN 978-0-201-40009-0)