Graphe aléatoire
En mathĂ©matiques, un graphe alĂ©atoire est un graphe gĂ©nĂ©rĂ© par un processus alĂ©atoire. Le premier modĂšle de graphes alĂ©atoires a Ă©tĂ© popularisĂ© par Paul ErdĆs et AlfrĂ©d RĂ©nyi dans une sĂ©rie d'articles publiĂ©s entre 1959 et 1968[1].
Les deux modĂšles de base d'ErdĆs et RĂ©nyi
Il y a deux modĂšles d'ErdĆs et RĂ©nyi, formellement diffĂ©rents, mais Ă©troitement liĂ©s : le graphe alĂ©atoire binomial et le graphe alĂ©atoire uniforme. Dans les deux modĂšles, il s'agit d'un graphe alĂ©atoire non orientĂ©, qui n'a ni boucles, ni arĂȘtes multiples. On utilise les notations suivantes :
- l'ensemble des sommets est {1, 2, 3, ..., n} noté par la suite ;
- les arĂȘtes potentiellement prĂ©sentes sont les n(nâ1)/2 parties Ă deux Ă©lĂ©ments de ; l'ensemble de ces arĂȘtes est parfois notĂ© Il sera notĂ© toutefois J pour des raisons de commoditĂ© typographique, et de cohĂ©rence avec l'article sur l'inĂ©galitĂ© de Harris.
Le graphe aléatoire binomial
Dans ce modĂšle, souvent notĂ© chacune des n(nâ1)/2 arĂȘtes potentielles est prĂ©sente avec probabilitĂ© p, et absente avec probabilitĂ© 1-p, cela indĂ©pendamment du statut des autres arĂȘtes. Le cas p = 0,5 a Ă©tĂ© Ă©tudiĂ© par ErdĆs dĂšs 1947[2]. Le nombre Np d'arĂȘtes de suit la loi binomiale de paramĂštres n(nâ1)/2 et p.
Le graphe aléatoire uniforme
Dans ce modĂšle, souvent notĂ© on choisit uniformĂ©ment un sous-ensemble de M arĂȘtes parmi les n(nâ1)/2 arĂȘtes possibles. Si on considĂšre un graphe G Ă n sommets possĂšde M arĂȘtes, la probabilitĂ© d'obtenir G est donnĂ©e par
C'est le modĂšle qui est principalement Ă©tudiĂ© dans la sĂ©rie d'articles fondateurs publiĂ©s par ErdĆs et RĂ©nyi entre 1959 et 1968[3].
Les deux processus aléatoires à valeurs graphe
- On peut partir d'un graphe sans arĂȘtes, donc totalement dĂ©connectĂ©, et ajouter une arĂȘte tirĂ©e au hasard uniformĂ©ment, puis une autre, etc., sans remise. On obtient ainsi une suite croissante (au sens de l'inclusion de l'ensemble des arĂȘtes), de 1 + n(nâ1)/2 graphes alĂ©atoires, qui forme un processus Ă temps discret Ă valeurs dans l'ensemble des graphes. Chaque terme de la suite est un graphe alĂ©atoire uniforme dĂ©fini Ă la section prĂ©cĂ©dente. Un avantage de cette construction est de voir coexister diffĂ©rents graphes alĂ©atoires de paramĂštres M diffĂ©rents, sur le mĂȘme espace probabilisĂ©, et de pouvoir ainsi comparer leurs caractĂ©ristiques, non pas en moyenne ou en loi, mais pour chaque Ă©lĂ©ment Ï de l'espace probabilisĂ© considĂ©rĂ©. Cela permet de raisonner par couplage.
- On peut aussi associer Ă chaque arĂȘte e de J une variable alĂ©atoire Te, le poids de l'arĂȘte, de sorte que la famille (Te)e â J soit une famille de variables alĂ©atoires i.i.d., par exemple de loi uniforme sur l'intervalle [0, 1]. On note alors le graphe formĂ© des arĂȘtes dont le poids est infĂ©rieur Ă p. Pour chaque arĂȘte, cela se produit avec probabilitĂ©
- On obtient ainsi une famille croissante, de graphes alĂ©atoires, qui forme un processus Ă temps continu, Ă valeurs dans l'ensemble des graphes. Cette famille est croissante au sens de l'inclusion de l'ensemble des arĂȘtes : une arĂȘte e prĂ©sente dans est aussi prĂ©sente dans puisque Chaque terme de la famille de graphes est un graphe alĂ©atoire binomial dĂ©fini prĂ©cĂ©demment.
MĂ©taphore. On peut imaginer les sommets du graphe comme n Ăźles sur un lac, communicant Ă l'aide de passerelles (les arĂȘtes e), submergĂ©es Ă des profondeurs respectives Te sous la surface de l'eau. Si le lac se vide de son eau graduellement, on va voir Ă©merger progressivement les passerelles, et des composantes connexes regroupant de plus en plus d'Ăźles vont se former.
Liens entre les deux modĂšles
En vertu du thĂ©orĂšme central limite, ou de l'inĂ©galitĂ© de Hoeffding, la loi binomiale est trĂšs concentrĂ©e autour de son espĂ©rance. Plus prĂ©cisĂ©ment, le nombre d'arĂȘtes Np d'un graphe alĂ©atoire de loi est donc trĂšs proche de surtout si cette derniĂšre quantitĂ© est grande devant n : en effet[4],
De plus, la loi conditionnelle de sachant que Np = M est précisément Pour cette raison, si M est proche de , ou, de maniÚre équivalente, si
il est généralement admis (et souvent démontré[5]) que les deux modÚles et ont des propriétés trÚs proches.
En poussant plus loin, notons T(k) la k-iĂšme valeur de la suite une fois que cette derniĂšre suite est rangĂ©e dans l'ordre croissant : la suite est appelĂ©e la suite des statistiques d'ordre de la suite Lorsque p prend la valeur alĂ©atoire T(M), alors est exactement Pour corroborer les observations prĂ©cĂ©dentes, notons que T(M) est trĂšs proche de au sens oĂč, en consĂ©quence de rĂ©sultats cĂ©lĂšbres de Donsker et de Kolmogorov[6], la probabilitĂ©
satisfait
les 1er et 4e termes étant les queues de distribution des lois de Rayleigh et de Kolmogorov, respectivement : en résumé, le supremum (lorsque M varie) des erreurs est de l'ordre de 1/n.
Ordre et croissance
Un graphe peut ĂȘtre vu comme une partie de l'ensemble J des arĂȘtes, donc l'espace probabilisĂ© est ici l'ensemble Ω des parties de J, qu'on peut parfois identifier Ă {0,1}J. Cette identification est en particulier utile lorsqu'on veut appliquer l'inĂ©galitĂ© de Harris.
- L'inclusion est une relation d'ordre partielle sur Ω.
- Comme d'ordinaire, une application X définie sur Ω, à valeurs réelles, est dite croissante si
- Une partie A de Ω est dite croissante si
- De maniÚre équivalente, une partie A de Ω est dite croissante si sa fonction indicatrice est croissante.
- La propriété de décroissance d'une application ou d'une partie a une définition analogue.
Parmi les propriétés et paramÚtres d'un graphe,
- la connexitĂ© est croissante, c.-Ă -d. la partie A de Ω constituĂ©e de tous les graphes connexes, est une partie croissante de Ω : si on ajoute une arĂȘte Ă un graphe connexe, le graphe ainsi obtenu est encore connexe ;
- la planaritĂ© est dĂ©croissante : si on enlĂšve une arĂȘte Ă un graphe planaire, le graphe ainsi obtenu est encore planaire ;
- le nombre chromatique est croissant ;
- le nombre de stabilité est décroissant ;
- la propriété triangle-free est décroissante.
On a l'inégalité suivante :
InĂ©galitĂ© de Harris â Dans le cadre du graphe alĂ©atoire binomial,
- soit deux variables aléatoires X et Y croissantes sur Ω. Alors
- soit deux parties croissantes A et B de Ω. Alors
- Cela revient à dire qu'il y a une corrélation positive entre les variables concernées, puisqu'on peut reformuler la premiÚre inégalité sous la forme suivante en utilisant la covariance :
- L'inégalité vaut aussi pour des variables ou des parties décroissantes, mais le sens des inégalités change lorsque les variables ou les parties concernées ont des sens de monotonie opposés.
La connexité
Le seuil de connexité
ThĂ©orĂšme (ErdĆs, RĂ©nyi, 1960) â Posons an = np(n) â ln n, ou encore :
- Si alors
- Si alors
On dit que ln(n)/n est un seuil Ă©troit pour la propriĂ©tĂ© de connexitĂ©, l'Ă©troitesse faisant rĂ©fĂ©rence au fait que la propriĂ©tĂ© est vĂ©rifiĂ©e mĂȘme si tend vers l'infini strictement moins vite que
ĂnumĂ©ration des points isolĂ©s
Il est plus facile (plus probable) de rĂ©ussir Ă couper les n â 1 connexions entre un point et son complĂ©mentaire, que les k(n â k) connexions entre un groupe de k points et son complĂ©mentaire, car la fonction f(k) = k(n â k) augmente trĂšs rapidement au voisinage de 1, d'oĂč, lorsque k augmente, beaucoup plus d'arĂȘtes Ă couper, et une probabilitĂ© bien plus faible de rĂ©ussir Ă les couper toutes. En corollaire, avec le choix du paramĂštre p fait plus haut, le graphe G(n, p) sera non connexe « presque uniquement » s'il a des points isolĂ©s, au sens oĂč la probabilitĂ© d'ĂȘtre connexe est trĂšs proche de la probabilitĂ© de ne pas avoir de points isolĂ©s, qui vaut approximativement eâeâc En effet, on a le rĂ©sultat suivant :
Points isolĂ©s (ErdĆs, RĂ©nyi, 1960). â Supposons que
Alors le nombre Xn de points isolĂ©s du graphe converge en loi vers une loi de Poisson de paramĂštre eâc.
Ce théorÚme est une illustration frappante du paradigme de Poisson, selon lequel, lorsque se présente un grand nombre d'opportunités d'observer un événement rare (c.-à -d. peu probable), alors le nombre total d'événements rares effectivement observés suit une loi de Poisson.
Le théorÚme double-exponentiel
ErdĆs et RĂ©nyi en dĂ©duisent un rĂ©sultat plus prĂ©cis que la propriĂ©tĂ© de seuil Ă©troit :
ThĂ©orĂšme double-exponentiel (ErdĆs, RĂ©nyi, 1960) â Supposons que
Notons Tn le premier instant t oĂč le graphe est connexe :
de sorte que
On peut alors voir le théorÚme double-exponentiel comme un résultat sur le développement asymptotique de Tn : si Zn est défini par la relation suivante :
alors le théorÚme double-exponentiel stipule que Zn converge en loi vers la distribution de Gumbel, ce qui pourrait se traduire, dans une version probabiliste de la notation de Landau, par :
Le graphe aléatoire infini
ErdĆs et RĂ©nyi ont gĂ©nĂ©ralisĂ© le modĂšle binomial au cas d'un graphe infini dĂ©nombrable, montrant qu'on obtenait alors (presque sĂ»rement) un graphe possĂ©dant des propriĂ©tĂ©s d'universalitĂ© (contenant en particulier tout graphe fini ou dĂ©nombrable comme sous-graphe) ; ce graphe a Ă©tĂ© redĂ©couvert Ă plusieurs reprises et est le plus souvent connu sous le nom de graphe de Rado.
Voir aussi
Notes
- Le premier article, publié en 1959, est "On Random Graphs I", Publ. Math. Debrecen 6, 290.
- (en) P. ErdĆs, « Some remarks on the theory of graphs », Bull. Amer. Math. Soc., vol. 53, no 4,â , p. 292-294 (lire en ligne). On considĂšre souvent cet article comme marquant la naissance de la « mĂ©thode probabiliste » pour l'Ă©tude des graphes non alĂ©atoires, en particulier pour la thĂ©orie de Ramsey.
- Pour un historique, voir (en) M. KaroĆski et A. RuciĆski, « The origins of the theory of random graphs », dans The Mathematics of Paul ErdĆs, Berlin, Springer, coll. « Algorithms Combin. » (no 13), , p. 311-336.
- Pour plus de dĂ©tails, voir Janson, Ćuczak et RuciĆski 2000, chap. 2, « Exponentially small probabilities ».
- Voir Janson, Ćuczak et RuciĆski 2000, section 1.4, « Asymptotic equivalence », p. 14.
- Voir (en) Galen R. Shorack et Jon A. Wellner, Empirical Processes With Applications to Statistics, SIAM, , 998 p. (ISBN 978-0-89871-684-9, lire en ligne), section 3.8, « Limiting distributions under the null hypothesis », p. 142, et chap. 18, « The Standardized Quantile Process », p. 637.
- Janson, Ćuczak et RuciĆski 2000, Th. 6.7, p. 144.
- Voir l'article « Bijection de Joyal », ou bien Martin Aigner et GĂŒnter M. Ziegler, Raisonnements divins, 2e Ă©dition, 2006, p. 195-201, La formule de Cayley pour le nombre dâarbres.
Bibliographie
- (en) BĂ©la BollobĂĄs, Random Graphs, Cambridge University Press, , 2e Ă©d. (1re Ă©d. 1985), 516 p. (ISBN 978-0-521-79722-1, lire en ligne).
- (en) Svante Janson (en), Tomasz Ćuczak et Andrzej RuciĆski, Random Graphs, Wiley-Interscience, , 1re Ă©d., 333 p., hardcover (ISBN 978-0-471-17541-4).
- (en) Joel Spencer, « Nine lectures on random graphs », dans Ăcole d'Ă©tĂ© de ProbabilitĂ©s de Saint-Flour XXI-1991, Part 3, Springer, coll. « Lecture Notes in Math. » (no 1541), , p. 293-347.
Article connexe
Lien externe
Laurent Massoulié, Réseaux: contrÎle distribué et phénomÚnes émergents, 2015