Loi de Markov-PĂłlya
En mathématiques et plus particuliÚrement en théorie des probabilités, la loi de Markov-Pólya[1] (ou loi de Pólya-Eggenberger[2] ou loi de Pólya[3]) est une loi de probabilité discrÚte. Elle doit son nom au mathématicien George Pólya (ainsi qu'aux mathématiciens F Eggenberger et Andreï Markov) qui a publié un article[4], conjointement avec Eggenberger, en 1923 sur cette loi ainsi que sur le problÚme d'urne sous-jacent. Cependant Markov serait le premier à avoir étudié cette loi en 1917[5].
Loi de Markov-PĂłlya | |
ParamĂštres | |
---|---|
Support | |
Fonction de masse | |
Espérance | |
Variance | |
Fonction génératrice des probabilités | |
DĂ©finition
ConsidĂ©rons une urne contenant a boules blanches et b boules noires (pour un total de m = a + b boules). Nous rĂ©pĂ©tons l'expĂ©rience suivante n fois : on pioche uniformĂ©ment au hasard une boule dans l'urne, puis, on replace la boule piochĂ©e ainsi que h autres boules de la mĂȘme couleur dans l'urne. La loi de Markov-PĂłlya de paramĂštres a, b, h et n est alors la loi de la variable alĂ©atoire X qui compte le nombre total de boules blanches piochĂ©es au bout de ces n tirages.
La fonction de masse de la variable X peut se calculer et on a[6] - [7]
oĂč on a utilisĂ© la notation[3] suivante .
Les paramĂštres a, b et n sont des entiers naturels tandis que h est un entier relatif, il peut donc ĂȘtre nĂ©gatif[8]. Lorsque h est nĂ©gatif on rajoute la condition pour Ă©viter tout problĂšme de dĂ©finition.
Propriétés
Soit X une variable aléatoire ayant la loi de Markov-Pólya de paramÚtres a, b, h et n.
- Si h = 0, alors X suit une loi binomiale de paramĂštres n et p = a/m.
- Si h = â1, alors X suit une loi hypergĂ©omĂ©trique de paramĂštres n, p = a/m et N = m.
- Si h = 1, alors X suit une loi bĂȘta-binomiale de paramĂštres đŒ = a, đœ = b et n.
- Lorsque h â 0 on peut rĂ©Ă©crire la fonction de masse de X des maniĂšres suivantes :
oĂč dĂ©signe la factorielle croissante et dĂ©signe un coefficient binomial gĂ©nĂ©ralisĂ©[9].
- L'espérance de X est donnée par .
Il est intéressant de noter que l'espérance ne dépend pas du paramÚtre h.
- La variance de X est donnée par .
- Plus gĂ©nĂ©ralement, si h â 0 alors le r-iĂšme moment factoriel de X est donnĂ©e par[7]
oĂč dĂ©signe la factorielle dĂ©croissante.
- La fonction génératrice des probabilités de X vérifie[7]
oĂč dĂ©signe la fonction hypergĂ©omĂ©trique.
Limites
- Soit Xn une variable aléatoire ayant la loi de Markov-Pólya de paramÚtres a, b, h > 0 (fixés) et n. On a la convergence en loi suivante[10] :
oĂč B dĂ©signe la loi bĂȘta. En fait la convergence a lieu pour la distance de Wasserstein Ă tous les ordres avec pour vitesse de convergence 1/n. Cela implique en particulier la convergence de tous les moments vers ceux de la loi bĂȘta.
- Soit Xn une variable alĂ©atoire ayant la loi de Markov-PĂłlya de paramĂštres a, b, h > 0 (dĂ©pendant de n) et n. Supposons que et que quand n tend vers l'infini. Alors Xn converge en loi[11] vers une loi binomiale nĂ©gative[12] de paramĂštres r et p = 1/(1+đ).
- D'autres limites sont possibles (par exemple vers une loi gaussienne lorsque h = 0) en changeant la maniĂšre dont Ă©voluent les paramĂštres en fonction de n[13].
Généralisation
On peut généraliser la loi de Markov-Pólya en considérant non plus 2 mais q > 2 couleurs de boules différentes dans l'urne avec a1 boules blanches, a2 boules noires, a3 boules rouges, etc. Dans ce cas si X représente le vecteur du nombre de boules tirées par couleur aprÚs n tirages alors on a[6]
.
Il est toujours possible de calculer la fonction génératrice multivariée de X en utilisant les fonctions hypergéométriques.
Pour a1,...,aq, h > 0 (fixés) et n qui tend vers l'infini, on a convergence en loi[10] du vecteur vers une loi de Dirichlet de paramÚtres a1/h,...,aq/h.
Notes et références
- (en) K G Janardan, « On Characterizing the Markov-Polya Distribution », The Indian Journal of Statistics, vol. 46,â , p. 444-453 (lire en ligne)
- (en) Anwar Hassan, Sheikh Bilal et Imtiyaz Ahmad Shah, « On Some Properties and Estimation of Size-Biased Polya-Eggenberger Distribution », Journal of Modern Applied Statistical Methods, vol. 11,â , article no 10 (lire en ligne)
- (en) HĂ©ctor M Ramos, David Almorza et Juan A. GarciaâRamos, « On characterizing the Polya distribution », ESAIM: Prob. and Stat., vol. 6,â , p. 105-112 (lire en ligne)
- (de) F Eggenberger et G Polya, « Ăber die Statistik verketteter VorgĂ€nge », Z. Angew. Math. Mech., vol. 3,â , p. 279-289 (lire en ligne)
- (ru) A A Markov, « Sur quelques formules limites du calcul des probabilitĂ©s », Bulletin de lâAcadĂ©mie ImpĂ©riale des Sciences, vol. 11,â , p. 177-186
- Charles Jordan, « Sur un cas gĂ©nĂ©ralisĂ© de la probabilitĂ© des Ă©preuves rĂ©pĂ©tĂ©es », C. R. Acad. Sci. Paris, vol. 184,â , p. 315-317 (lire en ligne)
- Charles Jordan, « Sur un cas généralisé de la probabilité des épreuves répétées »
- Si h < 0 on retire la boule piochĂ©e et on retire aussi |h| â 1 boules de la mĂȘme couleur que la boule piochĂ©e.
- Plus prĂ©cisĂ©ment, pour x entier positif et z rĂ©el, on dĂ©finit le coefficient binomial de la maniĂšre suivante : . La gĂ©nĂ©ralisation peut encore ĂȘtre poussĂ©e en utilisant la fonction gamma mais ce n'est pas nĂ©cessaire dans notre cas.
- (en) Svante Jordan, « Rate of convergence for traditional Polya urns », Journal of Applied Probability, vol. 57(4),â , p. 1029-1044 (lire en ligne)
- (en) Dietmar Willi Pfeifer, « PĂłlyaâLundberg Process », Encyclopedia of Statistical Sciences,â (lire en ligne)
- On entend ici une loi binomiale négative généralisée à une paramétrisation réelle. Plus précisément, Z suit une loi binomiale négative de paramÚtres r (réel positif) et p (réel entre 0 et 1) si et seulement si Cette loi binomiale négative généralisée est aussi parfois appelée loi de Polya (ou loi de Polya-Eggenberger) ce qui peut créer des confusions avec la loi de Markov-Polya.
- F Eggenberger et G Polya, « Calcul des probabilitĂ©s â sur lâinterprĂ©tation de certaines courbes de frĂ©quence », C. R. Acad. Sci. Paris, vol. 187,â , p. 870-872 (lire en ligne)