Loi de Yule-Simon
En théorie des probabilités et en statistique, la loi de Yule-Simon est une loi de probabilité discrète dont le nom est issu du statisticien George Udny Yule et de l'économiste et sociologue Herbert Simon. Simon la dénomma initialement loi de Yule[1]. La loi dépend d'un paramètre de forme ρ, son support est infini.
Loi de Yule–Simon | |
Fonction de masse en échelle log-log (Les fonctions de masse ne sont définies que sur les entiers) | |
Fonction de répartition (Les fonctions de répartition ne sont définies que sur les entiers) | |
Paramètres | , paramètre de forme |
---|---|
Support | |
Fonction de masse | |
Fonction de répartition | |
Espérance | pour |
Mode | |
Variance | pour |
Asymétrie | pour |
Kurtosis normalisé | pour |
Fonction génératrice des moments | |
Fonction caractéristique | |
Définition
La fonction de masse de la loi de Yule-Simon de paramètre ρ > 0 est :
pour tout entier k ≥ 1, où B est la fonction bêta. La fonction de masse peut également être écrite en utilisant le symbole de Pochhammer décroissant :
où Γ est la fonction gamma. Ainsi, si ρ est entier,
La fonction de masse f possède la propriété suivante, pour k suffisamment grand :
Ceci signifie que la queue de la loi de Yule-Simon est une réalisation de la loi de Zipf : la fonction f peut être utilisée pour modéliser, par exemple, les fréquences relatives du k-ième mot le plus fréquent dans de grands textes qui, selon la loi de Zipf, est inversement proportionnel à la puissance typique de k.
Le paramètre ρ peut être estimé en utilisant un algorithme de point fixe[2].
Liens avec d'autres lois
La loi de Yule-Simon apparait initialement en tant que loi limite d'un cas particulier de processus stochastique étudié par Yule pour modéliser la répartition de taxons biologiques[3]. Simon baptisa ce processus le processus de Yule, il est cependant plus connu aujourd'hui comme processus d'attachement préférentiel. Ce processus est problème d'urne dans lequel chaque boule est ajoutée à un nombre croissant d'urnes suivant une probabilité dépendant linéairement du nombre de boules déjà dans l'urne.
Cette loi apparait également comme mélange continu de lois géométriques. Plus spécifiquement, si W suit une loi exponentielle de paramètre ρ : avec densité , alors la variable aléatoire K de loi géométrique de paramètre e-W suit la loi de Yule-Simon :
La fonction de masse de la loi de Yule–Simon est alors le mélange exponentiel-géométrique suivant :
où est la fonction de masse de la loi géométrique.
Généralisation
Une généralisation possible de la loi de Yule-Simon consiste à introduire un nouveau paramètre en remplaçant fonction bêta par la fonction bêta incomplète. La fonction de masse de la loi de Yule-Simon généralisée de paramètres ρ > 0 et 0 ≤ α < 1 est donnée par :
Pour α = 0 , on retrouve la loi de Yule-Simon standard.
Références
- H. A. Simon, « On a class of skew distribution functions », Biometrika, vol. 42, nos 3–4, , p. 425-440 (DOI 10.1093/biomet/42.3-4.425)
- Juan Manuel Garcia Garcia, « A fixed-point algorithm to estimate the Yule-Simon distribution parameter », Applied Mathematics and Computation, vol. 217, no 21, , p. 8560–8566 (DOI 10.1016/j.amc.2011.03.092)
- G. U. Yule, « A Mathematical Theory of Evolution, based on the Conclusions of Dr. J. C. Willis, F.R.S », Philosophical Transactions of the Royal Society of London, Ser. B, vol. 213, nos 402–410, , p. 21-87 (DOI 10.1098/rstb.1925.0002)