Loi binomiale négative
En probabilité et en statistiques, une loi binomiale négative est la distribution de probabilité discrÚte du nombre d'échecs dans une série d'épreuves de Bernoulli indépendantes et identiquement distribuées jusqu'à avoir un nombre fixe n de succÚs. Par exemple, c'est la distribution de probabilité du nombre de piles obtenus dans une série de pile ou face jusqu'à avoir vu n faces. Plus précisément, elle décrit la situation suivante : une expérience consiste en une série de tirages indépendants, donnant un succÚs avec probabilité p (constante durant toute l'expérience) et un échec avec une probabilité complémentaire 1-p. Cette expérience se poursuit jusqu'à l'obtention d'un nombre donné n de succÚs. La variable aléatoire représentant le nombre d'échecs, avant l'obtention du nombre donné n de succÚs, suit alors une loi binomiale négative. Ses paramÚtres sont : le nombre n de succÚs attendus, et la probabilité p d'un succÚs. Le paramÚtre n se note parfois r, comme sur l'illustration ci-contre.
Binomiale négative | |
Fonction de masse pour plusieurs valeurs de n et pour une loi de moyenne 10. | |
ParamĂštres | [1] |
---|---|
Support | |
Fonction de masse | |
Fonction de rĂ©partition | est la fonction bĂȘta incomplĂšte rĂ©gularisĂ©e |
Espérance | |
Mode | |
Variance | |
Asymétrie | |
Kurtosis normalisé | |
Fonction génératrice des moments | |
Fonction caractéristique | |
Fonction génératrice des probabilités | |
La loi se gĂ©nĂ©ralise Ă deux paramĂštres r et p, oĂč r peut prendre des valeurs rĂ©elles strictement positives. Cette gĂ©nĂ©ralisation est aussi connue sous le nom de loi de PĂłlya[2], en l'honneur du mathĂ©maticien George PĂłlya.
DĂ©finition
DĂ©finition pour un premier paramĂštre entier
La loi binomiale nĂ©gative dĂ©pend de deux paramĂštres, mais plusieurs autres paramĂ©trisations sont envisageables. Une paramĂ©trisation trĂšs rĂ©pandue introduit un entier naturel n non nul et un rĂ©el non nul[3] p compris entre 0 et 1. Il est courant d'introduire la probabilitĂ© complĂ©mentaire q = 1 â p. La fonction de masse d'une variable alĂ©atoire distribuĂ©e selon une loi binomiale nĂ©gative de paramĂštres n et p prend la forme suivante :
oĂč est un coefficient binomial.
La loi binomiale négative s'interprÚte comme la loi de probabilité de la variable aléatoire X qui compte le nombre d'échecs observés avant l'obtention de n succÚs pour une série d'expériences indépendantes, sachant que la probabilité d'un succÚs est p. Ainsi
La fonction de masse de la binomiale négative peut aussi s'écrire sous la forme
oĂč est un coefficient binomial gĂ©nĂ©ralisĂ© Ă un entier nĂ©gatif et est dĂ©fini par.Cette expression justifie le nom de loi binomiale nĂ©gative donnĂ©e Ă cette loi de probabilitĂ©. Elle facilite aussi, grĂące Ă l'usage de la formule du binĂŽme nĂ©gatif, le calcul de son espĂ©rance et de sa variance .
Si une variable aléatoire X suit une loi binomiale négative de paramÚtres n et p on pourra alors noter[4] .
DĂ©finitions alternatives
- On trouve parfois la définition alternative suivante : la loi binomiale négative[5] de paramÚtres n et p, aussi appelée loi de Pascal pour la distinguer de la premiÚre définition[6], est la loi de la variable aléatoire Y comptant le nombre d'essais nécessaires avant l'obtention de n succÚs. AinsiLes deux fonctions de masse (pour X et pour Y) se déduisent l'une de l'autre par la substitution Y = X + n et m = k + n, ainsi
.
- La loi binomiale négative est parfois définie comme le nombre de succÚs observés avant l'obtention du nombre donné n d'échecs, conduisant à intervertir le rÎle des paramÚtres p et q ainsi que les mots « succÚs » et « échec ».
Dans la suite, on prendra la premiÚre définition pour définir de la loi binomiale négative.
Généralisation à un premier paramÚtre réel
Il est possible de généraliser la définition de la loi binomiale négative à un paramÚtre r réel strictement positif (qui remplace alors le paramÚtre entier n) en utilisant des coefficients binomiaux généralisés. Plus précisément, pour r réel strictement positif et p réel non nul entre 0 et 1, la loi binomiale négative (généralisée) de paramÚtres r et p est la loi discrÚte définie par la fonction de masse
oĂč dĂ©signe la factorielle dĂ©croissante et dĂ©signe la fonction gamma. Cette dĂ©finition reste bien sĂ»r compatible avec la dĂ©finition dans le cas d'un paramĂ©trage entier. La loi binomiale nĂ©gative gĂ©nĂ©ralisĂ©e Ă un paramĂštre rĂ©el s'appelle parfois Loi de PĂłlya[2]. Dans le cadre de cette gĂ©nĂ©ralisation, il n'est plus possible d'interprĂ©ter la loi en termes de nombres de succĂšs.
Propriétés
Fonction de répartition
La fonction de rĂ©partition peut s'exprimer Ă l'aide de la fonction bĂȘta incomplĂšte rĂ©gularisĂ©e :
.
Une démonstration par récurrence sur k prouve que
.
MĂ©lange de lois Gamma-Poisson
La loi binomiale nĂ©gative (gĂ©nĂ©ralisĂ©e) avec paramĂštres r rĂ©el strictement positif et oĂč Ξ est un rĂ©el strictement positif est Ă©gale Ă un mĂ©lange de lois Gamma-Poisson oĂč r et Ξ sont les paramĂštres de la loi Gamma.
Convergence vers la loi de Poisson
Une loi binomiale négative de paramÚtres n et avec λ réel fixé strictement positif converge faiblement vers une loi de Poisson de paramÚtre λ lorsque n converge vers l'infini. En d'autres termes, si et alors on a la convergence en loi .
Lien avec la loi géométrique
Comme il existe deux définitions de la loi binomiale négative, il existe deux définitions de la loi géométrique. Si celle-ci modélise le nombre d'échecs avant le premier succÚs, elle correspond à la loi binomiale négative de paramÚtres 1 et p.
.
Si Xn est une variable aléatoire distribuée selon la loi binomiale négative de paramÚtres n et p, alors Xn est la somme de n variables aléatoires indépendantes distribuées selon une loi géométrique de paramÚtre p. Le théorÚme central limite indique de plus que Xn est approximativement normal, pour n suffisamment grand.
Lien avec la loi binomiale
En outre, si Yk+n est une variable aléatoire distribuée selon une loi binomiale de paramÚtre k + n et p, alors
La derniĂšre ligne s'interprĂšte ainsi : c'est la probabilitĂ© qu'aprĂšs k + n Ă©preuves, il y ait au moins n succĂšs. Ainsi, la loi binomiale nĂ©gative peut ĂȘtre vue comme la rĂ©ciproque de la loi binomiale.
Stabilité par somme
La somme de k variables aléatoires indépendantes et distribuées selon des lois binomiales négatives de paramÚtres p et respectivement n1, n2,..., nk est encore une loi binomiale négative, de paramÚtres p et n = n1 +...+ nk. Cette propriété se démontre aisément à partir de l'expression de la fonction génératrice des moments.
Applications
Temps d'attente dans un processus de Bernoulli
Pour tout entier n, la loi binomiale négative est la distribution de succÚs et d'échecs dans une série d'épreuves de Bernoulli iid. Pour k + n épreuves de Bernoulli, avec probabilité de succÚs p, la loi binomiale négative donne la probabilité de k échecs et n succÚs, le dernier tirage étant un succÚs. Autrement dit, la loi binomiale négative est la distribution du nombre d'échecs avant le n-iÚme succÚs dans des épreuves de Bernoulli, de probabilité de succÚs p.
ConsidĂ©rons l'exemple suivant. On lance plusieurs fois un dĂ© honnĂȘte, et la face 1 est considĂ©rĂ©e comme un succĂšs. La probabilitĂ© de succĂšs Ă chaque Ă©preuve est 1/6. Le nombre d'Ă©preuves nĂ©cessaires pour obtenir 3 succĂšs appartient Ă l'ensemble infini { 3, 4, 5, 6, ... }. Ce nombre d'Ă©preuves est une variable alĂ©atoire distribuĂ©e selon une loi binomiale nĂ©gative (dĂ©calĂ©e, car l'ensemble commence Ă 3 et pas Ă 0). Le nombre d'Ă©checs avant le troisiĂšme succĂšs appartient Ă l'ensemble { 0, 1, 2, 3, ... }. Ce nombre d'Ă©checs est aussi distribuĂ©e selon une loi binomiale nĂ©gative.
Loi de Poisson « sur-dispersée »
La loi binomiale nĂ©gative, en particulier dans sa paramĂ©trisation alternative dĂ©crite plus haut, est une alternative intĂ©ressante Ă la loi de Poisson. Elle est particuliĂšrement utile pour des donnĂ©es discrĂštes, Ă valeurs dans un ensemble positif non-bornĂ©, dont la variance empirique excĂšde la moyenne empirique. Si une Poisson est utilisĂ©e pour modĂ©liser de telles donnĂ©es, la moyenne et la variance doivent ĂȘtre Ă©gales. Dans ce cas, les observations sont «sur-dispersĂ©es» par rapport au modĂšle Poisson. Puisque la loi binomiale nĂ©gative possĂšde un paramĂštre supplĂ©mentaire, il peut ĂȘtre utilisĂ© pour ajuster la variance indĂ©pendamment de la moyenne.
Références
- La loi binomiale négative peut se généraliser à un paramÚtre réel strictement positif, dans ce cas on notera le paramÚtre r plutÎt que n par souci de clarté. Pour cette généralisation toutes les formules de l'infoboite restent vraies en changeant les occurrences de n en r. Le coefficient binomial dans la fonction de masse devient alors un coefficient binomial généralisé.
- A ne pas confondre avec la loi de Markov-PĂłlya.
- La probabilitĂ© p ne peut ĂȘtre nulle car sinon il serait impossible d'observer, en temps fini, les n succĂšs attendus. D'ailleurs on remarquera que si on substituait 0 Ă p dans la formule de la fonction de masse, cette derniĂšre serait alors toujours nulle, quel que soit la valeur de k, ce qui ne conviendrait pas pour une fonction de masse dont la somme sur toutes les valeurs de k se doit de valoir 1.
- Astrid Jourdan et CĂ©lestin C Kokonendji, « Surdispersion et modĂšle binomial nĂ©gatif gĂ©nĂ©ralisĂ© », Revue de statistique appliquĂ©e, vol. 50,â , p. 73-86 (lire en ligne)
- D. Ghorbanzadeh, Probabilités : exercices corrigés, Technip, (lire en ligne), p. 156.
- G. Millot, Comprendre et réaliser les tests statistiques à l'aide de R, De Boeck Supérieur, (lire en ligne), p. 269-271.
Voir aussi
Articles connexes
- Loi binomiale négative étendue
- ProblĂšme du collectionneur de vignettes
- Loi d'Erlang : analogue de la loi binomiale négative dans le cas continu.
Bibliographie
(en) Joseph M. Hilbe (en), Negative Binomial Regression, Cambridge University Press, (lire en ligne)