AccueilđŸ‡«đŸ‡·Chercher

Loi binomiale négative

En probabilitĂ© et en statistiques, une loi binomiale nĂ©gative est la distribution de probabilitĂ© discrĂšte du nombre d'Ă©checs dans une sĂ©rie d'Ă©preuves de Bernoulli indĂ©pendantes et identiquement distribuĂ©es jusqu'Ă  avoir un nombre fixe n de succĂšs. Par exemple, c'est la distribution de probabilitĂ© du nombre de piles obtenus dans une sĂ©rie de pile ou face jusqu'Ă  avoir vu n faces. Plus prĂ©cisĂ©ment, elle dĂ©crit la situation suivante : une expĂ©rience consiste en une sĂ©rie de tirages indĂ©pendants, donnant un succĂšs avec probabilitĂ© p (constante durant toute l'expĂ©rience) et un Ă©chec avec une probabilitĂ© complĂ©mentaire 1-p. Cette expĂ©rience se poursuit jusqu'Ă  l'obtention d'un nombre donnĂ© n de succĂšs. La variable alĂ©atoire reprĂ©sentant le nombre d'Ă©checs, avant l'obtention du nombre donnĂ© n de succĂšs, suit alors une loi binomiale nĂ©gative. Ses paramĂštres sont : le nombre n de succĂšs attendus, et la probabilitĂ© p d'un succĂšs. Le paramĂštre n se note parfois r, comme sur l'illustration ci-contre.

Binomiale négative
Image illustrative de l’article Loi binomiale nĂ©gative
Fonction de masse
pour plusieurs valeurs de n et pour une loi de moyenne 10.
ParamĂštres [1]

Support
Fonction de masse
Fonction de rĂ©partition est la fonction bĂȘta incomplĂšte rĂ©gularisĂ©e
Espérance
Mode
Variance
Asymétrie
Kurtosis normalisé
Fonction génératrice des moments
Fonction caractéristique
Fonction génératrice des probabilités

La loi se gĂ©nĂ©ralise Ă  deux paramĂštres r et p, oĂč r peut prendre des valeurs rĂ©elles strictement positives. Cette gĂ©nĂ©ralisation est aussi connue sous le nom de loi de PĂłlya[2], en l'honneur du mathĂ©maticien George PĂłlya.

DĂ©finition

DĂ©finition pour un premier paramĂštre entier

La loi binomiale nĂ©gative dĂ©pend de deux paramĂštres, mais plusieurs autres paramĂ©trisations sont envisageables. Une paramĂ©trisation trĂšs rĂ©pandue introduit un entier naturel n non nul et un rĂ©el non nul[3] p compris entre 0 et 1. Il est courant d'introduire la probabilitĂ© complĂ©mentaire q = 1 – p. La fonction de masse d'une variable alĂ©atoire distribuĂ©e selon une loi binomiale nĂ©gative de paramĂštres n et p prend la forme suivante :

oĂč est un coefficient binomial.

La loi binomiale négative s'interprÚte comme la loi de probabilité de la variable aléatoire X qui compte le nombre d'échecs observés avant l'obtention de n succÚs pour une série d'expériences indépendantes, sachant que la probabilité d'un succÚs est p. Ainsi

La fonction de masse de la binomiale négative peut aussi s'écrire sous la forme

oĂč est un coefficient binomial gĂ©nĂ©ralisĂ© Ă  un entier nĂ©gatif et est dĂ©fini par.Cette expression justifie le nom de loi binomiale nĂ©gative donnĂ©e Ă  cette loi de probabilitĂ©. Elle facilite aussi, grĂące Ă  l'usage de la formule du binĂŽme nĂ©gatif, le calcul de son espĂ©rance et de sa variance .

Si une variable aléatoire X suit une loi binomiale négative de paramÚtres n et p on pourra alors noter[4] .

DĂ©finitions alternatives

  • On trouve parfois la dĂ©finition alternative suivante : la loi binomiale nĂ©gative[5] de paramĂštres n et p, aussi appelĂ©e loi de Pascal pour la distinguer de la premiĂšre dĂ©finition[6], est la loi de la variable alĂ©atoire Y comptant le nombre d'essais nĂ©cessaires avant l'obtention de n succĂšs. AinsiLes deux fonctions de masse (pour X et pour Y) se dĂ©duisent l'une de l'autre par la substitution Y = X + n et m = k + n, ainsi

.

  • La loi binomiale nĂ©gative est parfois dĂ©finie comme le nombre de succĂšs observĂ©s avant l'obtention du nombre donnĂ© n d'Ă©checs, conduisant Ă  intervertir le rĂŽle des paramĂštres p et q ainsi que les mots « succĂšs Â» et « Ă©chec Â».

Dans la suite, on prendra la premiÚre définition pour définir de la loi binomiale négative.

Généralisation à un premier paramÚtre réel

Il est possible de généraliser la définition de la loi binomiale négative à un paramÚtre r réel strictement positif (qui remplace alors le paramÚtre entier n) en utilisant des coefficients binomiaux généralisés. Plus précisément, pour r réel strictement positif et p réel non nul entre 0 et 1, la loi binomiale négative (généralisée) de paramÚtres r et p est la loi discrÚte définie par la fonction de masse

oĂč dĂ©signe la factorielle dĂ©croissante et dĂ©signe la fonction gamma. Cette dĂ©finition reste bien sĂ»r compatible avec la dĂ©finition dans le cas d'un paramĂ©trage entier. La loi binomiale nĂ©gative gĂ©nĂ©ralisĂ©e Ă  un paramĂštre rĂ©el s'appelle parfois Loi de PĂłlya[2]. Dans le cadre de cette gĂ©nĂ©ralisation, il n'est plus possible d'interprĂ©ter la loi en termes de nombres de succĂšs.

Propriétés

Fonction de répartition

La fonction de rĂ©partition peut s'exprimer Ă  l'aide de la fonction bĂȘta incomplĂšte rĂ©gularisĂ©e :

.

Une démonstration par récurrence sur k prouve que

.

MĂ©lange de lois Gamma-Poisson

La loi binomiale nĂ©gative (gĂ©nĂ©ralisĂ©e) avec paramĂštres r rĂ©el strictement positif et oĂč Ξ est un rĂ©el strictement positif est Ă©gale Ă  un mĂ©lange de lois Gamma-Poisson oĂč r et Ξ sont les paramĂštres de la loi Gamma.

Convergence vers la loi de Poisson

Une loi binomiale négative de paramÚtres n et avec λ réel fixé strictement positif converge faiblement vers une loi de Poisson de paramÚtre λ lorsque n converge vers l'infini. En d'autres termes, si et alors on a la convergence en loi .

Lien avec la loi géométrique

Comme il existe deux définitions de la loi binomiale négative, il existe deux définitions de la loi géométrique. Si celle-ci modélise le nombre d'échecs avant le premier succÚs, elle correspond à la loi binomiale négative de paramÚtres 1 et p.

.

Si Xn est une variable aléatoire distribuée selon la loi binomiale négative de paramÚtres n et p, alors Xn est la somme de n variables aléatoires indépendantes distribuées selon une loi géométrique de paramÚtre p. Le théorÚme central limite indique de plus que Xn est approximativement normal, pour n suffisamment grand.

Lien avec la loi binomiale

En outre, si Yk+n est une variable aléatoire distribuée selon une loi binomiale de paramÚtre k + n et p, alors

La derniĂšre ligne s'interprĂšte ainsi : c'est la probabilitĂ© qu'aprĂšs k + n Ă©preuves, il y ait au moins n succĂšs. Ainsi, la loi binomiale nĂ©gative peut ĂȘtre vue comme la rĂ©ciproque de la loi binomiale.

Stabilité par somme

La somme de k variables aléatoires indépendantes et distribuées selon des lois binomiales négatives de paramÚtres p et respectivement n1, n2,..., nk est encore une loi binomiale négative, de paramÚtres p et n = n1 +...+ nk. Cette propriété se démontre aisément à partir de l'expression de la fonction génératrice des moments.

Applications

Temps d'attente dans un processus de Bernoulli

Pour tout entier n, la loi binomiale négative est la distribution de succÚs et d'échecs dans une série d'épreuves de Bernoulli iid. Pour k + n épreuves de Bernoulli, avec probabilité de succÚs p, la loi binomiale négative donne la probabilité de k échecs et n succÚs, le dernier tirage étant un succÚs. Autrement dit, la loi binomiale négative est la distribution du nombre d'échecs avant le n-iÚme succÚs dans des épreuves de Bernoulli, de probabilité de succÚs p.

ConsidĂ©rons l'exemple suivant. On lance plusieurs fois un dĂ© honnĂȘte, et la face 1 est considĂ©rĂ©e comme un succĂšs. La probabilitĂ© de succĂšs Ă  chaque Ă©preuve est 1/6. Le nombre d'Ă©preuves nĂ©cessaires pour obtenir 3 succĂšs appartient Ă  l'ensemble infini { 3, 4, 5, 6, ... }. Ce nombre d'Ă©preuves est une variable alĂ©atoire distribuĂ©e selon une loi binomiale nĂ©gative (dĂ©calĂ©e, car l'ensemble commence Ă  3 et pas Ă  0). Le nombre d'Ă©checs avant le troisiĂšme succĂšs appartient Ă  l'ensemble { 0, 1, 2, 3, ... }. Ce nombre d'Ă©checs est aussi distribuĂ©e selon une loi binomiale nĂ©gative.

Loi de Poisson « sur-dispersée »

La loi binomiale nĂ©gative, en particulier dans sa paramĂ©trisation alternative dĂ©crite plus haut, est une alternative intĂ©ressante Ă  la loi de Poisson. Elle est particuliĂšrement utile pour des donnĂ©es discrĂštes, Ă  valeurs dans un ensemble positif non-bornĂ©, dont la variance empirique excĂšde la moyenne empirique. Si une Poisson est utilisĂ©e pour modĂ©liser de telles donnĂ©es, la moyenne et la variance doivent ĂȘtre Ă©gales. Dans ce cas, les observations sont «sur-dispersĂ©es» par rapport au modĂšle Poisson. Puisque la loi binomiale nĂ©gative possĂšde un paramĂštre supplĂ©mentaire, il peut ĂȘtre utilisĂ© pour ajuster la variance indĂ©pendamment de la moyenne.

Références

  1. La loi binomiale négative peut se généraliser à un paramÚtre réel strictement positif, dans ce cas on notera le paramÚtre r plutÎt que n par souci de clarté. Pour cette généralisation toutes les formules de l'infoboite restent vraies en changeant les occurrences de n en r. Le coefficient binomial dans la fonction de masse devient alors un coefficient binomial généralisé.
  2. A ne pas confondre avec la loi de Markov-PĂłlya.
  3. La probabilitĂ© p ne peut ĂȘtre nulle car sinon il serait impossible d'observer, en temps fini, les n succĂšs attendus. D'ailleurs on remarquera que si on substituait 0 Ă  p dans la formule de la fonction de masse, cette derniĂšre serait alors toujours nulle, quel que soit la valeur de k, ce qui ne conviendrait pas pour une fonction de masse dont la somme sur toutes les valeurs de k se doit de valoir 1.
  4. Astrid Jourdan et CĂ©lestin C Kokonendji, « Surdispersion et modĂšle binomial nĂ©gatif gĂ©nĂ©ralisĂ© », Revue de statistique appliquĂ©e, vol. 50,‎ , p. 73-86 (lire en ligne)
  5. D. Ghorbanzadeh, Probabilités : exercices corrigés, Technip, (lire en ligne), p. 156.
  6. G. Millot, Comprendre et réaliser les tests statistiques à l'aide de R, De Boeck Supérieur, (lire en ligne), p. 269-271.

Voir aussi

Articles connexes

Bibliographie

(en) Joseph M. Hilbe (en), Negative Binomial Regression, Cambridge University Press, (lire en ligne)

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplĂ©mentaires peuvent s’appliquer aux fichiers multimĂ©dias.