Loi log-normale
En théorie des probabilités et statistique, une variable aléatoire X est dite suivre une loi log-normale de paramÚtres et si la variable suit une loi normale d'espérance et de variance .
Loi Log-normale | |
DensitĂ© de probabilitĂ© ÎŒ=0 | |
Fonction de rĂ©partition ÎŒ=0 | |
ParamĂštres | |
---|---|
Support | |
Densité de probabilité | |
Fonction de répartition | |
Espérance | |
MĂ©diane | |
Mode | |
Variance | |
Asymétrie | |
Kurtosis normalisé | |
Entropie | |
Cette loi est parfois appelée loi de Galton. Elle est habituellement notée dans le cas d'une seule variable ou dans un contexte multidimensionnel.
Une variable peut ĂȘtre modĂ©lisĂ©e par une loi log-normale si elle est le rĂ©sultat de la multiplication d'un grand nombre de petits facteurs indĂ©pendants[1].
Caractérisation
Densité
La loi log-normale de paramÚtres et admet pour densité de probabilité
pour . Les paramÚtres et sont l'espérance et l'écart type du logarithme de la variable (puisque par définition, le logarithme de la variable est distribué selon une loi normale d'espérance et d'écart-type ).
Fonction de répartition
Par intégration de la fonction de densité, il vient que la fonction de répartition s'exprime en fonction de la fonction d'erreur erf :
Espérance et écart-type
L'espérance est
et la variance est
Des relations équivalentes permettent d'obtenir et étant données l'espérance et l'écart-type :
Autres relations
oĂč est une variable normale quelconque de variance .
Pour deux variables log-normales, les relations sont indiquées dans le contexte multidimensionnel ci-dessous.
Comportement de la densité
Il suffit de dériver la densité de la loi log-normale pour vérifier les résultats suivants :
- En x = 0, la singularitĂ© de la densitĂ© nâest quâapparente car elle satisfait
- La fonction peut ainsi ĂȘtre prolongĂ©e en 0 de maniĂšre continue en lui attribuant la valeur 0.
- Lorsque la valeur du mode est trĂšs faible ( et comme dans le cartouche ci-dessus), le graphe de la densitĂ© semble diverger en 0, ce qui nâest formellement pas le cas.
- Comme lâindique son mode, la densitĂ© admet un maximum en oĂč sa valeur atteint
Loi log-normale multidimensionnelle
Un vecteur aléatoire est dit suivre une loi log-normale multidimensionnelle de paramÚtres et si le vecteur (composante par composante) suit une loi normale multidimensionnelle dont le vecteur des espérances est et la matrice de covariance est .
Cette loi est habituellement notée .
La densité de probabilité et la fonction de répartition sont les suivantes :
- oĂč est la densitĂ© de .
- oĂč est la fonction de rĂ©partition de .
Les espérances et covariances sont données par les relations (valables également dans le cas dégénéré) :
Remarques :
- Attention : la matrice de terme gĂ©nĂ©rique nâa rien Ă voir avec lâexponentielle de la matrice
- peut ĂȘtre singuliĂšre (cas dĂ©gĂ©nĂ©rĂ©) sans nĂ©cessairement impliquer que le soit. Exemple :
- Ă toute matrice semi-dĂ©finie positive, on peut associer un vecteur normal dont elle est la covariance. Par contre, il nâexiste pas nĂ©cessairement un vecteur log-normal dont elle soit la covariance. En effet, avec la relation , toute matrice semi-dĂ©finie positive conduit Ă une matrice semi-dĂ©finie positive, mais lâinverse nâest gĂ©nĂ©ralement pas vrai. Un contre-exemple oĂč est dĂ©finie positive alors que ne lâest pas :
Positivité de la covariance
Les relations caractĂ©risant les espĂ©rances et les covariances pouvant se dĂ©duire de la fonction gĂ©nĂ©ratrice des moments de la loi normale multidimensionnelle, la matrice de covariance doit naturellement ĂȘtre semi-dĂ©finie positive. Ce rĂ©sultat est ici prĂ©sentĂ© de maniĂšre directe.
Puisque les espĂ©rances sont strictement positives, est semi-dĂ©finie positive si et seulement si lâest : il suffit alors de considĂ©rer uniquement cette derniĂšre matrice. Puisque la positivitĂ© de est la seule propriĂ©tĂ© qui est exploitĂ©e, on notera cette matrice qui ne fait plus rĂ©fĂ©rence Ă une covariance.
Lemme â Soit une matrice semi-dĂ©finie positive et un entier positif. Alors la matrice dĂ©finie par lâest Ă©galement.
Proposition 1 â Si est semi-dĂ©finie positive, alors lâest Ă©galement.
RĂ©sultats relatifs au spectre de indiquant des bornes pour ses valeurs propres :
Proposition 2 â Soit semi-dĂ©finie positive et notons
- les valeurs extrĂȘmes des coefficients diagonaux ,
- les valeurs propres extrĂȘmes de ,
- les valeurs propres extrĂȘmes de ,
- les valeurs propres extrĂȘmes de
- Alors
Loi de Gibrat
Historiquement nommĂ©e loi de l'effet proportionnel, puis parfois loi log-normale Ă 3 paramĂštres, cette loi est une gĂ©nĂ©ralisation de la loi log-normale obtenue par lâajout dâune simple translation en posant
- .
Elle est notĂ©e et ne concerne que des valeurs Son utilisation devrait se limiter aux situations oĂč cette borne infĂ©rieure possĂšde un sens physique et dont la valeur est connue.
Domaines d'application
Marchés financiers
La loi log-normale est souvent utilisĂ©e en analyse quantitative pour reprĂ©senter les cours des instruments financiers (notamment les actions, cours de change, taux d'intĂ©rĂȘt). Avec la loi multidimensionnelle, il est possible dâenvisager des modĂšles susceptibles de considĂ©rer diffĂ©rents titres et leurs corrĂ©lations, ce qui permet ainsi dâapprĂ©hender et de quantifier les risques d'un portefeuille.
Les cours nâĂ©tant pas nĂ©gatifs, il est pertinent d'exprimer leurs variations sous forme relative (en pourcentage) et, en premiĂšre approximation, les cours sont dĂ©crits par une loi log-normale.
Dâautre part, une raison plus profonde rĂ©side dans lâestimation de la volatilitĂ© du cours dâune action qui peut ĂȘtre dĂ©finie par lâĂ©cart-type du rendement :
- Si le prix dâune cotation passe de P1 Ă P2 durant une pĂ©riode dâun jour, le rendement journalier est r = P2 / P1 -1 et, Ă ce rythme, lâexpression continue du rendement R annuel satisfait (T = 365 jours) :
On voit alors apparaßtre le lien entre la volatilité et la variable aléatoire qui affecte le logarithme du cours.
Autres domaines
- Le nombre de mots dans une phrase peut ĂȘtre modĂ©lisĂ© par une loi log-normale[2].
- La rĂ©partition des revenus dans la population peut Ă©galement ĂȘtre approchĂ©e par une loi log-normale.
- En biologie, on peut l'utiliser pour modéliser le poids des organismes vivants.
- En hydrologie, les débits mensuels de petits bassins versants à régimes pluviaux.
- En gĂ©nomique, il a Ă©tĂ© observĂ© que les taux de mutations varient le long des chromosomes et leur distribution peut ĂȘtre approximĂ©e par une loi log-normale.
- En mécanique des fluides, la loi log-normale donne une bonne approximation de la fonction de distribution en taille de gouttes à la sortie d'un aérosol ou d'un jet pulvérisé.
Notes et références
- Bernard Delmas, Statistique descriptive, Paris, Nathan, 1996, p. 143.
- Stéphane Tufféry, Data mining et statistique décisionnelle : l'intelligence des données, p. 347 sur Google Livres.