Kurtosis
En thĂ©orie des probabilitĂ©s et en statistique, le kurtosis (du nom fĂ©minin grec ancien ÎșÏÏÏÏÏÎčÏ, « courbure »), aussi traduit par coefficient dâacuitĂ©[1], coefficient dâaplatissement et degrĂ© de voussure, est une mesure directe de lâacuitĂ© et une mesure indirecte de l'aplatissement de la distribution dâune variable alĂ©atoire rĂ©elle. Il existe plusieurs mesures de l'acuitĂ© et le kurtosis correspond Ă la mĂ©thode de Pearson.
Câest le deuxiĂšme des paramĂštres de forme, avec le coefficient d'asymĂ©trie (les paramĂštres fondĂ©s sur les moments dâordre 5 et plus nâont pas de nom propre).
Il mesure, abstraction faite de la dispersion (donnĂ©e par lâĂ©cart type), la rĂ©partition des masses de probabilitĂ© autour de leur centre, donnĂ© par lâespĂ©rance mathĂ©matique, câest-Ă -dire, dâune certaine façon, leur concentration Ă proximitĂ© ou Ă distance du centre de probabilitĂ©.
DĂ©finitions
Kurtosis non normalisĂ© (coefficient dâaplatissement)
Ătant donnĂ© une variable alĂ©atoire rĂ©elle dâespĂ©rance et dâĂ©cart type , on dĂ©finit son kurtosis non normalisĂ© comme le moment dâordre quatre de la variable centrĂ©e rĂ©duite :
lorsque cette espérance existe. On a donc :
avec les moments centrĂ©s dâordre .
Kurtosis normalisĂ© (excĂšs dâaplatissement)
Le kurtosis non normalisĂ© Ă©tant dĂ©fini en fonction de moments centrĂ©s, il est malaisĂ© Ă manipuler lorsquâil sâagit de calculer celui de la somme de variables indĂ©pendantes.
On définit ainsi le kurtosis normalisé en fonction de cumulants :
Sachant que et , on a alors[2]:
Propriétés
Dimension
Les moments centrés et cumulants ayant pour dimension celle de la variable élevée à la puissance , les kurtosis et sont des grandeurs adimensionnelles.
Plage de valeur
Soit la variable aléatoire réelle . Cette variable aléatoire a pour espérance et pour variance . Sachant que , on en déduit alors que :
Cette limite infĂ©rieure nâest atteinte que dans le cas oĂč (Ă transformation affine prĂšs) la variable alĂ©atoire X suit une loi de Bernoulli de paramĂštre (un seul tirage Ă pile ou face avec une piĂšce parfaitement Ă©quilibrĂ©e). Pour la loi normale, on a .
Le kurtosis nâa pas de limite supĂ©rieure.
Somme de réalisations indépendantes
Soient une variable alĂ©atoire rĂ©elle et la somme de rĂ©alisations indĂ©pendantes de (exemple : la loi binomiale de paramĂštres et , somme de rĂ©alisations indĂ©pendantes de la loi de Bernoulli de paramĂštre ). GrĂące Ă la propriĂ©tĂ© dâadditivitĂ© des cumulants, on sait que , donc :
Typologie
Un coefficient dâaplatissement Ă©levĂ© indique que la distribution est plutĂŽt pointue en sa moyenne, et a des queues de distribution Ă©paisses (fat tails en anglais, fat tail au singulier). Cela se dĂ©duit en considĂ©rant la distribution dĂ©finie plus haut, dont lâespĂ©rance vaut 1 et dont le moment centrĂ© dâordre deux est le kurtosis non normalisĂ© de . Comme son espĂ©rance est fixĂ©e, son moment dâordre deux ne peut Ă©voluer que par compensation : pour lâaugmenter, il faut de lâinertie en position Ă©loignĂ©e, contrebalancĂ©e par de lâinertie proche. En dâautres termes, on « pince » les flancs et les probabilitĂ©s se dĂ©placent par consĂ©quent vers le centre et les extrĂ©mitĂ©s.
Le terme d'« excĂšs dâaplatissement », dĂ©rivĂ© de kurtosis excess en anglais, utilisĂ© pour le kurtosis normalisĂ© peut ĂȘtre source dâambiguĂŻtĂ©. En effet, un excĂšs dâaplatissement positif correspond Ă une distribution pointue et un excĂšs dâaplatissement nĂ©gatif Ă une distribution aplatie (on sâattendrait Ă lâinverse).
Distribution mésokurtique
Si , on parle de distribution mésokurtique (ou mésocurtique). La loi normale est un cas particulier de distribution mésokurtique pour laquelle le coefficient de dissymétrie vaut 0.
Distribution leptokurtique
Si , on parle de distribution leptokurtique (ou leptocurtique). La notion de leptokurticité est trÚs utilisée dans le milieu de la finance de marché, les échantillons ayant des extrémités plus épaisses que la normale, impliquant des valeurs anormales plus fréquentes[3].
Distribution platikurtique
Si , on parle de distribution platykurtique (ou platycurtique, platikurtique, platicurtique). Pour une mĂȘme variance, la distribution est relativement « aplatie », son centre et ses queues Ă©tant appauvries au profit des flancs.
Exemples de kurtosis pour quelques distributions absolument continues
La figure suivante représente quelques distributions à densité unimodales centrées réduites symétriques (, et ).
Loi de probabilité | Kurtosis normalisé | Symbole dans la figure | Couleur dans la figure |
---|---|---|---|
Loi de Laplace | 3 | D | Courbe rouge |
Loi sécante hyperbolique | 2 | S | Courbe orange |
Loi logistique | 1,2 | L | Courbe verte |
Loi normale | 0 | N | Courbe noire |
Loi du cosinus surélevé | -0,593762⊠| C | Courbe cyan |
Loi triangulaire | -0,6 | ||
Loi du demi-cercle | -1 | W | Courbe bleue |
Loi uniforme continue | -1,2 | U | Courbe magenta |
Estimateur non biaisé
Une utilisation naĂŻve des dĂ©finitions thĂ©oriques et du coefficient dâaplatissement entraĂźne des mesures biaisĂ©es. Plusieurs logiciels de statistiques (SAS, Tanagra, Minitab, PSPP/SPSS et Excel par exemple, mais pas BMDP) utilisent un estimateur non biaisĂ© pour la loi normale du kurtosis normalisĂ©[4] :
oĂč , et sont des estimateurs non biaisĂ©s respectivement de lâespĂ©rance, de la variance et du moment d'ordre 4 de la variable Ă©tudiĂ©e.
Voir aussi
Notes et références
- GeneviÚve Coudé-Gaussen, Les poussiÚres sahariennes, John Libbey Eurotext, , 485 p. (ISBN 978-0-86196-304-1, lire en ligne), p. 471
- Voir Cumulant (statistiques)#Cumulants et moments.
- Régis Bourbonnais et Michel Terraza, Analyse des séries temporelles, 2e édition, Dunod, 2008, p. 296.
- (en) D.N. Joanes et C.A. Gill, « Comparing Measures of Sample Skewness and Kurtosis », Journal of Statistical Societyt. SĂ©ries D (The statisticain), vol. 47, no 1,â , p. 183-189, page184