Asymétrie (statistiques)
En thĂ©orie des probabilitĂ©s et statistique, le coefficient d'asymĂ©trie (skewness en anglais) correspond Ă une mesure de lâasymĂ©trie de la distribution dâune variable alĂ©atoire rĂ©elle.
Câest le premier des paramĂštres de forme, avec le kurtosis (les paramĂštres basĂ©s sur les moments dâordre 5 et plus nâont pas de nom attribuĂ©).
En termes gĂ©nĂ©raux, lâasymĂ©trie dâune distribution est positive si la queue de droite (Ă valeurs hautes) est plus longue ou grosse, et nĂ©gative si la queue de gauche (Ă valeurs basses) est plus longue ou grosse.
DĂ©finition
Ătant donnĂ© une variable alĂ©atoire rĂ©elle X de moyenne ÎŒ et dâĂ©cart type Ï, on dĂ©finit son coefficient dâasymĂ©trie comme le moment dâordre trois de la variable centrĂ©e rĂ©duite :
lorsque cette espérance existe. On a donc :
avec les moments centrĂ©s dâordre i et Își les cumulants dâordre i.
Propriétés
Dimension
Les moments centrĂ©s ÎŒi et cumulants Își ayant pour dimension celle de la variable X Ă©levĂ©e Ă la puissance i, le coefficient dâasymĂ©trie Îł1 est une grandeur adimensionnelle.
Somme de réalisations indépendantes
Soient X une variable alĂ©atoire rĂ©elle et la somme de n rĂ©alisations indĂ©pendantes de X (exemple : la loi binomiale de paramĂštres n et p, somme de n rĂ©alisations indĂ©pendantes de la loi de Bernoulli de paramĂštre p). GrĂące Ă la propriĂ©tĂ© dâadditivitĂ© des cumulants, on sait que Își(Y) = n Își(X), donc :
Forme de la distribution
- Un coefficient négatif indique une distribution décalée à droite de la médiane, et donc une queue de distribution étalée vers la gauche.
- Un coefficient positif indique une distribution décalée à gauche de la médiane, et donc une queue de distribution étalée vers la droite.
- Un coefficient nul n'indique pas nécessairement que la distribution est symétrique, mais une distribution symétrique a un coefficient nul.
Estimation de l'asymétrie
Estimateur non biaisé pour la loi normale
Un estimateur de lâasymĂ©trie, non biaisĂ© pour la loi normale, est :
oĂč et sont des estimateurs non biaisĂ©s respectivement de lâespĂ©rance et de la variance.
Mesures de l'asymétrie par d'autres paramÚtres
Karl Pearson a proposé d'autres estimations de l'asymétrie par des calculs plus simples[1], ne faisant pas appel aux moments mais à d'autres paramÚtres statistiques :
- Premier coefficient d'asymétrie de Pearson (asymétrie de mode)
Le coefficient d'asymétrie de mode de Pearson est donné par [2]:
- moyenne â modeĂ©cart type.
- DeuxiÚme coefficient d'asymétrie de Pearson (asymétrie de médiane)
Le coefficient d'asymétrie de médiane de Pearson est donné par [3] - [4] :
- 3 (moyenne â mĂ©diane)Ă©cart-type.
Mesures par des quartiles
La mesure de l'asymĂ©trie proposĂ©e par Bowley (en 1901)[5] - [6], ou coefficient de Yule (de 1912)[7] - [8], mesure de l'asymĂ©trie de Galton[9] ou indice de YuleâKendall[10] est dĂ©finie par :
- .
Par la deuxiÚme forme, on voit que le numérateur est la différence entre la moyenne des premier et troisiÚme quartiles (mesure de localisation) et la médiane, tandis que le dénominateur représente la déviation moyenne absolue de la dispersion (dans les cas symétriques).
Une formulation plus générale d'une fonction d'asymétrie a été décrite par Groeneveld et Meeden[11] - [12] - [13] :
oĂč F est la fonction de rĂ©partition. On obtient ainsi une mesure gĂ©nĂ©rale de l'asymĂ©trie[12] dĂ©finie par le supremum de cette fonction pour 1/2 †u < 1. Une autre mesure peut ĂȘtre obtenue avec les intĂ©grales des numĂ©rateurs et dĂ©nominateurs de cette expression[11]. La fonction Îł(u) vĂ©rifie â1 †γ(u) †1 et est bien dĂ©finie sans nĂ©cessiter l'existence de tous les moments de la distribution considĂ©rĂ©e[11]. Si les mesures de l'asymĂ©trie par les quantiles sont simples Ă interprĂ©ter, elles ont cependant tendance Ă varier plus que les calculs par les moments. Par exemple, la loi uniforme a une asymĂ©trie par quantiles plus grande.
Le coefficient de Yule correspond Ă Îł(3/4) et la mesure de Kelley vaut Îł(0,1)[14].
Lien entre coefficient d'asymétrie et mesure de chiralité
Mesurer l'asymĂ©trie de la distribution d'une variable alĂ©atoire rĂ©elle revient Ă Ă©valuer quantitativement la diffĂ©rence entre cette distribution et son image miroir : il y a rĂ©flexion par rapport au point moyen, d'oĂč un lien formel avec les mesures de chiralitĂ©. Cette mesure d'asymĂ©trie peut s'effectuer avec l'indice chiral. Dans le cas d'une distribution de variance finie et non nulle, il est donnĂ© par :
oĂč est la borne supĂ©rieure du coefficient de corrĂ©lation entre la distribution et son image miroir. L'indice chiral prend des valeurs dans l'intervalle [0;1/2]. Dans le cas de n observations, est le coefficient de corrĂ©lation entre les observations triĂ©es par valeurs croissantes et les observations triĂ©es par valeurs dĂ©croissantes. Contrairement Ă d'autres mesures d'asymĂ©trie, l'indice chiral s'annule si et seulement si la distribution est symĂ©trique, au sens d'une symĂ©trie indirecte [15].
Voir aussi
Notes et références
- (en) Cet article est partiellement ou en totalitĂ© issu de lâarticle de WikipĂ©dia en anglais intitulĂ© « Skewness » (voir la liste des auteurs).
- « Archived copy » (version du 5 juillet 2010 sur Internet Archive)
- (en) Eric W. Weisstein, « Pearson Mode Skewness », sur MathWorld
- (en) Eric W. Weisstein, « Pearson's skewness coefficients », sur MathWorld
- Doane, David P., and Lori E. Seward. "Measuring Skewness: A Forgotten Statistic?" Journal of Statistics Education 19.2 (2011): 1-18.
- Bowley, A. L. (1901). Elements of Statistics, P.S. King & Son, Laondon. Or in a later edition: BOWLEY, AL. "Elements of Statistics, 4th Edn (New York, Charles Scribner)."(1920).
- Kenney JF and Keeping ES (1962) Mathematics of Statistics, Pt. 1, 3rd ed., Van Nostrand, (page 102).
- Yule, George Udny. An introduction to the theory of statistics. C. Griffin, limited, 1912.
- Groeneveld, Richard A. "An influence function approach to describing the skewness of a distribution." The American Statistician 45.2 (1991): 97-102.
- Johnson et al (1994) p 3, p 40
- Wilks DS (1995) Statistical Methods in the Atmospheric Sciences, p 27. Academic Press. (ISBN 0-12-751965-3)
- R.A. Groeneveld et G. Meeden, « Measuring Skewness and Kurtosis », The Statistician, vol. 33, no 4,â , p. 391â399 (DOI 10.2307/2987742, JSTOR 2987742)
- MacGillivray (1992)
- Hinkley DV (1975) "On power transformations to symmetry", Biometrika, 62, 101â111
- A.W.L. Pubudu Thilan, « Applied Statistics I: Chapter 5: Measures of skewness », sur University of Ruhuna, p. 21
- Michel Petitjean, « Chirality and Symmetry Measures: A Transdisciplinary Review », Entropy, vol. 5, no 3,â , p. 271--312 (DOI https://doi.org/10.3390/e5030271, zbMATH 1078.00503) (voir section 2.9, en particulier le bas de la page 282)