Test de Shapiro-Wilk
En statistique, le test de Shapiro–Wilk teste l'hypothèse nulle selon laquelle un échantillon est issu d'une population normalement distribuée. Il a été publié en 1965 par Samuel Sanford Shapiro et Martin Wilk[1].
Test de Shapiro-Wilk
Type | |
---|---|
Nommé en référence à | |
Formule |
Théorie
La statistique de test est:
où
- x(i) (avec des parenthèses entourant l'indice i) désigne la ième statistique d'ordre, i.e., le ième plus petit nombre dans l'échantillon;
- est la moyenne de l'échantillon;
- la constante ai est donnée par[2]
- où
et sont les espérances des statistiques d'ordre d'un échantillon de variables iid suivant une loi normale, et V est la matrice de variance-covariance de ces statistiques d'ordre.
Pour conclure, est alors comparé à une table[3].
Interprétation
Sachant que l'hypothèse nulle est que la population est normalement distribuée,
- si la p-value est inférieure à un niveau alpha choisi (par exemple 0.05), alors l'hypothèse nulle est rejetée (i.e. il est improbable d'obtenir de telles données en supposant qu'elles soient normalement distribuées).
- si la p-value est supérieure au niveau alpha choisi (par exemple 0.05), alors on ne doit pas rejeter l'hypothèse nulle. La valeur de la p-value alors obtenue ne présuppose en rien de la nature de la distribution des données.
Voir aussi Q-Q plot ou droite de Henry.
Voir aussi
Références
- (en) S. S. Shapiro et M. B. Wilk, « An analysis of variance test for normality (complete samples) », Biometrika, vol. 52, nos 3-4,‎ , p. 591–611 (DOI 10.1093/biomet/52.3-4.591, JSTOR 2333709)
- op cit p. 593
- op cit p. 605
Liens externes
Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.