Accueil🇫🇷Chercher

Test de Student

En statistique, un test de Student[1], ou test t[2], désigne n'importe quel test statistique paramétrique où la statistique de test calculée suit une loi de Student lorsque l’hypothèse nulle est vraie.

Test de Student
Régions de rejet au niveau 10% d'un test de Student à 7 degrés de liberté.
Type
Test statistique, test paramétrique (d)
Inventeur
William Gosset (« Student »)

Histoire

Façade de la brasserie historique Guinness de St. James.
William Sealy Gosset, qui inventa le test t, sous le pseudonyme Student.

Le test de Student et la loi de probabilités qui lui correspond ont été publiés en 1908 dans la revue Biometrika par William Gosset[3]. Gosset, un employé de la brasserie Guinness à Dublin, y avait développé le test t à des fins de contrôle de la qualité de la production de bière stout. La brasserie avait pour règle que ses chimistes ne publient pas leurs découvertes. Gosset argua que son article ne serait d'aucune utilité pour les concurrents et obtint l'autorisation de publier mais sous un pseudonyme, Student, pour éviter les difficultés avec les autres membres de son équipe[4].

Le test t est devenu célèbre grâce aux travaux de Ronald Fisher qui montra que ce test ne couvre pas le cas des échantillons de grande taille. Il apporta donc des modifications au test de Student afin de le généraliser.

Exemples d'utilisation

Le test t a plusieurs utilisations dont voici les plus fréquentes :

  • Comparaison de moyenne d'une loi normale à une valeur si la variance est inconnue.
  • Comparaison de deux moyennes issues de deux lois normales si leurs variances sont égales et inconnues. Dans le cas où leurs variances sont différentes et inconnues, on utilise une adaptation appelée le test t de Welch.
  • Test sur les coefficients dans le cadre d'une régression linéaire.
  • Test sur des échantillons appariés

Principe : test de Student sur un échantillon de loi normale

On souhaite comparer la moyenne μ d'une population de loi normale et d’écart type σ non connu à une valeur déterminée μ0. L'hypothèse nulle est H0 : μ = μ0, autrement dit on suppose a priori que la moyenne vaut μ0. On se place maintenant sous l'hypothèse nulle. On considère un échantillon de taille n de cette population , autrement dit, selon l'hypothèse nulle, chaque est une variable aléatoire qui soit une loi normale de moyenne μ0 et d'écart type σ. De plus, les sont indépendantes. On estime alors la moyenne par la moyenne empirique :

.

Selon l’hypothèse nulle, la distribution d’échantillonnage de la moyenne se distribue elle aussi normalement avec un écart type σ/√n. Comme la variance σ2 est inconnue, on l'estime par son estimateur sans biais (on note la division par au lieu de afin d'avoir un estimateur sans biais) :

.

D'après le théorème de Cochran, sous l'hypothèse nulle, suit une loi du chi deux à n – 1 degrés de liberté.

On pose la statistique de test suivante :

Par définition, la statistique suit une loi de Student à n – 1 degrés de liberté. On choisit un risque α, généralement 0,05 ou 0,01 et l'on calcule la réalisation de la statistique de test :

où .

On rappelle que l'on veut tester H0 : μ = μ0. Ainsi, si |z| est supérieur au quantile d'ordre 1 – α/2 de la loi de Student à n – 1 degrés de liberté alors on rejette l'hypothèse nulle.

  • Cas où l'on veut tester H0 : μ ≤ μ0 : si z est supérieur au quantile d'ordre 1 – α de la loi de Student à n – 1 degrés de liberté alors on rejette l'hypothèse nulle.
  • Cas où l'on veut tester H0 : μ ≥ μ0 : si z est inférieur au quantile d'ordre α de la loi de Student à n – 1 degrés de liberté alors on rejette l'hypothèse nulle.

Remarque : si l'on note tk, α le quantile d'ordre α de la loi de Student à k degrés de liberté alors on a l'égalité tk, α = – tk, 1 – α.

Implémentation

Langage/Logiciel Fonction Notes
R t.test
SAS PROC TTEST
Python scipy.stats.ttest_ind
Matlab ttest
Mathematica TTEST
Stata ttest
Julia OneSampleTTest

EqualVarianceTTest

Maple OneSampleTTest, TwoSampleTTest, TwoSamplePairedTTest [5]

Notes et références

  1. Bernard Ycart, « Tests statistiques », Cahier de Mathématiques Appliquées, no 6,‎ (lire en ligne [PDF])
  2. Gaël Millot, Comprendre et réaliser les tests statistiques à l'aide de R : manuel de biostatistique, dl 2018 (ISBN 978-2-8073-0291-4 et 2-8073-0291-2, OCLC 1023590131, lire en ligne)
  3. "Student" William Sealy Gosset (1908). "The probable error of a mean" (PDF). Biometrika. 6 (1): 1–25. doi:10.1093/biomet/6.1.1. hdl:10338.dmlcz/143545. JSTOR 2331554
  4. Harold Hotelling (1930, p. 189) dans un article de British statistics cité par S. L. Zabell dans On Student's 1908 paper "The probable error of the mean", Journal of the American Statistical Association 103 (2008), p. 1-7 DOI 10.1198/016214508000000030 JSTOR:27640017
  5. « Student's t-Test - Maple Help », sur www.maplesoft.com (consulté le )

Voir aussi

  • Loi de Student, la loi de probabilité de la statistique dans le test t
  • Test t de Welch, une adaptation pour comparer deux moyennes de deux lois normales dont les variances sont inconnues et inégales
  • Test de Wald
Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.