The lady tasting tea
Dans la conception des expériences en statistique, la dame dégustant du thé (the lady tasting tea) est une expérience aléatoire conçue par Ronald Fisher et rapportée dans son livre The Design of Experiments (1935)[1]. L'expérience est l'exposition originale de la notion de Fisher d'une hypothèse nulle, qui "n'est jamais prouvée ou établie, mais est peut-être réfutée, au cours de l'expérimentation"[2] - [3].
La dame en question (Muriel Bristol) a affirmé être en mesure de dire si le thé ou le lait avait été ajouté en premier dans une tasse. Fisher a proposé de lui donner huit tasses, quatre de chaque sorte, dans un ordre aléatoire. On peut alors se demander quelle était la probabilité qu'elle obtienne le nombre précis de tasses qu'elle a identifié correctement, juste par chance.
La description de Fisher fait moins de 10 pages et se distingue par sa simplicité et son exhaustivité en ce qui concerne la terminologie, les calculs et la conception de l'expérience[4]. L'exemple s'inspire librement d'un événement de la vie de Fisher. Le test utilisé était le test exact de Fisher .
L'expérience
L'expérience fournit à un sujet 8 tasses de thé classées au hasard – 4 préparées en versant d'abord le thé, puis en ajoutant du lait, 4 préparées en versant d'abord le lait, puis en ajoutant le thé. Le sujet doit sélectionner 4 tasses préparées selon une méthode. Il est permis de juger des coupes par comparaison directe. La méthode employée dans l'expérience est entièrement divulguée au sujet.
L' hypothèse nulle est que le sujet n'a pas la capacité de distinguer les thés. Dans l'approche de Fisher, il n'y avait pas d' hypothèse alternative[2], contrairement à l'approche Neyman – Pearson.
La statistique du test est un simple décompte du nombre de succès dans la sélection des 4 tasses (le nombre de tasses du type donné sélectionné avec succès). La distribution du nombre possible de succès, en supposant que l'hypothèse nulle est vraie, peut être calculée en utilisant le nombre de combinaisons. En utilisant la formule de combinaison, avec total de tasses et tasses choisies, le nombre de combinaisons donnant lieu à un succès est de :
Nombre de succès | Combinaisons de sélection | Nombre de combinaisons |
---|---|---|
0 | oooo | 1 × 1 = 1 |
1 | ooox, ooxo, oxoo, xooo | 4 × 4 = 16 |
2 | ooxx, oxox, oxxo, xoxo, xxoo, xoox | 6 × 6 = 36 |
3 | oxxx, xoxx, xxox, xxxo | 4 × 4 = 16 |
4 | xxxx | 1 × 1 = 1 |
Total | 70 |
Les fréquences des nombres possibles de succès, données dans la dernière colonne de ce tableau, sont calculées comme suit. Pour 0 succès, il n'y a clairement qu'un seul ensemble de quatre choix (à savoir, choisir les quatre tasses incorrectes) donnant ce résultat. Pour un succès et trois échecs, il y a quatre tasses correctes dont une est sélectionnée, qui par la formule de combinaison peut se produire dans différentes manières (comme indiqué dans la colonne 2, avec x indiquant une tasse correcte qui est choisie et o indiquant une tasse correcte qui n'est pas choisie) ; indépendamment de cela, il y a quatre tasses incorrectes dont trois sont sélectionnées, ce qui peut se produire dans manières (comme indiqué dans la deuxième colonne, cette fois avec x interprété comme une tasse incorrecte qui n'est pas choisie, et o indiquant une tasse incorrecte qui est choisie). Ainsi, une sélection de n'importe quelle tasse correcte et de trois tasses incorrectes peut se produire de l'une des 4 × 4 = 16 manières. Les fréquences des autres nombres possibles de succès sont calculées en conséquence. Ainsi, le nombre de succès est réparti selon la distribution hypergéométrique. La distribution des combinaisons pour effectuer k sélections parmi les 2k sélections disponibles correspond à la k-ème ligne du triangle de Pascal, de sorte que chaque entier de la ligne soit au carré. Dans ce cas, car 4 tasses de thé sont sélectionnées parmi les 8 tasses de thé disponibles.
La région critique pour le rejet de hypothèse nulle de non-capacité à distinguer était le cas unique de 4 succès sur 4 possibles, sur la base du critère de probabilité conventionnel < 5%. C'est la région critique car sous le nul de non-capacité à distinguer, 4 succès ont 1 chance sur 70 (≈ 1,4 % < 5 %) de se produire, alors qu'au moins 3 succès sur 4 ont une probabilité de (16 + 1) / 70 (≈ 24,3 % > 5 %).
Ainsi, Fisher était prêt à rejeter l'hypothèse nulle si et seulement si la dame a correctement distingué les 8 tasses, reconnaissant effectivement la capacité de la dame à un niveau de signification de 1,4 % (mais sans quantifier sa capacité). Fisher a discuté plus tard des avantages de réaliser plusieurs essais et de tests répétés.
David Salsburg rapporte qu'un collègue de Fisher, H. Fairfield Smith, a révélé que dans l'expérience réelle, la dame avait réussi à identifier correctement les huit tasses[5] - [6]. La chance que quelqu'un devine juste toutes les tasses, en supposant que cette personne pose pour hypothèse que quatre tasses ont reçu le thé en premier et que les quatre autres ont reçu le lait en premier, ne serait que de 1 sur 70 (les combinaisons de 8 prises 4 à la fois).
Le livre de The Lady Tasting Tea
David Salsburg a publié un livre de vulgarisation scientifique intitulé The Lady Tasting Tea[5], qui décrit l'expérience et les idées de Fisher sur la randomisation. Deb Basu a écrit que "le cas célèbre de la dame dégustant du thé" était "l'un des deux piliers ... de l'analyse aléatoire des données expérimentales"[7].
Voir également
- Distribution hypergéométrique
- Test de permutation
- Assignation aléatoire
- Test de randomisation
Références
- Fisher 1971, II. The Principles of Experimentation, Illustrated by a Psycho-physical Experiment.
- Fisher 1971, Chapter II. The Principles of Experimentation, Illustrated by a Psycho-physical Experiment, Section 8. The Null Hypothesis.
- OED quote: 1935 R. A. Fisher, The Design of Experiments ii. 19, "We may speak of this hypothesis as the 'null hypothesis' [...] the null hypothesis is never proved or established, but is possibly disproved, in the course of experimentation."
- Sir Ronald A. Fisher, The World of Mathematics, volume 3, Courier Dover Publications, (1re éd. The Design of Experiments (1935)) (ISBN 978-0-486-41151-4), « Mathematics of a Lady Tasting Tea ».
- Salsburg (2002).
- Joan Fisher Box, R.A. Fisher, The Life of a Scientist, New York, Wiley, (ISBN 0-471-09300-9), p. 134.
- Basu (1980a, p. 575; 1980b).
- Ronald A. Fisher, The Design of Experiments, Macmillan, , 9th éd. (1re éd. 1935) (ISBN 0-02-844690-9).
- D. Basu, « Randomization Analysis of Experimental Data: The Fisher Randomization Test », Journal of the American Statistical Association, vol. 75, no 371, 1980a, p. 575–582 (DOI 10.2307/2287648, JSTOR 2287648).
- Basu, D. (1980b). "The Fisher Randomization Test", reprinted with a new preface in Statistical Information and Likelihood : A Collection of Critical Essays by Dr D. Basu ; J. K. Ghosh, editor. Springer 1988.
- Kempthorne, Oscar, Current Issues in Statistical Inference – Essays in Honor of D. Basu, Hayward, CA., IMS, coll. « Institute of Mathematical Statistics Lecture Notes - Monograph Series », , 13–31 p. (ISBN 0-940600-24-2, DOI 10.1214/lnms/1215458836), « Intervention experiments, randomization and inference ».
- Salsburg, D. (2002) The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century, W.H. Freeman / Owl Book. (ISBN 0-8050-7134-2).