Take-the-best heuristic
En psychologie, l'heuristique dite du meilleur choix[1] est une heuristique (une stratĂ©gie simple de prise de dĂ©cision) qui permet de choisir entre deux possibilitĂ©s en se fondant sur le premier indice qui les discrimine, oĂč les indices sont ordonnĂ©s par leur validitĂ©, du plus Ă©levĂ© au plus faible. Dans la formulation originale, les indices Ă©taient supposĂ©s avoir des valeurs binaires (oui ou non) ou une valeur inconnue. La logique de l'heuristique est qu'elle fonde son choix uniquement sur le meilleur indice (raison) et ignore le reste.
Les psychologues Gerd Gigerenzer et Daniel Goldstein ont dĂ©couvert quâelle est Ă©tonnamment efficace pour faire des infĂ©rences ou dĂ©ductions prĂ©cises dans des environnements rĂ©els, par exemple en dĂ©duisant laquelle de deux villes est la plus grande. L'heuristique a depuis Ă©tĂ© modifiĂ©e et appliquĂ©e Ă des domaines tels que la mĂ©decine, de l'intelligence artificielle et de la prĂ©vision politique[2] - [3]. Il a Ă©galement Ă©tĂ© dĂ©montrĂ© que l'heuristique peut modĂ©liser avec prĂ©cision la maniĂšre dont les experts, tels que les douaniers des aĂ©roports[4] et les cambrioleurs professionnels, prennent leurs dĂ©cisions[5]. Lâheuristique peut Ă©galement prĂ©dire les dĂ©tails du processus cognitif, tels que les nombres dâindices utilisĂ©s et les temps de rĂ©ponse, souvent mieux que les modĂšles complexes qui intĂšgrent tous les indices disponibles[6] - [7].
Prise de décision à raison unique
Les thĂ©ories de la prise de dĂ©cision supposent gĂ©nĂ©ralement que toutes les raisons pertinentes (caractĂ©ristiques ou indices) sont recherchĂ©es et intĂ©grĂ©es dans une dĂ©cision finale. Pourtant, en cas dâincertitude (par opposition au risque), les indices pertinents ne sont gĂ©nĂ©ralement pas tous connus, pas plus que leur pondĂ©ration prĂ©cise et les corrĂ©lations entre les indices. Dans ces situations, se fier uniquement au meilleur indice disponible peut ĂȘtre une possibilitĂ© raisonnable qui permet de prendre des dĂ©cisions rapides, Ă©conomes et prĂ©cises. Câest la logique dâune classe dâheuristiques connue sous le nom de « dĂ©cision Ă une raison » qui comprend la mĂ©thode « take-the-best »[8]. Pour des indices ayant des valeurs binaires (0,1), oĂč 1 indique la valeur de lâindice qui est associĂ©e Ă une valeur de critĂšres plus Ă©levĂ©e, la tĂąche consiste Ă dĂ©duire quelle valeur de critĂšre des deux possibilitĂ©s est la plus Ă©levĂ©e. Par exemple, sur deux Ă©quipes de NBA on cherchera Ă savoir quelle Ă©quipe sortira gagnante en se basant sur des indices tel le vainqueur du dernier match ou quelle Ă©quipe joue Ă domicile. Lâheuristique du meilleur choix implique trois Ă©tapes pour faire une telle hypothĂšse[9] :
- RÚgle de recherche : rechercher les indices dans l'ordre de leur validité.
- RĂšgle d'arrĂȘt : arrĂȘter la recherche lorsque lâon trouve le premier indice oĂč les valeurs des deux possibilitĂ©s diffĂ©rent.
- RÚgle de décision : prédire que la possibilité ayant la valeur de repÚre la plus élevée a la valeur la plus élevée sur la variable de résultat.
La validitĂ© v dâun indice est donnĂ©e par v= C/(C+W), oĂč C est le nombre dâinfĂ©rences correctes lorsquâun indice est discriminant, et W est le nombre dâinfĂ©rences erronĂ©es, toutes estimĂ©es Ă partir dâĂ©chantillons.
Le meilleur choix pour une tĂąche de comparaison
ConsidĂ©rez la tĂąche consistant Ă dĂ©duire quel objet, A ou B, a une valeur plus Ă©levĂ©e sur un critĂšre numĂ©rique. Par exemple, imaginez quelquâun qui doit juger si la ville allemande de Cologne a une population plus importante que la ville de Stuttgart. Ce jugement ou cette dĂ©duction doit se fonder sur les informations fournies par les indices binaires, comme « La ville est-elle la capitale de lâAllemagne ? ». Dâun point de vue formel, la tĂąche est une catĂ©gorisation : une paire (A,B) doit ĂȘtre classĂ©e tel que X A > X B ou X B > X A (oĂč X dĂ©signe le critĂšre), sur la base dâinformations fournies par les indices.
Les indices sont binaires, ce qui signifie quâils prennent deux valeurs et peuvent ĂȘtre modĂ©lisĂ©s, par exemple, comme ayant les valeurs 0 et 1 (pour « oui » et « non »). Ils sont classĂ©s en fonction de leur validitĂ©, dĂ©finie comme la proportion de comparaisons correctes parmi les paires A et , pour lesquelles ils ont des valeurs diffĂ©rentes câest-Ă -dire pour lesquelles ils discriminent entre A et B. La mĂ©thode du meilleur choix analyse chaque indice lâun aprĂšs lâautre, selon un classement par validitĂ© et sâarrĂȘte la premiĂšre fois quâun indice discrimine entre les items et conclut que lâitem avec la plus grande valeur a aussi une plus grande valeur sur le critĂšre. La matrice de tous les objets de la classe de rĂ©fĂ©rence, dont A et B ont Ă©tĂ© triĂ©s, et les valeurs des indices qui dĂ©crivent ces objets constitue ce que lâon appelle un environnement. Les thĂ©oriciens du meilleur choix, Gigerenzer et Goldstein (voir Gerd Gigerenzer et Daniel Goldstein, DG (1996)[10] ) ont considĂ©rĂ© dans leur thĂ©orie lâexemple de paires de villes allemandes, mais seulement celles de plus de 100.000 habitants. La tĂąche de comparaison pour une paire donnĂ©e (A, B) de villes allemandes dans la classe de rĂ©fĂ©rence, consistant Ă Ă©tablir laquelle a une plus grande population, sur la base de 9 indices. Les indices Ă©taient Ă©valuĂ©s de maniĂšre binaire, tel que lâon pouvait retenir par exemple le fait que la ville soit la capitale ou non, ou quâelle ait une Ă©quipe de football en ligue nationale ou non. Les valeurs indices pouvaient ĂȘtre modĂ©lisĂ©es par des 1 (pour « oui ») et des 0 (pour « non »), de sorte que chaque ville pouvait ĂȘtre identifiĂ©e par son « profil dâindice », câest-Ă -dire un vecteur de 1 et de 0, ordonnĂ© selon le classement des indices.
La question Ă©tait la suivant : Comment dĂ©duire lequel des deux objets, par exemple la ville A avec le profil dâindices (100101010) et la ville B avec le profil dâindices (100010101), obtient le meilleur score sur le critĂšre Ă©tabli, câest-Ă -dire la taille de la population ? La mĂ©thode du meilleur choix heuristique compare simplement les profils lexicographiquement, tout comme on compare des nombres Ă©crits en base deux : Le premier indice est 1 pour les deux, ce qui signifie que le premier indice ne fait pas de discrimination entre A et B. Le deuxiĂšme indice a pour valeur 0 dans les deux cas, cet indice ne fait pas discrimination non plus. Il en va de mĂȘme pour le troisiĂšme indice, tandis que pour le quatriĂšme la valeur est de 1 pour A et de 0 pour B, ce qui implique que A est jugĂ© comme ayant une valeur plus Ă©levĂ©e sur le critĂšre. En dâautres termes, X A > X B si et seulement si (100101010) > (100010101).
Mathématiquement, cela signifie que les indices trouvés pour la comparaison permettent un quasi-isomorphisme d'ordre entre les objets comparés sur le critÚre, dans ce cas les villes avec leurs populations, et leurs vecteurs binaires correspondants. Ici, "quasi" signifie que l'isomorphisme n'est, en général, pas parfait, car l'ensemble des indices n'est pas parfait.
Ce qui est surprenant, c'est que cette simple heuristique a une grande performance par rapport aux autres stratégies. Une mesure évidente pour établir la performance d'un mécanisme d'inférence est déterminée par le pourcentage de jugements corrects. En outre, ce qui importe le plus, ce n'est pas seulement la performance de l'heuristique lors de l'ajustement de données connues, mais aussi lors de la généralisation d'un ensemble d'apprentissage connu à de nouveaux éléments.
Czerlinski, Goldstein and Gigerenzer ont comparé plusieurs stratégies avec la méthode de la meilleure décision : Un modÚle simple de Tallying, ou de poids unitaire (également appelé « rÚgle de Dawes » dans cette littérature), un modÚle linéaire pondéré sur les indices pondérés par leurs validités (également appelé « rÚgle de Franklin »), la régression linéaire et le minimalisme. Leurs résultats montrent la robustesse de la méthode du meilleur choix en matiÚre de généralisation.
Par exemple, considérons la tùche consistant à choisir la plus grande ville parmi deux villes lorsque :
- Les modÚles sont ajustés à un ensemble de données de 83 villes allemandes ;
- Les modÚles sélectionnent la plus grande d'une paire de villes pour toutes les 83*82/2 paires de villes.
Le pourcentage de bonnes rĂ©ponses Ă©tait dâenviron 74% pour la rĂ©gression. Plus prĂ©cisĂ©ment, les scores Ă©taient de 74,3% 74,2% et 74,1%, de sorte que la rĂ©gression a gagnĂ© une petite marge.
Cependant, lâarticle a Ă©galement pris en compte la gĂ©nĂ©ralisation (Ă©galement connue sous le nom de prĂ©diction hors Ă©chantillon).
- les modĂšles sont adaptĂ©s Ă un ensemble de donnĂ©es constituĂ© dâune moitiĂ© de 83 villes allemandes sĂ©lectionnĂ©es au hasard.
- Les modĂšles sĂ©lectionnent la plus grande ville d'une paire d'une ville tirĂ©s de « lâautre » moitiĂ© des villes.
Dans ce cas, lorsque 10 000 divisions alĂ©atoires diffĂ©rentes ont Ă©tĂ© utilisĂ©es, la rĂ©gression a obtenu en moyenne 71,9%, de rĂ©sultats corrects, la mĂ©thode de lâheuristique 72,2% et lâunitĂ© avec linĂ©aire 71,4%. La mĂ©thode du meilleur choix heuristique Ă©tait plus prĂ©cise que la rĂ©gression dans ce cas[3].
Références
- (en) Cet article est partiellement ou en totalitĂ© issu de lâarticle de WikipĂ©dia en anglais intitulĂ© « Take-the-best heuristic » (voir la liste des auteurs).
- Gigerenzer, G. & Goldstein, D. G. (1996). "Reasoning the fast and frugal way: Models of bounded rationality". Psychological Review, 103, 650-669.
- Graefe et Armstrong, J. Scott, « Predicting elections from the most important issue: A test of the takeâtheâbest heuristic », Journal of Behavioral Decision Making, vol. 25, no 1,â , p. 41â48 (DOI 10.1002/bdm.710, lire en ligne)
- Czerlinski, J., Goldstein, D. G., & Gigerenzer, G. (1999). "How good are simple heuristics?" In Gigerenzer, G., Todd, P. M. & the ABC Group, Simple Heuristics That Make Us Smart. New York: Oxford University Press.
- Pachur, T. & Marinello, G. (2013). Expert intuitions: How to model the decision strategies of airport customs officers? Acta Psychologica, 144, 97â103.
- Garcia-Retamero, R., & Dhami, M. K. (2009). Take-the-best in expert-novice decision strategies for residential burglary. Psychonomic Bulletin & Review, 16, 163â169
- Bergert F. B., & Nosofsky, R. M. (2007). A response-time approach to comparing generalized rational and take-the-best models of decision making. Journal of Experimental Psychology: Learning, Memory and Cognition, 331, 107â129
- Bröder, A. (2012). The quest for take-the-best. In P. M. Todd, G. Gigerenzer, & the ABC Research Group, Ecological rationality: Intelligence in the world (p. 216â240). New York: Oxford University Press
- Gigerenzer, G., & Gaissmaier, W. (2011). Heuristic decision making. Annual Review of Psychology, 62. 451â482
- Gigerenzer, G., & Goldstein, D. G. (1996). Reasoning the fast and frugal way: Models of bounded rationality. Psychological Review, 103, 650â669.
- Gigerenzer & Goldstein, 1996 - APA Psynet - Reasoning the fast and frugal way: Models of bounded rationality
- MH. Martignon & Hoffrage (2002) - Fast, frugal, and fit: Simple heuristics for paired comparison