AccueilđŸ‡«đŸ‡·Chercher

Take-the-best heuristic

En psychologie, l'heuristique dite du meilleur choix[1] est une heuristique (une stratĂ©gie simple de prise de dĂ©cision) qui permet de choisir entre deux possibilitĂ©s en se fondant sur le premier indice qui les discrimine, oĂč les indices sont ordonnĂ©s par leur validitĂ©, du plus Ă©levĂ© au plus faible. Dans la formulation originale, les indices Ă©taient supposĂ©s avoir des valeurs binaires (oui ou non) ou une valeur inconnue. La logique de l'heuristique est qu'elle fonde son choix uniquement sur le meilleur indice (raison) et ignore le reste.

Les psychologues Gerd Gigerenzer et Daniel Goldstein ont dĂ©couvert qu’elle est Ă©tonnamment efficace pour faire des infĂ©rences ou dĂ©ductions prĂ©cises dans des environnements rĂ©els, par exemple en dĂ©duisant laquelle de deux villes est la plus grande. L'heuristique a depuis Ă©tĂ© modifiĂ©e et appliquĂ©e Ă  des domaines tels que la mĂ©decine, de l'intelligence artificielle et de la prĂ©vision politique[2] - [3]. Il a Ă©galement Ă©tĂ© dĂ©montrĂ© que l'heuristique peut modĂ©liser avec prĂ©cision la maniĂšre dont les experts, tels que les douaniers des aĂ©roports[4] et les cambrioleurs professionnels, prennent leurs dĂ©cisions[5]. L’heuristique peut Ă©galement prĂ©dire les dĂ©tails du processus cognitif, tels que les nombres d’indices utilisĂ©s et les temps de rĂ©ponse, souvent mieux que les modĂšles complexes qui intĂšgrent tous les indices disponibles[6] - [7].

Prise de décision à raison unique

Les thĂ©ories de la prise de dĂ©cision supposent gĂ©nĂ©ralement que toutes les raisons pertinentes (caractĂ©ristiques ou indices) sont recherchĂ©es et intĂ©grĂ©es dans une dĂ©cision finale. Pourtant, en cas d’incertitude (par opposition au risque), les indices pertinents ne sont gĂ©nĂ©ralement pas tous connus, pas plus que leur pondĂ©ration prĂ©cise et les corrĂ©lations entre les indices. Dans ces situations, se fier uniquement au meilleur indice disponible peut ĂȘtre une possibilitĂ© raisonnable qui permet de prendre des dĂ©cisions rapides, Ă©conomes et prĂ©cises. C’est la logique d’une classe d’heuristiques connue sous le nom de « dĂ©cision Ă  une raison » qui comprend la mĂ©thode « take-the-best »[8]. Pour des indices ayant des valeurs binaires (0,1), oĂč 1 indique la valeur de l’indice qui est associĂ©e Ă  une valeur de critĂšres plus Ă©levĂ©e, la tĂąche consiste Ă  dĂ©duire quelle valeur de critĂšre des deux possibilitĂ©s est la plus Ă©levĂ©e. Par exemple, sur deux Ă©quipes de NBA on cherchera Ă  savoir quelle Ă©quipe sortira gagnante en se basant sur des indices tel le vainqueur du dernier match ou quelle Ă©quipe joue Ă  domicile. L’heuristique du meilleur choix implique trois Ă©tapes pour faire une telle hypothĂšse[9] :

  • RĂšgle de recherche : rechercher les indices dans l'ordre de leur validitĂ©.
  • RĂšgle d'arrĂȘt : arrĂȘter la recherche lorsque l’on trouve le premier indice oĂč les valeurs des deux possibilitĂ©s diffĂ©rent.
  • RĂšgle de dĂ©cision : prĂ©dire que la possibilitĂ© ayant la valeur de repĂšre la plus Ă©levĂ©e a la valeur la plus Ă©levĂ©e sur la variable de rĂ©sultat.

La validitĂ© v d’un indice est donnĂ©e par v= C/(C+W), oĂč C est le nombre d’infĂ©rences correctes lorsqu’un indice est discriminant, et W est le nombre d’infĂ©rences erronĂ©es, toutes estimĂ©es Ă  partir d’échantillons.

Le meilleur choix pour une tĂąche de comparaison

ConsidĂ©rez la tĂąche consistant Ă  dĂ©duire quel objet, A ou B, a une valeur plus Ă©levĂ©e sur un critĂšre numĂ©rique. Par exemple, imaginez quelqu’un qui doit juger si la ville allemande de Cologne a une population plus importante que la ville de Stuttgart. Ce jugement ou cette dĂ©duction doit se fonder sur les informations fournies par les indices binaires, comme « La ville est-elle la capitale de l’Allemagne ? ». D’un point de vue formel, la tĂąche est une catĂ©gorisation : une paire (A,B) doit ĂȘtre classĂ©e tel que X A > X B ou X B > X A (oĂč X dĂ©signe le critĂšre), sur la base d’informations fournies par les indices.

Les indices sont binaires, ce qui signifie qu’ils prennent deux valeurs et peuvent ĂȘtre modĂ©lisĂ©s, par exemple, comme ayant les valeurs 0 et 1 (pour « oui » et « non »). Ils sont classĂ©s en fonction de leur validitĂ©, dĂ©finie comme la proportion de comparaisons correctes parmi les paires A et , pour lesquelles ils ont des valeurs diffĂ©rentes c’est-Ă -dire pour lesquelles ils discriminent entre A et B. La mĂ©thode du meilleur choix analyse chaque indice l’un aprĂšs l’autre, selon un classement par validitĂ© et s’arrĂȘte la premiĂšre fois qu’un indice discrimine entre les items et conclut que l’item avec la plus grande valeur a aussi une plus grande valeur sur le critĂšre. La matrice de tous les objets de la classe de rĂ©fĂ©rence, dont A et B ont Ă©tĂ© triĂ©s, et les valeurs des indices qui dĂ©crivent ces objets constitue ce que l’on appelle un environnement. Les thĂ©oriciens du meilleur choix, Gigerenzer et Goldstein (voir Gerd Gigerenzer et Daniel Goldstein, DG (1996)[10] ) ont considĂ©rĂ© dans leur thĂ©orie l’exemple de paires de villes allemandes, mais seulement celles de plus de 100.000 habitants. La tĂąche de comparaison pour une paire donnĂ©e (A, B) de villes allemandes dans la classe de rĂ©fĂ©rence, consistant Ă  Ă©tablir laquelle a une plus grande population, sur la base de 9 indices. Les indices Ă©taient Ă©valuĂ©s de maniĂšre binaire, tel que l’on pouvait retenir par exemple le fait que la ville soit la capitale ou non, ou qu’elle ait une Ă©quipe de football en ligue nationale ou non. Les valeurs indices pouvaient ĂȘtre modĂ©lisĂ©es par des 1 (pour « oui ») et des 0 (pour « non »), de sorte que chaque ville pouvait ĂȘtre identifiĂ©e par son « profil d’indice », c’est-Ă -dire un vecteur de 1 et de 0, ordonnĂ© selon le classement des indices.

La question Ă©tait la suivant : Comment dĂ©duire lequel des deux objets, par exemple la ville A avec le profil d’indices (100101010) et la ville B avec le profil d’indices (100010101), obtient le meilleur score sur le critĂšre Ă©tabli, c’est-Ă -dire la taille de la population ? La mĂ©thode du meilleur choix heuristique compare simplement les profils lexicographiquement, tout comme on compare des nombres Ă©crits en base deux : Le premier indice est 1 pour les deux, ce qui signifie que le premier indice ne fait pas de discrimination entre A et B. Le deuxiĂšme indice a pour valeur 0 dans les deux cas, cet indice ne fait pas discrimination non plus. Il en va de mĂȘme pour le troisiĂšme indice, tandis que pour le quatriĂšme la valeur est de 1 pour A et de 0 pour B, ce qui implique que A est jugĂ© comme ayant une valeur plus Ă©levĂ©e sur le critĂšre. En d’autres termes, X A > X B si et seulement si (100101010) > (100010101).

Mathématiquement, cela signifie que les indices trouvés pour la comparaison permettent un quasi-isomorphisme d'ordre entre les objets comparés sur le critÚre, dans ce cas les villes avec leurs populations, et leurs vecteurs binaires correspondants. Ici, "quasi" signifie que l'isomorphisme n'est, en général, pas parfait, car l'ensemble des indices n'est pas parfait.

Ce qui est surprenant, c'est que cette simple heuristique a une grande performance par rapport aux autres stratégies. Une mesure évidente pour établir la performance d'un mécanisme d'inférence est déterminée par le pourcentage de jugements corrects. En outre, ce qui importe le plus, ce n'est pas seulement la performance de l'heuristique lors de l'ajustement de données connues, mais aussi lors de la généralisation d'un ensemble d'apprentissage connu à de nouveaux éléments.

Czerlinski, Goldstein and Gigerenzer ont comparé plusieurs stratégies avec la méthode de la meilleure décision : Un modÚle simple de Tallying, ou de poids unitaire (également appelé « rÚgle de Dawes » dans cette littérature), un modÚle linéaire pondéré sur les indices pondérés par leurs validités (également appelé « rÚgle de Franklin »), la régression linéaire et le minimalisme. Leurs résultats montrent la robustesse de la méthode du meilleur choix en matiÚre de généralisation.

Heuristic performance on the German city data set
Performances heuristiques sur l'ensemble de données de la ville allemande, générées avec ggplot2 sur la base des données dans[3]. Voir les étapes pour reproduire sur CRAN .
Heuristic performance across 20 data sets
Performances heuristiques sur 20 ensembles de données à partir d'une illustration à l'intérieur de la référence n ° [11]

Par exemple, considérons la tùche consistant à choisir la plus grande ville parmi deux villes lorsque :

  • Les modĂšles sont ajustĂ©s Ă  un ensemble de donnĂ©es de 83 villes allemandes ;
  • Les modĂšles sĂ©lectionnent la plus grande d'une paire de villes pour toutes les 83*82/2 paires de villes.

Le pourcentage de bonnes rĂ©ponses Ă©tait d’environ 74% pour la rĂ©gression. Plus prĂ©cisĂ©ment, les scores Ă©taient de 74,3% 74,2% et 74,1%, de sorte que la rĂ©gression a gagnĂ© une petite marge.

Cependant, l’article a Ă©galement pris en compte la gĂ©nĂ©ralisation (Ă©galement connue sous le nom de prĂ©diction hors Ă©chantillon).

  • les modĂšles sont adaptĂ©s Ă  un ensemble de donnĂ©es constituĂ© d’une moitiĂ© de 83 villes allemandes sĂ©lectionnĂ©es au hasard.
  • Les modĂšles sĂ©lectionnent la plus grande ville d'une paire d'une ville tirĂ©s de « l’autre » moitiĂ© des villes.

Dans ce cas, lorsque 10 000 divisions alĂ©atoires diffĂ©rentes ont Ă©tĂ© utilisĂ©es, la rĂ©gression a obtenu en moyenne 71,9%, de rĂ©sultats corrects, la mĂ©thode de l’heuristique 72,2% et l’unitĂ© avec linĂ©aire 71,4%. La mĂ©thode du meilleur choix heuristique Ă©tait plus prĂ©cise que la rĂ©gression dans ce cas[3].

Références

  1. Gigerenzer, G. & Goldstein, D. G. (1996). "Reasoning the fast and frugal way: Models of bounded rationality". Psychological Review, 103, 650-669.
  2. Graefe et Armstrong, J. Scott, « Predicting elections from the most important issue: A test of the take‐the‐best heuristic », Journal of Behavioral Decision Making, vol. 25, no 1,‎ , p. 41–48 (DOI 10.1002/bdm.710, lire en ligne)
  3. Czerlinski, J., Goldstein, D. G., & Gigerenzer, G. (1999). "How good are simple heuristics?" In Gigerenzer, G., Todd, P. M. & the ABC Group, Simple Heuristics That Make Us Smart. New York: Oxford University Press.
  4. Pachur, T. & Marinello, G. (2013). Expert intuitions: How to model the decision strategies of airport customs officers? Acta Psychologica, 144, 97–103.
  5. Garcia-Retamero, R., & Dhami, M. K. (2009). Take-the-best in expert-novice decision strategies for residential burglary. Psychonomic Bulletin & Review, 16, 163–169
  6. Bergert F. B., & Nosofsky, R. M. (2007). A response-time approach to comparing generalized rational and take-the-best models of decision making. Journal of Experimental Psychology: Learning, Memory and Cognition, 331, 107–129
  7. Bröder, A. (2012). The quest for take-the-best. In P. M. Todd, G. Gigerenzer, & the ABC Research Group, Ecological rationality: Intelligence in the world (p. 216–240). New York: Oxford University Press
  8. Gigerenzer, G., & Gaissmaier, W. (2011). Heuristic decision making. Annual Review of Psychology, 62. 451–482
  9. Gigerenzer, G., & Goldstein, D. G. (1996). Reasoning the fast and frugal way: Models of bounded rationality. Psychological Review, 103, 650–669.
  10. Gigerenzer & Goldstein, 1996 - APA Psynet - Reasoning the fast and frugal way: Models of bounded rationality
  11. MH. Martignon & Hoffrage (2002) - Fast, frugal, and fit: Simple heuristics for paired comparison

Articles connexes

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplĂ©mentaires peuvent s’appliquer aux fichiers multimĂ©dias.