Modèle Rescorla-Wagner
Le modèle Rescorla–Wagner est une modélisation mathématique du conditionnement classique. Créé par Robert A. Rescorla (de l'université de Pennsylvanie) et Allan R. Wagner (de l'université Yale) en 1972, il simule un processus d'apprentissage dit pavlovien.
Usage scientifique
Bien que souvent critiqué depuis sa création, le modèle Rescorla-Wagner a aussi été très souvent utilisé par les spécialistes de l'apprentissage. Il bénéficie notamment des avantages suivants[1] :
- il permet de générer des prédictions claires
- un certain nombre de prédictions qu'il a générées ont été confirmées par l'expérience
- modéliser la représentation d'un événement par l'intensité et la surprise semble avoir un intérêt intuitif
- il a une forte valeur heuristique
- il n'a que peu de variables indépendantes
- aucun concurrent issu d'une autre théorie ne l'a supplanté.
Principes de base du modèle
- La valeur de la surprise qu'un organisme expérimente lorsqu'il rencontre un stimulus inconditionné (SI) dépend de la somme des valeurs associatives de tous les stimuli présents durant l'essai. Ce principe rend le modèle Rescorla-Wagner différent de modèles plus anciens qui considéraient uniquement la valeur associative d'un stimulus conditionné (SC) particulier comme aspect déterminant de la surprise.
- L'excitation et l'inhibition constituent deux éléments opposés. Un stimulus ne peut avoir qu'une force associative positive ou négative. Dans le premier cas, c'est un excitant conditionné, dans le second c'est un inhibiteur conditionné. Il ne peut jouer les deux rôles à la fois.
- La force associative d'un stimulus est exprimée directement dans le comportement qu'il excite ou inhibe. Comprendre l'effet d'un stimulus, c'est comprendre comment il a affecté les réactions de l'organisme.
- La salience d'un SC est une constante. Elle n'est pas supposée varier au cours de l'apprentissage.
- L'histoire d'une réponse n'a aucun effet sur son état actuel. Seule sa valeur associative actuelle détermine la valeur de l'apprentissage. Il n'importe pas que le SC soit déjà passé par plusieurs étapes de conditionnement et d'extinction auparavant.
Les deux premiers principes sont uniques au modèle Rescorla–Wagner. Les trois dernières étaient déjà précédentes dans des modèles plus anciens et jouent un rôle moins central, mais restent structurellement importantes[1].
Équation
et
où
- est la variation dans la force de l'association de X
- est la salience du SC (limites : 0 et 1)
- est le paramètre d'intensité pour le SI (limites : 0 et 1), parfois appelé valeur d'association
- est le conditionnement maximal possible pour le SI
- est la force actuelle de l'association
- est la force d'association totale du SC
Références
- Ralph R. Miller, Robert C. Barnet et Nicholas J. Grahame, « Assessment of the Rescorla-Wagner Model », Psychological Bulletin, American Psychological Association, vol. 117, no 3,‎ , p. 363–386 (PMID 7777644, DOI 10.1037/0033-2909.117.3.363)
- Rescorla, R.A. & Wagner, A.R. (1972) A theory of Pavlovian conditioning: Variations in the effectiveness of reinforcement and nonreinforcement, Classical Conditioning II, A.H. Black & W.F. Prokasy, Eds., p. 64–99. Appleton-Century-Crofts.
- Dawson, Michael, Minds and Machines: Connectionnism and Psychological Modeling, Blackwell Publishing, 2004, p. 36-40.
Lien externe
Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.