Accueil🇫🇷Chercher

David Marr

David Marr (1945-1980) est un neuroscientifique britannique. Intéressé d'abord par une théorie générale de la cognition, il s'efforça de résoudre le problème de la vision en particulier. Il a cofondé le champ des neurosciences computationnelles.

David Marr
une illustration sous licence libre serait bienvenue
Biographie
Naissance

Woodford (en)
Décès
(Ă  35 ans)
Cambridge
Nationalité
Formation
Activités
Autres informations
A travaillé pour
Directeur de thèse
Giles Brindley (en)
Distinction

Théorie de la vision

David Marr est aujourd'hui considéré comme le principal représentant de la théorie computationnelle de la vision[1].

Computationnalisme

Selon la thĂ©orie computationnelle de l'esprit dans laquelle s'inscrit la thĂ©orie de Marr, les Ă©tats mentaux sont des processus d'Ă©laboration des informations qui peuvent ĂŞtre dĂ©crits comme des programmes informatiques Ă  partir de computations. Le terme « computation Â» est utilisĂ© soit pour indiquer un algorithme, c'est-Ă -dire un procĂ©dĂ© spĂ©cifique de calcul, soit pour dĂ©noter ce qui est calculĂ©, la fonction ou l'objectif de l'algorithme[2]. Sur ce fondement thĂ©orique, le système visuel peut ĂŞtre correctement dĂ©crit comme un ensemble d'algorithmes reconstruisant l'environnement physique Ă  partir des informations contenues dans les photorĂ©cepteurs.

Problème de la vision et niveaux d'analyse

David Marr dĂ©finit le problème de la vision comme la question de savoir « quelles choses il y a dans le monde et oĂą elles se trouvent Â»[3]. Selon lui, ce problème est trop complexe pour pouvoir ĂŞtre affrontĂ© Ă  un niveau unique de description, par exemple au seul niveau neurophysiologique. Les donnĂ©es neurophysiologiques peuvent imposer des contraintes importantes sur la thĂ©orie mais elles ne sont pas Ă  elles seules suffisantes pour caractĂ©riser les phĂ©nomènes visuels. Il dĂ©clare mĂŞme que Â« chercher Ă  comprendre la perception en Ă©tudiant seulement les neurones est comme chercher Ă  comprendre le vol des oiseaux en Ă©tudiant seulement leurs ailes : ce n'est tout simplement pas possible Â»[4].

Pour Marr, une thĂ©orie satisfaisante de la vision doit s'articuler en trois niveaux :

  1. le niveau computationnel ou fonctionnel ;
  2. le niveau algorithmique ;
  3. le niveau physique de l'implémentation.

Le niveau computationnel spécifie quelles fonctions constituent le système visuel en décrivant les fonctions en termes d' input (entrées sensorielles), d' output (sorties comportementales) et de but. Il décrit ainsi l'organisation fonctionnelle de la vision dans son ensemble et détermine quels sous-systèmes font quoi. Le niveau algorithmique spécifie de son côté les algorithmes qui calculent la fonction de chaque représentation visuelle, à un niveau de description plus détaillé que le précédent. Le niveau de l'implémentation décrit quant à lui la réalisation neuronale (voire physico-chimique) de chaque algorithme – la façon dont l'algorithme est réalisé dans le système nerveux concerné par la vision.

Vision et relations spatiales

Une des spĂ©cificitĂ©s de la thĂ©orie de Marr est de caractĂ©riser le « but Â» de la vision (rĂ©alisĂ© après l' input mais avant l' output) en tant que reconnaissance de la forme gĂ©omĂ©trique des objets[5]. Plus prĂ©cisĂ©ment, la tâche de la vision consiste Ă  identifier et distinguer les objets de l'environnement physique par leur forme gĂ©omĂ©trique et leur position dans l'espace. Le système visuel est alors dĂ©fini comme l'ensemble des processus qui transforment les donnĂ©es sensorielles reçues par les photorĂ©cepteurs de la rĂ©tine en une structure informative qui reprĂ©sente les relations spatiales d'une partie de l'environnement physique.

Calcul et modularité de la vision

Selon Marr, les mécanismes de la vision sont essentiellement inconscients. C'est pourquoi l'objet visualisé est plutôt calculé qu'inféré. Contrairement aux inférences qui, typiquement, sont des processus conscients, séquentiels, lents, verbaux et logiques, le calcul impliqué dans la vision est inconscient, automatique, en grande partie parallèle (non séquentiel), très rapide, non verbal et probabiliste[6].

La thĂ©orie selon laquelle les processus mentaux sont computationnels est Ă©troitement liĂ©e Ă  la thèse de la modularitĂ© de l'esprit soutenue Ă  l'origine par Jerry Fodor. Marr en applique le principe au système visuel : les processus perceptifs, et en particulier visuels, constituent des sous-systèmes hĂ©ritĂ©s de l'Ă©volution, gĂ©nĂ©tiquement sĂ©lectionnĂ©s, qui exĂ©cutent des fonctions très spĂ©cifiques d'une façon largement autonome, c'est-Ă -dire indĂ©pendamment de tous les autres. Marr reprend Ă  Fodor le terme « module Â» pour qualifier ces sous-systèmes. Les modules accèdent exclusivement Ă  des informations propres, disponibles uniquement Ă  l'intĂ©rieur du module impliquĂ©. Selon Marr, les modules perceptifs n'ont pas la possibilitĂ© d'accĂ©der aux informations gĂ©nĂ©rales de la conscience[6].

Publications

  • David Marr, Vision: A Computational Investigation into the Human Representation and Processing of Visual Information, New York, W. H. Freeman and Company, 1982 (posthume).

Notes et références

  1. A. Paternoster, Le philosophe et les sens (2007), traduit de l'italien par Anne Reboul, Presses universitaires de Grenoble, 2009, ch. 4 : « ThĂ©orie psychologique de la perception visuelle Â», p. 75-103.
  2. A. Paternoster 2009, p. 78.
  3. D. Marr, Vision, Freeman, 1982, p. 3, traduit par A. Paternoster 2009.
  4. D. Marr 1982, p. 27, traduit par A. Paternoster 2009.
  5. A. Paternoster 2007, p. 80.
  6. A. Paternoster 2007, p. 82.

Voir aussi

Bibliographie

Articles connexes

Liens externes

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.