Carte autoadaptative
Les cartes autoadaptatives, cartes auto-organisatrices ou cartes topologiques forment une classe de réseau de neurones artificiels fondée sur des méthodes d'apprentissage non supervisées.
Elles sont souvent désignées par le terme anglais self organizing maps (SOM), ou encore cartes de Kohonen du nom du statisticien ayant développé le concept en 1984. La littérature utilise aussi les dénominations : « réseau de Kohonen », « réseau autoadaptatif » ou « réseau autoorganisé ».
Elles sont utilisées pour cartographier un espace réel, c'est-à -dire pour étudier la répartition de données dans un espace à grande dimension. En pratique, cette cartographie peut servir à réaliser des tùches de discrétisation, quantification vectorielle ou classification.
Idée de base
Ces structures intelligentes de reprĂ©sentation de donnĂ©es sont inspirĂ©es, comme beaucoup dâautres crĂ©ations de lâintelligence artificielle, par la biologie. Il s'agit de reproduire le principe neuronal du cerveau des vertĂ©brĂ©s : des stimuli de mĂȘme nature excitent une rĂ©gion du cerveau bien particuliĂšre. Les neurones sont organisĂ©s dans le cortex de façon Ă interprĂ©ter tous les types de stimuli imaginables. De la mĂȘme maniĂšre, la carte autoadaptative se dĂ©ploie de façon Ă reprĂ©senter un ensemble des donnĂ©es, et chaque neurone se spĂ©cialise pour reprĂ©senter un groupe bien particulier des donnĂ©es selon les points communs qui les rassemblent. Elle permet une visualisation en dimension multiple de donnĂ©es croisĂ©es.
Techniquement, la carte réalise une « quantification vectorielle » de l'espace de données. Cela signifie « discrétiser l'espace » ; c'est-à -dire le diviser en zones, et affecter à chaque zone un point significatif dit « vecteur référent ».
Architecture
D'un point de vue architectural, les cartes auto-organisatrices de Kohonen sont constituĂ©es d'une grille (le plus souvent uni- ou bidimensionnelle). Dans chaque nĆud de la grille se trouve un « neurone ». Chaque neurone est liĂ© Ă un vecteur rĂ©fĂ©rent, responsable d'une zone dans l'espace des donnĂ©es (appelĂ© encore espace d'entrĂ©e).
Dans une carte auto-organisatrice, les vecteurs référents fournissent une représentation discrÚte de l'espace d'entrée. Ils sont positionnés de telle façon qu'ils conservent la forme topologique de l'espace d'entrée. En gardant les relations de voisinage dans la grille, ils permettent une indexation facile (via les coordonnées dans la grille). Ceci s'avÚre utile dans divers domaines, comme la classification de textures, l'interpolation entre des données, la visualisation des données multidimensionnelles.
Soit A la grille neuronale rectangulaire d'une carte auto-organisatrice. Une carte de neurones affecte à chaque vecteur d'entrée un neurone désigné par son vecteur de position , tel que le vecteur référent soit le plus proche de v.
Mathématiquement, on exprime cette association par une fonction :
Cette fonction permet de définir les applications de la carte.
- quantificateur vectoriel : on approxime chaque point dans l'espace d'entrée par le vecteur référent le plus proche par :
- classificateur en utilisant la fonction
on affecte Ă chaque neurone de la grille une Ă©tiquette correspondant Ă une classe ; tous les points de l'espace d'entrĂ©e qui se projettent sur un mĂȘme neurone appartiennent Ă la mĂȘme classe. Une mĂȘme classe peut ĂȘtre associĂ©e Ă plusieurs neurones.
Algorithme d'apprentissage
Principe
AprĂšs une initialisation alĂ©atoire des valeurs de chaque neurone, on soumet une Ă une les donnĂ©es de l'espace d'entrĂ©e Ă la carte autoadaptative. Selon les valeurs des neurones, il y en a un, appelĂ© neurone gagnant, qui rĂ©pond le mieux au stimulus ; c'est celui dont la valeur est la plus proche de la donnĂ©e prĂ©sentĂ©e. Ce neurone est alors gratifiĂ© d'un changement de valeur pour qu'il rĂ©ponde encore mieux Ă un autre stimulus de mĂȘme nature que le prĂ©cĂ©dent. Par lĂ -mĂȘme, on gratifie un peu aussi les neurones voisins du gagnant avec un facteur multiplicatif du gain infĂ©rieur Ă un. Ainsi, c'est toute la rĂ©gion de la carte autour du neurone gagnant qui se spĂ©cialise. En fin d'algorithme, lorsque les neurones ne bougent plus, ou seulement trĂšs peu, Ă chaque itĂ©ration, la carte auto-organisatrice recouvre toute la topologie des donnĂ©es.
Formalisation mathématique
La cartographie de l'espace d'entrée est réalisée en adaptant les vecteurs référents . L'adaptation est faite par un algorithme d'apprentissage dont la puissance réside dans la compétition entre neurones et dans l'importance donnée à la notion de voisinage.
Une séquence aléatoire de vecteurs d'entrée est présentée pendant l'apprentissage. Avec chaque vecteur, un nouveau cycle d'adaptation est démarré. Pour chaque vecteur v dans la séquence, on détermine le neurone vainqueur, c'est-à -dire le neurone dont le vecteur référent approche v le mieux possible :
Le neurone vainqueur s et ses voisins (définis par une fonction d'appartenance au voisinage) déplacent leurs vecteurs référents vers le vecteur d'entrée
avec
oĂč reprĂ©sente le coefficient d'apprentissage et la fonction qui dĂ©finit l'appartenance au voisinage.
Le coefficient d'apprentissage définit l'amplitude du déplacement global de la carte.
Sur la notion de voisinage
Tout comme dans le cortex, les neurones sont reliés les uns aux autres, c'est la topologie de la carte. La forme de la carte définit les voisinages des neurones et donc les liaisons entre neurones.
La fonction de voisinage décrit comment les neurones dans la proximité du vainqueur s sont entraßnés dans le mouvement de correction. On utilise en général :
oĂč s'appelle coefficient de voisinage. Son rĂŽle est de dĂ©terminer un rayon de voisinage autour du neurone vainqueur.
La fonction de voisinage h force les neurones qui se trouvent dans le voisinage de s à rapprocher leurs vecteurs référents du vecteur d'entrée v. Moins un neurone est proche du vainqueur dans la grille, moins son déplacement est important.
La correction de vecteurs référents est pondérée par les distances dans la grille. Cela fait apparaßtre, dans l'espace d'entrée, les relations d'ordre dans la grille.
Pendant l'apprentissage la carte décrite par les vecteurs référents du réseau évolue d'un état aléatoire vers un état de stabilité dans lequel elle décrit la topologie de l'espace d'entrée tout en respectant les relations d'ordre dans la grille.
Propriétés
- Similitude des densités dans l'espace d'entrée : la carte reflÚte la distribution des points dans l'espace d'entrée. Les zones dans lesquelles les vecteurs d'entraßnement v sont tirés avec une grande probabilité d'occurrence sont cartographiées avec une meilleure résolution que les zones dans lesquelles les vecteurs d'entraßnement v sont tirés avec une petite probabilité d'occurrence.
- Préservation des relations topologiques : des neurones voisins dans la grille occupent des positions voisines dans l'espace d'entrée (préservation des voisinages de la grille) ; et des points proches dans l'espace d'entrée se projettent sur des neurones voisins dans la grille (préservation de la topologie de l'espace d'entrée). Les neurones ont tendance à discrétiser l'espace de façon ordonnée.
Avantages et inconvénients des cartes autoadaptatives
Les ancĂȘtres des cartes auto-organisatrices, les algorithmes comme « k-moyennes », rĂ©alisent la discrĂ©tisation de l'espace d'entrĂ©e en ne modifiant Ă chaque cycle d'adaptation qu'un seul vecteur rĂ©fĂ©rent. Leur processus d'apprentissage est donc trĂšs long.
L'algorithme de Kohonen profite des relations de voisinage dans la grille pour rĂ©aliser une discrĂ©tisation dans un temps trĂšs court. On suppose que l'espace n'est pas constituĂ© de zones isolĂ©es, mais de sous-ensembles compacts. Donc en dĂ©plaçant un vecteur rĂ©fĂ©rent vers une zone, on peut se dire qu'il y a probablement d'autres zones dans la mĂȘme direction qui doivent ĂȘtre reprĂ©sentĂ©es par des vecteurs rĂ©fĂ©rents. Cela justifie le fait de dĂ©placer les neurones proches du vainqueur dans la grille dans cette mĂȘme direction, avec une amplitude de dĂ©placement moins importante. L'algorithme comporte des opĂ©rations simples ; il prĂ©sente donc l'avantage d'un faible de coĂ»t de calculs.
Le voisinage dans les cartes autoadaptatives est malheureusement fixe, et une liaison entre neurones ne peut ĂȘtre cassĂ©e mĂȘme pour mieux reprĂ©senter des donnĂ©es discontinues. Les Growing Cell Structure, ou Growing Neural Gas, sont la solution Ă ce problĂšme. Des neurones et les liaisons entre neurones peuvent y ĂȘtre supprimĂ©s ou ajoutĂ©s quand le besoin s'en fait sentir.
Notes et références
Voir aussi
Bibliographie
- (en) T. Kohonen, Self-Organized Formation of Topologically Correct Feature Maps, Biological Cybernetics, vol. 46, pp. 59â69, 1982.
- (en) T. Kohonen, Self-Organizing Maps, vol. 30, Springer Verlag, 1995.
- (en) H. J. Ritter, T. M. Martinetz, et K. J. Schulten, Neural Computation and Self-Organizing Maps : An Introduction, AddisonâWesley, 1992.