Point Distribution Model
En vision artificielle, le Point Distribution Model (PDM, ou ModÚle à Distribution de Points) est un modÚle d'analyse et de représentation de forme. Il consiste en un prototype d'une forme moyenne doté de modes de variation combinables appris à partir d'un ensemble d'apprentissage d'instances de la forme étudiée. Il a été mis au point par Cootes, Taylor et al[1] - [2], et représente un standard en vision par ordinateur pour la délinéation d'images 2D et 3D[1], avec des applications possibles en morphométrique statistique[3].
En vision par ordinateur, un modÚle explicite de forme est un atout lorsqu'il s'agit d'interpréter des images localement ou globalement bruitées, peu contrastées, voire présentant des artefacts: autant de défauts inhérents à diverses modalités d'imagerie médicale en particulier. Les méthodes exploitant le PDM pour la délinéation sont l'Active shape model (ASM) et l'Active Appearance Model (AAM), qui consiste à générer des instances d'image autour de l'objet appris jusqu'à l'atteinte d'une similarité satisfaisante avec l'image à identifier.
Les PDMs reposent sur l'annotation des instances de l'ensemble d'apprentissage par des Points correspondants, ou amers (landmark en anglais). Un amer est un point labellisĂ©, dĂ©posĂ© par un expert anatomiste (ou du domaine applicatif concernĂ©) sur le mĂȘme locus (endroit de forme) pour toute instance de l'ensemble d'apprentissage. Par exemple, lorsqu'on annotera une population de contours 2D de mains posĂ©s Ă plat par 50 landmarks, le landmark n°25 dĂ©signera systĂ©matiquement le sommet de l'index.
L'Analyse en composantes principales (ACP), par exemple, est une méthode d'analyse statistique apte à capturer les corrélations de mouvement entre les landmarks d'un ensemble d'apprentissage. Typiquement, l'ACP détecte que les points sur l'index bougent de concert sur toutes les instances de mains posées à plat de l'ensemble d'apprentissage.
Les principales étapes à réaliser sont les suivantes :
- Annotation des instances de l'ensemble d'apprentissage par des landmarks en quantité suffisante pour approximer la géométrie de la forme (i.e rendre reconnaissable la forme). C'est un problÚme ouvert en général[3], bien qu'assez facile pour des formes simples (par exemple: mains 2D[1] - [3]).
- Alignement des instances annotĂ©es en utilisant l'analyse gĂ©nĂ©ralisĂ©e de Procrustes (Generalized procrustes analysis). Selon la dĂ©finition de forme de Kendall[4], la forme est une information gĂ©omĂ©trique invariante par rotation, translation, et (gĂ©nĂ©ralement: cf "size-and-shape[4]") homothĂ©tie. Une forme moyenne, correspondant au prototype, peut alors ĂȘtre dĂ©terminĂ©e aprĂšs l'alignement.
- Ă ce stade, l'ensemble d'apprentissage annotĂ© de n landmarks alignĂ© peut ĂȘtre considĂ©rĂ© comme un nuage de points dans un espace de dimension 2n ou 3n (2D/3D), dont l'origine est la forme moyenne. Dans cet espace, les coordonnĂ©es d'une instance de forme sont simplement obtenues par concatĂ©nation des coordonnĂ©es de ses n landmarks. En supposant que la rĂ©partition des points dans cet espace soit gaussienne, l'ACP est l'outil le plus simple et appropriĂ© Ă son Ă©tude.
- L'ACP calcule les vecteurs et valeurs propres normalisées de la matrice de covariance de l'ensemble d'apprentissage aligné. Chaque vecteur propre décrit un mode de variation de forme déduit de l'ensemble d'apprentissage, et la valeur propre correspondante indique l'importance que représente ce mode par rapport à la dispersion totale.
Comme l'ACP rĂ©alise une rĂ©duction de donnĂ©es, on constate que les premiers modes de variation reprĂ©sentent l'essentiel de la variance totale (5 modes pour 92 % dans[5]) : on peut donc rĂ©duire nos instances de dimension Ă instances de dimension dans l'espace de forme. Si une telle dĂ©croissance n'est pas constatĂ©e, il est probable que les landmarks aient Ă©tĂ© mal choisis et disposĂ©s en tant qu'invariants de forme qu'ils devraient ĂȘtre.
En se plaçant à nouveau dans l'espace Euclidien, on peut considérer un vecteur propre comme une séquence de vecteurs de dimension 2(3) associés à chaque landmark et indiquant un déplacement linéaire pour chacun d'eux, soit un déplacement non-linéaire par morceaux à l'échelle de la forme. En général, la méthode parvient bien à analyser et approximer des variations non-linéaires modérées (cf. [1]), bien que des méthodes d'ACP à noyaux soient recommandées en cas de fortes non-linéarités.
Sélection d'articles de référence (en anglais)
- "D.H. Cooper, T.F. Cootes, C.J. Taylor et J. Graham", « Active shape models : their training and application », Computer Vision and Image Understanding, vol. 61, no 1,â
- T. F. Cootes, Statistical models of appearance for computer vision, , [PDF]http://www.isbe.man.ac.uk/~bim/Models/app_models.pdf
- "Rhodri H. Davies and Carole J. Twining and P. Daniel Allen and Tim F. Cootes and Chris J. Taylor", "Shape discrimination in the Hippocampus using an MDL Model", [PDF] http://www2.wiau.man.ac.uk/caws/Conferences/10/proceedings/8/papers/133/rhhd_ipmi03%2Epdf
- (en) "Statistical Shape Analysis", Chichester/New York/Weinheim etc., "Ian L. Dryden and Kanti V. Mardia", , 347 p. (ISBN 0-471-95816-6)
- Stegmann, M. B. et Gomez, D. D., A Brief Introduction to Statistical Shape Analysis, , http://www2.imm.dtu.dk/pubdb/views/publication_details.php?id=403
Voir aussi, sur Wikipedia.en
Liens externes
- Description des PDM, ASM and AAMs.
- page d'accueil de Tim Cootes (co-inventeur des PDMs & ASMs).
Le rapport suivant synthétise les principales avancées dans la discipline : http://www.isbe.man.ac.uk/~bim/Models/app_models.pdf