Accueil🇫🇷Chercher

Analyse statistique implicative

L’analyse statistique implicative (A.S.I.) est une mĂ©thode non symĂ©trique d’analyse de donnĂ©es croisant des sujets ou des objets avec des variables de type quelconque : boolĂ©ennes, numĂ©riques, modales, vectorielles, sĂ©quentielles, intervalles, floues et rangs.

Historique

Fondée dans les années 1980[1] par Régis Gras (1933-2022), professeur émérite à l’université de Nantes, équipe DUKE du Laboratoire d'informatique de Nantes Atlantique, elle continue à se développer sous son impulsion et celle de chercheurs de son équipe, Jean-Claude Régnier[2] entre autres, professeur émérite à Université Lumière Lyon-II et membre de l'UMR 5191 ICAR[3], qui assure la présidence du comité scientifique et de programme des colloques ASI.

MĂ©thodologie

Visant l’extraction de règles d’association de nature implicative, la mĂ©thodologie consiste Ă  attribuer une valeur numĂ©rique, une mesure entre 0 et 1, Ă  des règles R du type ; « si la variable a est observĂ©e, alors gĂ©nĂ©ralement la variable b l’est aussi Â» ou dans les cas plus gĂ©nĂ©raux : « si la variable a prend une certaine valeur alors la variable b prend gĂ©nĂ©ralement une valeur supĂ©rieure Â». La mesure attribuĂ©e est une probabilitĂ©, appelĂ©e intensitĂ© d’implication. Ă€ travers la structuration de l’ensemble des règles, l’utilisateur peut accĂ©der Ă  des relations de type causal et prĂ©dictif pondĂ©rĂ©es par cette intensitĂ©. « L'ASI n'est pas une mĂ©thode mais un cadre thĂ©orique, large, dans lequel se traitent des problèmes modernes de l'extraction des connaissances Ă  partir des donnĂ©es. C'est une thĂ©orie gĂ©nĂ©rale dans le domaine de la causalitĂ© parce qu'elle rĂ©pond Ă  des faiblesses d'autres thĂ©ories, elle apporte un outillage formel et des mĂ©thodes pratiques de rĂ©solution de problèmes. Ses applications sont multiples... Â» (D. Zighed, professeur des universitĂ©s au laboratoire ERIC, UniversitĂ© Lumière Lyon-II et ex-Directeur de l'ex Institut des Sciences de l’Homme de Lyon. [Actuellement Maison des Sciences de l'Homme Lyon et Saint-Étienne[4].

Principe de détermination de l’intensité d’implication en tant que probabilité

Cette probabilitĂ© est celle de l’évĂ©nement alĂ©atoire : « S’il n’existait pas de lien a priori asymĂ©trique entre a et b, le nombre de contre-exemples Ă  la règle R serait, sous le seul effet du hasard, plus grand gĂ©nĂ©ralement que le nombre de contre-exemples observĂ©s dans la contingence Â».

Une modélisation du nombre de contre-exemples aléatoires est choisie et justifiée. Elle permet alors de calculer toutes les mesures attribuées aux couples de variables. Un algorithme conduit à extraire celles correspondant à un seuil fixé par l’expert, par exemple 0.95.

ReprĂ©sentations graphiques associĂ©es 

Fig.1 - Graphe implicatif
Fig.2 - Hiérarchie orientée

Deux types de reprĂ©sentation permettent de visualiser les relations extraites du corpus donnĂ© et en structurent leur ensemble :

  • d’une part un graphe pondĂ©rĂ© sans cycle oĂą chaque arĂŞte reprĂ©sente une règle (fig.1) ;
  • d’autre part une hiĂ©rarchie ascendante orientĂ©e de mĂ©ta-règles (fig.2).

Si la première représentation présente des affinités avec un treillis de Galois ou à un réseau bayesien, tout en étant basée sur des algorithmes différents plus sensibles aux effectifs des sujets, par contre la deuxième est originale. En effet, les niveaux supérieurs sont des méta-classes non linéaires, comparables à des niveaux de conceptualisation faisant passer du simple au complexe sans inclusion nécessaire (cf. travaux de psychologie cognitive de Jean Piaget ou Lev Vygotsky).

A l’instar des méthodes d’analyse factorielle, (par exemple l’A.F.C. de J.P. Benzecri) des algorithmes sont élaborés pour mesurer la contribution de sujets ou de catégories de sujets aux règles extraites et aux chemins du graphe ou aux classes de la hiérarchie établissant une dualité entre les sujets et les variables.

Applications

Un logiciel dénommé C.H.I.C. (acronyme de Classification Hiérarchique Implicative et Cohésitive) est fonctionnel pour traiter tous les problèmes numériques et graphiques nécessaires à l’usage de la méthode A.S.I.. Evolutif suivant les extensions de la théorie, il est développé par Raphaël Couturier, Professeur des universités à l’Université de Franche-Comté. Grâce à cet outil informatique, de nombreuses applications dans des domaines variés (pédagogie, psychologie, sociologie, bio-informatique, médecine, histoire de l’art, etc.) ont montré la pertinence du modèle probabiliste choisi et, de ce fait, la richesse des informations obtenues par le traitement des variables. Elles ont, en particulier, permis de mettre en évidence des pépites de connaissance que d’autres méthodes n’extrayaient pas et d’exprimer des relations causales affectées d’une intensité. Ses avantages tiennent à sa sensibilité aux effectifs des instances et aux représentations aisées à interpréter.

Notes et références

  1. L'implication statistique. Nouvelle méthode exploratoire de donnée, préface de Edwin Diday, Paris Dauphine et INRIA, sous la direction de R. Gras 1933 - 2022, et la collaboration de S. Ag Almouloud, M. Bailleul, A. Larher, M. Polo, H. Ratsimba-Rajohn, A.Totohasina, La Pensée Sauvage, Grenoble, 1996.
  2. « Jean-Claude Regnier | ICAR UMR 5191 – Professeur » (consulté le )
  3. « ICAR – Site du laboratoire ICAR » (consulté le )
  4. « Accueil », sur MSH Lyon St-Etienne (consulté le )

Bibliographie

  • L'implication statistique. Nouvelle mĂ©thode exploratoire de donnĂ©e, prĂ©face de Edwin Diday, Paris Dauphine et INRIA, sous la direction de R.Gras, et la collaboration de S. Ag Almouloud, M. Bailleul, A. Larher, M. Polo, H. Ratsimba-Rajohn, A.Totohasina, La PensĂ©e Sauvage, Grenoble, 1996.
  • Mesures de QualitĂ© pour la fouille de donnĂ©es, H.Briand, M.Sebag, R.Gras er F.Guillet eds, RNTI-E-1, Ed. CĂ©paduès, 2004
  • (en) Quality Measures in Data Mining, F.Guillet et H.Hamilton eds, Springer, 2007.
  • (en) Statistical Implicative Analysis, Theory and Applications, prĂ©face de Dan A.Simovici, Massachusetts Boston University, R.Gras, E. Suzuki, F. Guillet, F. Spagnolo, eds, Springer, 2008.
  • Analyse Statistique implicative. Une mĂ©thode d'analyse de donnĂ©es pour la recherche de causalitĂ©s, prĂ©face de Djamel Zighed, Lyon 2, Dir. R. Gras, eds. R. Gras, J.C. RĂ©gnier, F. Guillet, CĂ©paduès Ed. Toulouse, 2009.
  • (es) Teoria y Aplicaciones del Analisis Estadistico Implicativo, Eds : P.Orus, L.Zemora, P.Gregori, Universitat Jaume-1, Castellon (Espagne), 2009.
  • L'Analyse Statistique Implicative. MĂ©thode exploratoire et confirmatoire Ă  la recherche de causalitĂ©, prĂ©face de Gilbert Saporta, CNAM, Paris, Dir. R. Gras, eds. R. Gras, J.C. RĂ©gnier, C. Marinica, F. Guillet, CĂ©paduès Ed. Toulouse, 2013.
  • Analyse Statistique Implicative. Des Sciences dures aux Sciences Humaines et Sociales. Gras, R., RĂ©gnier, JC., Lahanier-Reuter, D. Marinica, C., Guillet, F. (Eds) CĂ©paduès Ed. Toulouse, 2017.
  • La thĂ©orie de l'analyse statistique implicative ou l'invraisemblance du faux, PrĂ©face de P. Kuntz, UniversitĂ© de Nantes, R. Gras, CĂ©paduès Ed. Toulouse, 2018.
  • Análise EstatĂ­stica Implicativa e Análise de Similaridade no Quadro TeĂłrico e MetodolĂłgico das Pesquisas em Ensino de CiĂŞncias e Matemática com a utilização do software CHIC. RĂ©gnier, J.C.,Lira Veras Xavier de Andrade, V. (Eds) Brasil. Editora Universitaria da UFRPE. 2023

Depuis 2000, des colloques internationaux avec comité scientifique réunissent près d’une centaine de participants d’une trentaine de pays.

Liens externes

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.