Accueil🇫🇷Chercher

Architecture de médiation

L'architecture de médiation est une forme d'architecture en flot de données distribuée qui est souvent nommée architecture orientée services dans le monde commercial (basée sur les services Web WS-* et WS-I) et est, dans sa forme originale, destinée à la synthèse dynamique d'informations utilisées en informatique décisionnelle ainsi qu'à une intégration d'applications d'entreprise intelligente. L'Architecture ARPA I3 est le modèle le plus complet pour ce type d'architecture.

Cette architecture fut conçue en 1992 par Gio Wiederhold dans l'article fondateur «Mediator in the architecture of future information systems»[1]. Wiederhold y dĂ©veloppe une nouvelle vision de l’architecture du traitement de l’information en entreprise, il tente de rĂ©gler la problĂ©matique de l’accès et de l’intĂ©gration de l’information en introduisant la notion de mĂ©diateur :

«A mediator is a software module that exploits encoded knowledge about some sets or subsets of data to create information for a higher layer of applications.»

Les mĂ©diateurs doivent en gĂ©nĂ©ral se retrouver sur des nĹ“uds diffĂ©rents de ceux qui contiennent les donnĂ©es (BD) et des postes de travail oĂą sont utilisĂ©es en dernière instance les donnĂ©es (par les utilisateurs). Il existe plusieurs sortes de mĂ©diateurs accomplissant des tâches distinctes, voici les principales :

  1. Transformation et filtrage des BD.
  2. Accès et intégration de plusieurs BD.
  3. Traitement des données supportant un haut niveau d’abstraction et de généralisation (traitement intelligent de l’information).
  4. Répertoires intelligents des bases d’information comme les catalogues, les aides à l’indexation, les structures de thesaurus (ontologies).
  5. Gestion de l’incertitude reliée aux données absentes ou incomplètes et aux données mal comprises.

Wiederhold distingue par contre clairement les médiateurs de l’ancêtre du concept d’agent, l’acteur[2] et cela de deux façons. Premièrement, les médiateurs sont organisés de manière hiérarchique pour accomplir leurs tâches et deuxièmement, aucune communication intelligente entre les médiateurs n’est nécessaire pour réaliser leurs tâches. Avec l’invention du concept d’agents[3], nous pourrions dire qu’il s’agit d’agents logiciels intelligents, non communicatifs et statiques.

Wiederhold oppose Ă©galement dans son article sa vision Ă  celle d’IBM et du « datawarehouse Â» que cette compagnie promulguait Ă  l’époque et discute de la nĂ©cessitĂ© de dĂ©velopper un langage d’interface (entre mĂ©diateurs et applications) possĂ©dant une grande puissance d’expression sĂ©mantique.

Classification des solutions de médiation

La plupart des auteurs distinguent deux catégories fondamentales de médiation; la médiation de schémas qui est une extension directe de l’approche fédérée et la médiation de contextes reposant sur la distance sémantique et l’unification de contextes[4].

La médiation de schémas

La mĂ©diation de schĂ©mas est essentiellement une Ă©volution de l’architecture fĂ©dĂ©rĂ©e fortement couplĂ©e. Le rapprochement Ă  effectuer entre un traducteur et un adaptateur et entre un intĂ©grateur et un mĂ©diateur est que les premiers sont directement les ancĂŞtres des seconds. En fait, on peut considĂ©rer que les chercheurs travaillant sur l’approche fĂ©dĂ©rĂ©e fortement couplĂ©e ont dĂ©cidĂ© d’adapter leur vocabulaire Ă  celui de Wiederhold. Il existe dans cette approche, comme dans l’approche fĂ©dĂ©rĂ©e fortement couplĂ©e, un schĂ©ma conceptuel global (contexte global ou schĂ©ma de mĂ©diation), auquel doivent s’apparier les diffĂ©rents schĂ©mas locaux (contextes locaux) : il y a donc intĂ©gration des schĂ©mas locaux au schĂ©ma global. De plus, comme dans l’approche de fĂ©dĂ©ration fortement couplĂ©e, la construction du schĂ©ma global repose en gĂ©nĂ©ral sur l’analyse prĂ©alable des schĂ©mas locaux et ceux-ci sont intĂ©grĂ©s d’une manière statique au schĂ©ma global. Nous remarquerons Ă©galement que les diffĂ©rentes phases de prĂ©-intĂ©gration, recherche des correspondances, intĂ©gration et restructuration doivent ĂŞtre rĂ©alisĂ©es comme dans l’approche fĂ©dĂ©rĂ©e.

Ces systèmes se distinguent par contre d’une approche par fédération fortement couplée en résolvant certains problèmes comme l’indisponibilité des sources et la combinaison des informations d’une manière plus flexible; en offrant un ensemble d’outils de haut niveau permettant de combiner et de restructurer les informations dans le schéma de la médiation. De plus, comme pour tout système de médiation, le système est normalement en lecture seule, bien que le passage à une solution en lecture-écriture soit souvent théoriquement possible.

Il existe peu de différences entre un système de médiation de schémas et l’approche fédérée fortement couplée et le terme médiation de données ne devrait être utilisée, pour respecter la description de Wiederhold, que pour décrire les systèmes à médiation de contextes.

La médiation de contextes

Ce type de mĂ©diation est adaptĂ© Ă  des environnements ouverts oĂą les sources d’information sont susceptibles d’évoluer, d’apparaĂ®tre et de disparaĂ®tre. Cette approche est Ă©galement caractĂ©risĂ©e par une prise en charge automatisĂ©e de la sĂ©mantique grâce aux mĂ©canismes d’unification ou de rĂ©conciliation des contextes. La distinction fondamentale entre une mĂ©diation de schĂ©mas et une mĂ©diation de contextes est que, dans la mĂ©diation de contextes, aucune information d’intĂ©gration statique n’est nĂ©cessaire, les liens entre adaptateurs et mĂ©diateurs sont Ă©tablis dynamiquement lors de la rĂ©solution d’une requĂŞte. Voici les diffĂ©rentes fonctionnalitĂ©s minimales qu’un système de mĂ©diation offrant la consultation de sources multiples doit rĂ©aliser ou offrir :

  1. Un langage déclaratif pour effectuer la requête.
  2. Une recherche des différentes sources d’information pertinentes disponibles pour résoudre la requête.
  3. Un découpage de la requête en sous-requêtes.
  4. La consultation de différentes sources.
  5. La combinaison des résultats permettant de répondre à la requête.
  6. La présentation du résultat sous une forme homogène.

Il s’agit ici des principaux besoins fonctionnels dégagés par Wiederhold. Il existe essentiellement deux sous-catégories de systèmes de médiation de contextes.

La médiation de contextes à sémantique non-stricte

Ils utilisent des métadonnées non structurées, peu structurées, ou structurées mais aux formats disparates et aucune ontologie explicite. Les systèmes à sémantique non-stricte utilisent en général des calculs de distances sémantiques (rapprochement sémantique) et la réconciliation de contextes pour intégrer les informations. Ces systèmes retournent des résultats pouvant être non conformes à la requête initiale.

La médiation de contextes à sémantique stricte

Ils utilisent des métadonnées (contextes) exprimées dans le même format et la même ontologie ou dans plusieurs ontologies mais avec des liens inter-ontologiques permettant leurs traductions. L’unification de contextes est le mécanisme utilisé par les systèmes à sémantique stricte, ce mécanisme utilise des règles de logique formelle pour manipuler les contextes. Ces systèmes retournent des résultats toujours conformes à la requête initiale.

Les composants habituels de la médiation

Il s’agit d’un domaine où les diverses interprétations des termes peuvent facilement laisser perplexe, chaque auteur ayant ses propres variantes de définitions. Nous proposons, ici, un ensemble de définitions des composants les plus courants. En effet, ces différents composants se retrouvent dans la plupart des solutions de médiation actuelles. Une description plus complète de composants se retrouve dans une architecture générique comme l'architecture ARPA I3.

L'ontologie

Selon Gruber[5] une ontologie est dĂ©finie comme une «spĂ©cification explicite et formelle d'une conceptualisation faisant l'objet d'un consensus». Malheureusement, ceci peut recouvrir plusieurs rĂ©alitĂ©s fort diffĂ©rentes. Premièrement par sa reprĂ©sentation : rĂ©seau sĂ©mantique, graphes conceptuels, grille de concepts, ensemble de règles logiques ou encore un schĂ©ma orientĂ© objet. Deuxièmement par sa fonction : permettre de reconnaĂ®tre les similitudes conceptuelles entre diffĂ©rents mots[6], permettre de manipuler ces Ă©lĂ©ments (concepts, mots) ou d'effectuer un certain nombre d'infĂ©rences[7].

L’utilisation d’ontologies dans un système de médiation peut prendre plusieurs formes. Une ontologie est soit explicite, c’est-à-dire, qu’elle existe sous forme d’un composant du système ou implicite, c’est-à-dire, qu’elle n’existe que dans les manuels de référence du domaine (sous une forme plus ou moins structurée) et dans la tête des spécialistes du domaine. Une ontologie peut être globale (comme WordNet ou Cyc) ou de domaine (médecine, comptabilité, gestion de la faune, etc.). Guarino[8] distingue également les ontologies maximales contenant la description de tout l’univers d’un domaine et les ontologies minimales qui proposent un ensemble de concepts et de règles permettant de combiner ces concepts pour créer tout concept de l’univers d’un domaine (via les contextes). Un système peut également posséder une ontologie unique ou bien des ontologies multiples pouvant avoir plusieurs relations les unes avec les autres (relation inter-ontologique).

Le contexte

Le contexte est un élément d’information associé à un objet ou à une portion de l’objet et qui spécifie de façon explicite un ensemble de connaissances sur la structure, les valeurs ou les fonctionnalités de l’objet[9]. Un contexte peut être représenté par un réseau sémantique, des graphes conceptuels, un ensemble de règles logiques, un schéma orienté objet ou simplement des métadonnées structurées traditionnelles. Indépendamment de sa représentation, un contexte est essentiellement composé de métadonnées décrivant un concept (classe d’objets), un ensemble d’objets ou un objet particulier mais dans une situation précise (requête globale, requête locale, schéma local). Le terme contexte dans le sens utilisé ici a été introduit par [Sciore, Siegel, Rosenthal, 1994][10] et [Sheth & Kashyap, 1995][11].

L’adaptateur

Il s’agit ici d’une composante cruciale qui permet à un système local de distribuer ses informations à une collectivité d’usagers. L’adaptateur permet de présenter les données dans le format syntaxique de la médiation. Il s’agit donc d’une interface permettant l’interrogation d’une base de données grâce à un langage normalisé (langage pivot). Il serait également possible d’utiliser une ontologie pour réaliser l’interopérabilité sémantique en normalisant le vocabulaire des métadonnées (contextes).

Le médiateur

Le médiateur est un module logiciel recevant directement la requête d’un usager et devant la traiter. Celui-ci doit localiser l’information nécessaire pour répondre à la requête, résoudre les conflits schématiques et sémantiques, interroger les différentes sources et intégrer les résultats partiels dans une réponse homogène et cohérente. Le médiateur permet toutes les fonctionnalités relevées par Wiederhold et s’il s’agit d’une solution en lectures/écritures, également toutes les fonctionnalités nécessaires à un SGBDF. Il s’agit du composant le plus complexe mais une seule instance de celui-ci est nécessaire (contrairement aux multiples adaptateurs). Il permet la consultation de plusieurs sources de données comme s’il s’agissait d’une source unique et peut offrir cette consultation via de multiples langages et ontologies

Les répertoires et bases de connaissances

Une base de connaissances peut contenir des ontologies et des relations inter-ontologiques. Un répertoire permet d’inventorier les ressources (les sources de données et les informations particulières que chacune offre à la médiation); il s’agit essentiellement d’une sorte d’annuaire et est donc un composant relativement simple.

Le facilitateur

Le facilitateur est un module entre le médiateur et les bases de connaissances ou un composant interne du médiateur ou de la base de connaissances. Celui-ci est responsable du rapprochement sémantique et de l’unification ou de la réconciliation de contextes, ou encore, effectue des traductions inter-ontologiques. Il peut également offrir des services de conversion syntaxique et de format.

Notes et références

  1. Wiederhold, G.: Mediators in the architecture of future information systems. IEEE Computer Magazine, Vol. 25, No. 3, 3849, mars 1992
  2. Hewitt, C., Bishop, P., Steiger, R.: A universal modular actor formalism for artificial intelligence. Acte de conférence (IJCAI’73), p235-245. International Joint Conference on Artificial Intelligence, août 1973
  3. Special issue on intelligent services. Communication of the ACM, Vol. 37, No. 7, 1994.
  4. Jouanot, F.: Un modèle sémantique pour l'interopérabilité de systèmes d'information. Actes du 13e Congrès Inforsid, p16-19, Lyon, France, mai 2000
  5. Gruber, T.: A Translation approach to portable ontology specifications. International Journal of Knowledge Acquisition for Knowledgebased Systems, Vol. 5, No.2, 1993
  6. Everett, J.O., Bobrow, D.G., Stolle, R., Crouch, R., De Paiva, V., Condoravdi, C., Van Den Berg, M., Polanyi, L.: Making ontologies work for resolving redundancies across documents. Communication of the ACM, Vol. 45, No. 2, p55-60, 2002
  7. Fensel, D., Horrocks, I., Van Harmelen, F., Decker, S., Erdmann, M., Klein, M.: OIL in a nutshell. Acte de conférence (ECAI'00). Workshop on Applications of Ontologies and Problem solving Methods, 14th European Conference on Artificial Intelligence, Berlin, Allemagne, 2000
  8. Guarino, N.: Semantic matching: formal ontological distinctions for information organization, extraction, and integration. Summer School on Information Extraction, Frascati, Italy, p139170. Springer Verlag (Ă©diteur), 1997
  9. Benslimane, D., Cullot, N., Jouannot, F., Laurini, R., Savonnet, M., Yétongnon, K.: Interopérabilité de SIG : un état de l'art. Revue Internationale de Géomatique, Vol. 9, No. 3, p279-316, Édition Hermes, 1999
  10. Sciore, E., Siegel, M., Rosenthal, A.: Using semantic values to facilitate interoperability among heterogeneous information systems. ACM Transactions on Database Systems (TODS), Vol. 19, No.. 2, p254290, 1994
  11. Sheth, A.P., Kashyap, V.: Shematic and semantic similarities between database objects: A context-based approach. Rapport technique (TR-CS-95-001), LSDIS Lab, University of Georgia, 1995
Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.