Traitement et Fusion de Données dans le Cadre de l’Interopérabilité Sémantique des Systèmes d’Information Géographiques. Atmane HADJI, Mohamed-Khireddine KHOLLADI Dept. Mathématiques et Informatique Université d’Ouargla Ouargla,Algerie Chef Dept. Informatique Université Mentouri Constantine Constantine, Algérie h.atm1@yahoo.fr Kholladi@yahoo.fr Résumé analyses à plusieurs niveaux de détail. Dans ce cas, De nos jours, L’évolution exponentielle de la l’interopérabilité entre ces systèmes d’information est technologie dans le Web sémantique est orientée vers compliquée à cause de l’hétérogénéité de différentes plusieurs domaines de recherches. Ceci signifie que la sources de données et de contexte. Alors le problème posé technologie comprenant celle des systèmes d’information est : (1) Comment fournir un contexte globale de données géographiques SIG se déplace vers les solutions flexibles hétérogènes et dans un espace distribués. Ou bien (2) par les systèmes à base de connaissances (sémantiques) Comment créer une coopération entre des ressources que la solution statique par les systèmes de base de échangées à travers différents systèmes pour faciliter données courants (schématique ou syntaxiques). l’interopérabilité. (3) Comment faciliter et simplifier L’interopérabilité est nécessaire dans plusieurs l’échange entre les données géographiques? applications du SIG. Elle implique de partager et de réutiliser des données de divers systèmes d'information 2. Vers la sémantique comme une solution hétérogènes. Les Ontologies émergent comme une d’interopérabilité solution importante pour construire un ensemble de connaissances partagées et réutilisables qui supportent Il existe deux méthodes principales pour faciliter leur interaction. l’interopérabilité et l’échange d’information. La première, Dans ce travail, nous avons essayé de décrire un cadre on a la solution de la normalisation globale des données, général d’un nouveau système de médiation capable de via des standards et des normes centralisés. D’autre part, gérer l’interopérabilité sémantique entre différents Comme la sémantique est un aspect important dans la systèmes d’information (SI) particulièrement les SIG basé coopération des systèmes d’information, cette sémantique sur les ontologies. Nous avons appliquées certaines permet aux systèmes distribués de combiner les techniques dans notre approche pouvant assurer la informations reçues avec des informations locales ou coopération entre les ontologies (données) pour réaliser hétérogènes et de traiter l’ensemble de manière globale et l’interopérabilité sémantiques, tels que la fusion et le fournie une modélisation de données indépendamment de mapping, elles sont utilisées pour permettre le partage leur degré de structuration. des données entre des bases de connaissance hétérogènes Comme la sémantique est un aspect important dans la et aussi bien la réutilisation des informations de ces bases coopération des systèmes d’information, notre solution est et de minimiser la perte d’informations afin d’assure une basée sur l’ajout d’une couche sémantique à l’ensemble coopération d’un système d’information interopérable. des objets géographiques indépendamment de leur degré de structuration. Cette couche permet de décrire le 1. Introduction contexte de données dans un langage compréhensible par les utilisateurs (pour prend la décision) et les fournisseurs Actuellement, il existe de nombreuses bases de (mettre à jour les données géographiques) et aussi par la données géographiques (BDG) qui couvrent la même machine (pour automatiser les taches). Cette couche est région du monde réel à des données ou représentations basée sur les ontologies. L’objectif est de concevoir des géométriques différentes. La multiplicité et méthodes de traitement de données basées sur l’approche l’indépendance des bases de données géographiques sémantique et sur une architecture de médiation qui posent aujourd’hui un certain nombre de problèmes. Le permettre la coopération ou la fusion de l’information au fait qu’il n’existe aucun lien entre les objets profit des systèmes hétérogènes et distribués. De plus, les géographiques qu’il implique : une répétition des ontologies permettent des descriptions formelles et opérations de mises à jour, un manque de cohérence entre déclaratives des termes communs, prend en compte du les différentes BD, et une impossibilité d’effectuer des raisonnement automatique ou semi-automatique sur des données partagées d'un domaine. 2.1. L’objectif d’un médiateur de contexte dans notre système Le médiateur de contextes est adapté à des environnements où les sources d’information sont probablement d’évoluer, d’apparaitre et de disparaitre, ces caractéristiques sont adaptées à l’évolution d’un environnement géographique. La médiation de contexte est également caractérisée par une prise en charge de la sémantique grâce aux mécanismes d’unification ou de réconciliation des contextes. Elle peut être considérer comme une approche orientée sémantique. Alors l’interopérabilité concerne la préservation du sens de l’information échangée, c’est ce qu’on appelle l’interopérabilité sémantique. Une définition est couramment admise pour l’interopérabilité sémantique : "elle donne un sens aux informations échangées et s’assure que ce sens est commun dans tous les systèmes entre lesquels des échanges doivent être mis en œuvre" [1] [2] [3].La prise en compte de cette sémantique permet aux systèmes Figure 1. Architecture de médiation de concepts basée sur les distribués de combiner les informations reçues avec des ontologies. informations locales et de traiter l’ensemble de manière cohérente. Notre système est basé sur le modèle de données OWL car ce dernier permet d’établir des relations sémantiques 3. Architecture conceptuelle de notre système complexes entre les différents contextes, et ainsi apportent proposé les capacités de raisonnement nécessaires pour résoudre Notre système d’interopération est divisé en trois les hétérogénéités entre les différents contextes des niveaux (Figure 1.) : fournisseurs, et aussi bien que notre système de médiation Niveau d’application : représente les requêtes émises par de contextes est basé sur les ontologies. Chaque source les utilisateurs et aussi de différentes applications (couche d’information locale est décrite au niveau d’un contexte à consommateur). l’aide d’une ontologie locale qui permet d’avoir une vue Niveau médiation : c’est la couche intermédiaire entre sur la source. Dans le cas où les sources sont décrit à les utilisateurs et les participants à la coopération des l’aide de schéma XML, le format OWL [6] sera généré systèmes d’informations géographiques (couche semi automatiquement pour construit l’ontologie. A intermédiaire). l’objectif de représenter un domaine géographique Niveau SIG : L’approche est de type médiation de commun et compatible entre les systèmes (SIG) contexte alors chaque producteur du SIG participant à la participants à la coopération, nous proposons une coopération qui possède un contexte qui définit la ontologie de domaine globale qui prend les connaissances sémantique des données partagées dans la coopération et inclut un vocabulaire de concepts avec une (couche fournisseur). spécification précise et formelle de leur signification à partir des ontologies locales. Une ontologie locale permet à un utilisateur (consommateur) d’exposer ses 3.1. Définition de notre système proposé besoins par l’envoie des requêtes au médiateur pour reprendre les informations ou les données nécessaires à Notre approche basée sur un système de médiation de d’autres systèmes de la coopération. Un SIG participant contexte, permet d’adopter les sources d’informations fournit des informations adaptées aux besoins des autres sous forme structurées comme OWL (Web Ontology systèmes et les mettre à jour à base d’une ontologie de Language, informellement OWL) ou semi structurées que contexte (application). XML. 3.2. Niveau de médiation part les conflits de la mise à jour de contexte par les fournisseurs ou les SIG participants à la coopération par Nous avons définir un cadre sémantique de médiation. l’ontologie de contexte. Il se compose d’une description de contenu et de contextes à base d’ontologie, composants de médiation de l'information et un processeur de traitement des requêtes. Les composants de médiation sont employés pour chercher des réponses appropriées de requêtes et pour réconcilier des différences sémantiques parmi les sources de données hétérogènes. Les descriptions de contexte et d'ontologie fournissent la sémantique commune pour les composants de médiation. Le processeur QUERY reformule et soumet les requêtes sur les gisements de données locaux et combine les résultats des sous-requêtes soumises. 3.3. Types d’ontologies utilisées dans notre Figure 2. L’ontologie Locale et l’ontologie de contexte. architecture 4. La correspondance entre les ontologies Ontologie de Domaine : dans notre architecture nous avons utilisé une ontologie globale pour décrit le domaine Nous avons appliquées certaine techniques sur les d’application global de la coopération et permet au ontologies dans notre approche pouvant assurer la médiateur, le traitement sémantique d’une requête .Elle coopération entre les ontologies pour réaliser décrit le vocabulaire ayant trait à un domaine générique l’interopérabilité sémantiques, tels que la fusion et le (exemple : géographique, Spatial).elle garanties : (1) La mapping d’ontologies (figure ci-dessous). Elles sont capitalisation des connaissances. (2) Le partage utilisées pour permettre le partage des données entre des sémantique et la communication entre les différents SIG bases de connaissance hétérogènes et pour la réutilisation participants à la coopération. des informations de ces bases et afin d’assurer la perte Ontologie Locale (générique) : est une ontologie locale d’informations. dans notre approche exprime le contexte ou le domaine d’application local d’un SIG. Appelée, méta-ontologies, 4.1. Le mapping entre les ontologies de contextes elle véhicule des connaissances génériques moins abstraites que celles véhiculées par l’ontologie de La définition la plus pertinente est probablement celle domaine, mais assez générales néanmoins pour être de Noy pour le mapping d’ontologies est un processus qui réutilisées à travers différents domaines. L’ontologie spécifie une convergence sémantique entre différentes générique que nous construisons permet la mise en œuvre ontologies afin d’extraire les correspondances entre d’une terminologie propre au domaine concerné par certaines entités [4].Dans notre approche le mapping l’interopérabilité afin de pouvoir éviter les conflits effectué entre les ontologies de contextes et de produit sémantiques. comme résultat une ontologie locale. Ontologie de contexte (ontologie d’application) : Une ontologie d’application offre le plus fin niveau de spécificité, c’est-à-dire elle est dédiée à un champ d’application précis à l’intérieur d’un domaine (géographique). Cette application a pour le but de décrire le contexte d’un concept de l’ontologie local. Ainsi, à chaque concept d’une ontologie local, on associe une ontologie de contexte. La mise en place d’une ontologie contextuelle est facile. Il s’agit d’une ontologie simple, qui modélise les différentes propriétés sémantiques d’un concept de l’ontologie locale, ainsi que leurs relations. (Voir figure 2.). Cette séparation entre l’ontologie locale et l’ontologie de contexte permet de résoudre les conflits liés aux gure 3. Techniques d’enrichissement entre les ontologies. contextes des utilisateurs lors de ses requêtes et d’autre 4.2. La fusion d’ontologies locales 5. L’implémentation La fusion d’ontologies permet de créer une nouvelle L’explicitation des ontologies s’effectue au moyen de ontologie, appelée l’ontologie fusionnée (globale) prenant langages est une des principales décisions à prendre dans les connaissances des ontologies sources [5]. La fusion le procédé de développement d’ontologies consiste à d’ontologies dans notre proposition concerne la création choisir le langage dans lequel l’ontologie sera exprimée et d’une nouvelle ontologie (ontologie globale) à partir de utilisée. Comme l’éventail des choix possibles concernant deux ontologies sources (ontologies locales). L’ontologie les langages de représentation et de spécification résultante unifie et remplace les ontologies d’origine d’ontologies étant très large, il convient de choisir celui (Voir Figure 3.). Les approches les plus courantes qui respecte ces exigences et critères techniques: la utilisent l’union ou l’intersection. Dans l’approche par lisibilité, la possibilité de faire des inférences c’est-à-dire union, l’ontologie résultante contient l’union des entités permettre le traitement informatique des données en vue provenant des ontologies originales et résout les de calculer les déductions logiques possibles [7]. différences de représentation d’un même concept. 5.1. L’éditeur d’ontologie Protégé1 et Prompt 4.3. Processus de traitement des requêtes Pour la spécification de l’ontologie, le langage OWL La figure suivante (Figure 4.) représente le processus est le plus adéquat, pour l’implémentation, nous utilisons de traitement des requêtes des utilisateurs. Ce processus Protégé comme un éditeur d’ontologie qui génère un est constitué de deux phases : fichier en sortie sous le format OWL basé sur la syntaxe Phase 1 le médiateur envoie la requête du demandeur vers Xml compréhensible et traitable par la machine .Prompt les ontologies locales identifiées et de bénéficier le temps est un outil de type interactif qui effectue les processus de recherche qu’il exploiter les résultats d’un processus de d’enrichissement d’ontologies (la fusion, le mapping, mapping que ce dernier réalise la correspondance entre les l’extraction, et aussi la comparaison entre les ontologies). différents sources de données et de résoudre le problème de la complexité des structures de données (ontologies de contextes) alors d’augmenter le temps de réponse de la requête demandeur. Phase 2 : dans le cas où la réponse dans la phase précédente non octroyée alors le médiateur revoie la requête vers l’ontologie globale que cette dernière garantie la réponse demandeur par ce que cette dernière est résultante par les deux processus de mapping et de fusion Classes et Sous Classes d’ontologies qu’il implique de fournie une correspondance entre les différents sources de données et assurer le partage Relation de données afin de crées un vocabulaire commun alors Figure 5. La visualisation d’une ontologie dans d’annuler le problème de perte d’informations. Protégé. Figure 5. La visualisation d’une ontologie dans Protégé. 5.2 Processus d’enrichissement Mapping et Fusion Le but de notre proposition basée sur une architecture de médiation sémantique à base des ontologies avec l’utilisation des techniques d’enrichissement entre cette dernières pour l'interopérabilité des systèmes d'information géographiques est de fournir aux utilisateurs des architectures d'intégration virtuelles et des outils interopérables. Figure 4. Processus de traitement des requêtes. 1 http://protege.stanford.edu/download.html 5.2.1. Le mapping d’ontologies : Le processus de fusionnement implique la tâche de fusionner les ontologies locales enrichis afin de créer un Le mapping d’ontologies est un processus qui spécifie vocabulaire partagé ou une ontologie globale en une convergence ou correspondance sémantique entre définissant trois phases principales : La phase de départ différentes ontologies (Figure 6.).Ces correspondances (les deux ontologies locales fusionnées), la phase sont exprimées en introduisant des axiomes formulés dans d’intégration, la phase finale (l’ontologie globale un langage spécifique. Trois phases principales peuvent partagée). être distinguées dans ce processus : la découverte du La phase de départ (les deux ontologies locales à mapping ; la représentation et l’exécution du Mapping ; fusionner) : dans la phase de départ chaque ontologie l’exploitation du mapping. spatiale (ontologie locale qui se résultante du processus La découverte du mapping : il faut identifier les de mapping entre les ontologies de contextes) ouverte ontologies (ontologies de contexte) de mapping , dans séparément dans le processus sémantique cette phase nous détenons de choisir les ontologies d'enrichissement (fusionnement).La figure suivante correspondantes pour le mappage selon notre besoins . représente les deux ontologies locales qui sont utilisées La représentation et l’exécution du mapping : dans dans le processus du fusionnement. La fusion entre les cette phase il faut identifier le niveau de mapping (Classe, classes est une tache semi automatique il faut sélectionner Sous classe, instance) et aussi de choisir le type de les deux classes (sous classes ou les instances) et en suite mapping (métadonnée, composants ou étape par étape) on exécute le processus du fusionnement. correspondantes pour le mappage selon notre besoins afin d’adapter les conditions de mapping et que le système La phase d'intégration : Dans la deuxième phase effectue l’action demandée et exécute automatiquement d'intégration le processus est responsable de fusionner les les changements additionnels dérivés de cette opération. deux ontologies locales normalisés afin de créer L’exploitation du mapping : le composant d'analyse est l'ontologie globale partagée est l’étape finale dans ce une tache importante appliqué dans cette phase. En processus. conclusion, dans la phase de système, le composant La phase finale : La figure ci-dessus exposer l’ontologie logique est encore l’ordre pour vérifier l'uniformité et les globale résultante par le processus du fusionnement à inférences dans l'ontologie locale récemment créé dans la partir de deux ontologie locales et la suggestion sur le phase précédente. type du fusionnement. 5.2.2. L’Objectif de processus du mapping 5.2.4 L’objectif du processus du fusionnement Le mapping est une solution pour un grand volume et L’ensemble des collections existantes dans une des conflits de données résultant de la diversité et de la coopération d’un SIG partage les données spatiales crées complexité des structures de données spatiales afin de par différents établissements et organismes. Cependant, la fournie une correspondance entre les différents sources de fusion d’ontologies assure le partage de données spatiales donnes alors de garantie le problème de l’hétérogénéité et afin de crées un vocabulaire commun partagé (l’ontologie le conflit entre les sources de données. globale). Alors de distribuer les coûts de gestion des données. C’est-à-dire que les diverses responsabilités et les coûts d’entretien sont partagés entre les différents acteurs qui fournissent des données. Ontologie 2 Ontologie 1 M : Mapping Couleur Vert : Niveau mapping. Ontologie Ontologie Locale 1 Locale 2 M : merging(Fusion) Ontologie Globale Figure 6. Le Processus de Mapping par Prompt. 5.2.3 Le Processus de Fusion Figure 6. Le Processus de Fusionnement par Prompt.. 6. SPARQL d’application (3) la génération de l’ontologie locale par la technique de fusion d’ontologies (les ontologies SPARQL (acronyme dérivé de SQL) est un langage de d’applications contexte). (4) la génération de l’ontologie requêtes destiné à interroger les bases de données globale à partir des ontologies locales par la technique de (fichiers) RDF, standardisé par le W3C et implémenté sur mapping.(5) l’interrogation du modèle par un langage de les systèmes de base de données fournissent la requête SPARQL. récupération efficace des données par son langage d'interrogation sous la forme de langage d'interrogation On distingue deux concepts principaux qui sont : (a) le structuré (SQL), l'ensemble de données dans un document mapping d’ontologies, pour l’objectif de la représentation RDF peut être interroger par le langage d'interrogation et la correspondance entre les ontologies. (b) La fusion appelé le SPARQL. C'est une composante clé de la d’ontologies, leur objectif consiste à percevoir des fusions technologie sémantique de Web. Comme langage entre les ontologies afin d’assurer le partage de données d'interrogation, SPARQL « orienté-donnée » parce qu'il spatiales et de crées un vocabulaire commun partagé interroge seulement l'information tenue dans les modèles ; (l’ontologie globale). il n'y a aucune inférence dans le langage d'interrogation lui-même. Dans un futur travail, nous compterons de réaliser une implémentation basé sur les techniques d’enrichissement 6.1. Les requêtes SPARQL des ontologies appartenant d’automatiser les différents catégories des opérations tel que la fusion, l’appariement, Le mouvement vers les Web sémantiques conduit la le mapping …ect afin d’intégrer un système de capacité de besoin des requêtes efficaces pour un grand raisonnement dans l’ontologie, comme Racer,FacT++, et ensemble de données comportent des relations supportées HermiT,basé sur la logique des prédicats . des ressources de Web. OWL est un ensemble des normes Nous tenterons aussi d’essayer d’autre utilisation de pour décrire et modéliser des données et est l'épine l’ontologie dans l’interopérabilité des systèmes comme dorsale des technologies sémantiques de Web. Les les systèmes multi agents (SMA) dans lesquels chaque ensembles de données RDF peuvent être très grands, et agent contient son ontologie pour augmenter souvent sont sujets à des requêtes complexes avec l’interopérabilité entre la coopération des agents. l'intention de l'extraction et impliquent les raccordements autrement invisibles dans les données. La figure suivante (Figure 8.) représente un exemple d’exécution d’une 8. References requête SPARQL sur une ontologie géographique. [1] F .,Vernadat., “ Interoperable enterprise systems : Architectures, methods and metrics” ,;LGIPM ;Université de Metz , France, 2007. [2] F. Jouanot , “ Un modèle sémantique pour l’interopérabilité de systèmes d’information“ ,In INFORSID, 2000. [3] Charlet ., Cordonnier., GIbaud. ; “Interopérabilité en médecine : quand le contenu interroge le contenant et l’organisation“, Information - Interaction - Intelligence, Requête SPARQL Résultats Requête 2002. [4] N. Noy., “Semantic integration a survey of ontology-based approaches “, SIGMODRec,33(4):pp.65–70, 2004. [5] C. Namyoun , S. IL-YEOL ., H. HYOIL., “ A survey on ontology mapping “, SIGMOD Rec,35(3):34–41, Figure 7. L’Exécution d’une requête SPARQL September 2006. [6] B. Audrey , “Construire une ontologie de la pneumologie : Aspects théoriques,Modèles et Expérimentations “, 7. Conclusion et perspectives laboratoire INSERM UMR_S 872 – Santé Publique et Informatique Médicale, Thèse de doctorat de l’université Dans ce travail, nous avons présenté notre approche PARIS 6, février 2007. fondée sur des techniques qui sont offertes pour réaliser [7] W3C., OWL Working Group,OWL 2 Web Ontology Language Document Overview; l’interopérabilité sémantique. Les principales étapes de http://www.w3.org/TR/2009/REC-owl2-overview- notre proposition sont : (1) la définition d’une architecture 20091027,W3C Recommendation , October 2009. de médiation sémantique basée sur les ontologies. (2) la définition et la création de l’ontologie du contexte ou