<?xml version="1.0" encoding="UTF-8"?>
<TEI xml:space="preserve" xmlns="http://www.tei-c.org/ns/1.0" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://www.tei-c.org/ns/1.0 https://raw.githubusercontent.com/kermitt2/grobid/master/grobid-home/schemas/xsd/Grobid.xsd"
 xmlns:xlink="http://www.w3.org/1999/xlink">
	<teiHeader xml:lang="fr">
		<fileDesc>
			<titleStmt>
				<title level="a" type="main">Une Approche Ontologique d&apos;Intégration de Sources de Données dans un Environnement de Pair à Pair</title>
			</titleStmt>
			<publicationStmt>
				<publisher/>
				<availability status="unknown"><licence/></availability>
			</publicationStmt>
			<sourceDesc>
				<biblStruct>
					<analytic>
						<author>
							<persName><forename type="first">Amina</forename><surname>Azzaz</surname></persName>
							<email>azzaz.ami@gmail.com</email>
							<affiliation key="aff0">
								<orgName type="laboratory">EEDIS</orgName>
								<orgName type="institution">Université Djillali Liabès</orgName>
								<address>
									<addrLine>Sidi Bel Abess</addrLine>
									<settlement>Algérie</settlement>
								</address>
							</affiliation>
						</author>
						<author>
							<persName><forename type="first">Mimoun</forename><surname>Malki</surname></persName>
							<email>mymalki@gmail.com</email>
							<affiliation key="aff0">
								<orgName type="laboratory">EEDIS</orgName>
								<orgName type="institution">Université Djillali Liabès</orgName>
								<address>
									<addrLine>Sidi Bel Abess</addrLine>
									<settlement>Algérie</settlement>
								</address>
							</affiliation>
						</author>
						<author>
							<persName><forename type="first">Ladjel</forename><surname>Bellatreche</surname></persName>
							<email>bellatre@ensma.fr</email>
							<affiliation key="aff1">
								<orgName type="institution" key="instit1">LISI/ENSMA</orgName>
								<orgName type="institution" key="instit2">Université de Poitiers</orgName>
								<address>
									<country key="FR">France</country>
								</address>
							</affiliation>
							<affiliation key="aff2">
								<orgName type="laboratory">LSTE</orgName>
								<orgName type="institution">Université Mustapha Stambouli</orgName>
								<address>
									<settlement>Mascara, Algérie</settlement>
								</address>
							</affiliation>
						</author>
						<author>
							<persName><forename type="first">Youcef</forename><surname>Benmimoun</surname></persName>
						</author>
						<title level="a" type="main">Une Approche Ontologique d&apos;Intégration de Sources de Données dans un Environnement de Pair à Pair</title>
					</analytic>
					<monogr>
						<imprint>
							<date/>
						</imprint>
					</monogr>
					<idno type="MD5">3B3BFF1B35D958A484EC858BE6EFC3FF</idno>
				</biblStruct>
			</sourceDesc>
		</fileDesc>
		<encodingDesc>
			<appInfo>
				<application version="0.7.2" ident="GROBID" when="2023-03-24T00:18+0000">
					<desc>GROBID - A machine learning software for extracting information from scholarly documents</desc>
					<ref target="https://github.com/kermitt2/grobid"/>
				</application>
			</appInfo>
		</encodingDesc>
		<profileDesc>
			<abstract>
<div xmlns="http://www.tei-c.org/ns/1.0"><p>Les systèmes pair à pair (P2P) sont des systèmes à grande échelle, auto-organisés et répartis. Ils permettent la gestion des ressources de manière totalement décentralisée. Cependant, l'intégration sémantique des données structurées, hétérogènes et distribuées à travers ces systèmes s'avère un problème complexe. L'objectif de ce travail consiste à proposer une approche dirigée par la sélection pour la reformulation des requêtes dans les systèmes d'intégration P2P, en introduisant, d'une part, l'information sur les mappings les plus pertinents et d'autre part, l'information provenant des requêtes passées. Une particularité de cette approche est qu'elle réalise un bon compromis entre l'efficacité et la qualité de la réponse.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Mots-clés:</head><p>Intégration des données, ontologie, Pair à pair, correspondance sémantique, Reformulation de la requête.</p><p>1 Plusieurs types de conflits dus à l'hétérogénéité peuvent être considérés dans l'établissement des correspondances entre les sources lors de l'intégration des données. De nombreuses taxonomies de conflits ont été proposées <ref type="bibr" target="#b17">[18]</ref>, on peut simplement les considéré en deux types : syntaxique et sémantique. 2 Communément appelé PDMS : Peer Data Management System. 3 Le rôle des ontologies est central dans le développement des systèmes intégrant des sources hétérogènes. 4 Dans cette article nous utilisons aussi le terme mappings pour désigner les correspondances sémantiques. 5 Schémas relationnels, DTDs, Ontologies... Dans la suite de cet article, nous utilisons les termes ontologie et schéma de manière interchangeable.</p></div>
			</abstract>
		</profileDesc>
	</teiHeader>
	<text xml:lang="fr">
		<body>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="1">Introduction</head><p>L'environnement pair à pair se présente actuellement comme une solution viable pour permettre le passage à l'échelle de l'Internet. Chaque pair se comporte à la fois comme client et serveur, et fournit une partie de l'ensemble des informations de l'environnement distribué sans s'appuyer sur une administration centrale. En effet, le paradigme p2p est mis en oeuvre dans de nombreux domaines d'applications couvrant notamment le calcul distribué tel que Seti@home <ref type="bibr" target="#b0">[1]</ref>, les systèmes de stockage persistant à grande échelle comme OceanStore <ref type="bibr" target="#b1">[2]</ref> et les systèmes de partage de fichier tel que Napster <ref type="bibr" target="#b2">[3]</ref> ou Kaaza <ref type="bibr" target="#b3">[4]</ref>. Les réseaux Pair-à-Pair, ont permis de mettre en place des moyens simples de partage de données tout en se limitant, cependant, à la recherche par mots clés.</p><p>Par ailleurs, l'intégration de sources de données de structures et de sémantique complexes, est devenue un domaine de recherche très important à cause de l'explosion du nombre de sources et leurs hétérogénéités 1 . L'objectif est de donner l'impression d'utiliser un système homogène et centralisé. Deux approches principales pour la conception des systèmes d'intégration ont été définies en se fondant sur la localisation des données gérées par le système : lorsque les données des sources sont stockées dans le système d'intégration on parle d'approche matérialisée ou entrepôt de données <ref type="bibr" target="#b4">[5]</ref>, à l'inverse, lorsque les données intégrées ne le sont pas, on parle d'approche virtuelle ou système de médiation <ref type="bibr" target="#b5">[6]</ref>. Bien que ces systèmes soient efficaces pour des applications comportant peu de sources de données, ils sont peu adaptés au nouveau contexte d'intégration soulevé par le web car ils reposent sur un schéma global unique.</p><p>Récemment, les systèmes Pair à Pair de gestion de données (PDMS 2 ) ont vu le jour. Ils combinent la technologie Pair à Pair et celle des bases de données distribuées et s'appuient sur une description sémantique des sources de données <ref type="bibr" target="#b11">[12]</ref>, on peut citer l'approche PIAZZA <ref type="bibr" target="#b6">[7]</ref>, SomeWhere <ref type="bibr" target="#b7">[8]</ref> et PeerDB <ref type="bibr" target="#b8">[9]</ref>. Bien que ce couplage entre les techniques d'intégration de données et les systèmes p2p est fructueux, il est indispensable de lever certains défis: tels que ceux qui sont dus à l'hétérogénéité 3 et à la nature décentralisée et dynamique du p2p. La problématique de ce type de système peut être décrite comme suit: étant donnés un ensemble P de pairs liés physiquement, contenant des sources de données S i autonomes et hétérogènes. On espère pouvoir interroger les données de ces pairs comme si elles constituaient une seule source en se basant uniquement sur un réseau M des correspondances sémantiques 4 . Un mapping sémantique définit l'équivalence conceptuelle entre des attributs définis dans deux schémas 5 de pairs différents.</p><p>Il s'agit de systèmes de médiation sans schéma global (Cf. la Figure <ref type="figure">.</ref>1) où chaque pair dispose de son propre schéma local et de schéma de correspondance vers d'autres pairs. Il n'y a pas ici, à proprement parler, de processus de routage de requêtes, puisque les pairs vers lesquels propage une requête sont définis par les schémas de correspondance. Par contre, il faut ici : (i) de nouvelles méthodes de découverte automatique des correspondances (alignement des ontologies), parmi les travaux récents dans ce sens <ref type="bibr" target="#b12">[13,</ref><ref type="bibr" target="#b13">14]</ref>, et (ii) des algorithmes efficaces de réécriture et d'optimisation des requêtes en fonction de cet ensemble de mappings. Ce dernier challenge est indispensable pour rendre un PDMS fonctionnel, autrement dit, pour permettre le traitement des requêtes à large échelle tenant compte l'efficacité et la qualité de la réponse. Notre contribution est consacrée au deuxième problème soulevé de par sa complexité, nous proposerons une approche dirigée par un algorithme de sélection afin d'éviter la redondance des chemins empruntés par une requête et de ne la faire propager que vers les pairs pertinents. En supposant que les pairs partagent la même ontologie (conceptualisation du domaine pour la perspective de réconciliation <ref type="bibr" target="#b16">[17]</ref>), chaque pair est décrit par une ontologie locale (source de données à base ontologique <ref type="bibr" target="#b15">[16]</ref>) et maintenir une expertise (un module supplémentaire qui représente sa vision au monde) et également faire intervenir leur comportement passé (historique des requêtes).</p><p>Dans le reste du document, nous discuterons des travaux connexes afin de positionner notre contribution (Section 2), présenterons notre approche et les algorithmes associés (Section 3). Aussi, nous définirons les critères d'évaluation et présenterons notre simulateur (section 4). En conclusion, nous étalerons des perspectives et orientations pour les travaux futurs (Section 5).</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="2">Travaux connexes</head><p>De nombreux travaux basés sur des correspondances sémantiques entre les pairs ont été développés. Différents procédés sont utilisés pour générer ces correspondances de manière plus ou moins automatique. Nous passons en revue quelques travaux typiques suivis d'un tableau comparatif.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Piazza [7]</head><p>Permet aussi bien l'échange de données relationnelles, XML que RDF. Il est basé sur une architecture Pair à Pair pure. En présence de différents schémas et de différentes représentations, les pairs intéressés par l'échange de données définissent des correspondances sémantiques entre eux, deux à deux ou entre petits groupes de pairs. Chaque pair exprime ses requêtes sur son propre schéma. Les requêtes sont dans ce cas évaluées globalement sur un réseau de pairs sémantiquement liés par les correspondances. Piazza combine et généralise les formalismes LAV (Local As View) et GAV (Global-As-View) proposés dans la médiation de schémas dans les systèmes d'intégration de données et les étend aux documents XML. Le langage d'expression des correspondances pour les données relationnelles est PPL (Peer Programming Language) tandis que celui utilisé pour les documents XML est basé sur XQuery. La réécriture des requêtes est basée sur un pattern matching entre les expressions XQuery et les correspondances sémantiques et elle est faite de manière centralisée. L'approche Piazza présente cependant des insuffisances liées à la difficulté de décrire les correspondances, de les construire mais aussi à la maintenance de ces dernières. A noter que les reformulations des requêtes sont faite par un noeud central.</p><p>SomeWhere <ref type="bibr" target="#b7">[8]</ref> Dans SomeWhere, aucun utilisateur n'impose aux autres sa propre ontologie, car le système permet de créer des mises en correspondance entre différentes ontologies. Un pair se connectant un réseau construit les mappings entre sa propre ontologie et les ontologies des pairs servant de point d'entrée dans le réseau. Pour traiter une requête, l'utilisateur doit choisir le pair par lequel sa requête sera initiée dans le réseau. Le routage des requêtes est guidé vers les pairs dont les mappings sont pertinents. Cette pertinence est établie selon un algorithme distribué de raisonnement en logique des propositions (FOL).</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>GLUE [11]</head><p>Le système GLUE utilise une approche par machine learning pour classifier les concepts d'une ontologie afin de les mettre de manière semi automatique en correspondance avec les concepts définis dans les ontologies distantes. Cependant, bien que tout repose sur la phase d'apprentissage, cette approche suppose qu'un nombre important d'utilisateurs collabore pour définir les mappings sémantiques entre les ontologies.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>PeerDB [9]</head><p>Permet le partage de données relationnelles distribuées sans partage de schéma. Il combine les propriétés des systèmes multi-agents avec celles des systèmes Pair-à-Pair. Chaque pair fournit une base de données relationnelle décrite grâce à des méta-données (mots-clés). La reformulation des requêtes est faite par des agents grâce à une mise en correspondance des méta-données associées aux schémas. L'approche PeerDB présente la faiblesse d'autoriser des correspondances entre motsclés pouvant aboutir à de fausses reformulations. Une approche classique pour atteindre cet objectif est d'effectuer toutes les reformulations possibles c'est-à-dire propager Q du noeud initiateur à ses voisins (avec lesquels il dispose de correspondances sémantiques) et ceci récursivement jusqu'à ce qu'une borne de terminaison soit atteinte (généralement un TTL) <ref type="foot" target="#foot_0">6</ref> . C'est le principe de Gossiping utilisé dans les systèmes de partage de fichiers (comme Napster ou Gnutella). Mais il est clair que ce principe est inadapté dans le cas de sources de données de structures et de sémantiques complexes vis-à-vis le coût des reformulations et la complexité élevée de l'algorithme (cas de cycle). Une autre approche basée sur un stockage centralisé de tous les schémas et les mappings offrant une vision globale du réseau et permettant de guider le processus de reformulation a prouvé son avantage dans le système Piazza par la mis en place d'un mécanisme efficace pour trouver toutes les réponses certaines (Rule-Goal Tree Expansion). Contrairement au Gossiping, la complexité est polynomiale. Néanmoins, le besoin d'un stockage centralisé est un obstacle pour le passage à l'échelle de cette approche. Dans SomeWhere, un algorithme distribué basés sur un langage de description d'ontologie avec un encodage logique (FOL) est implémenté, prouvant sa robustesse, complétude et terminaison, c'est un algorithme anytime, malgré cela, il a une faiblesse due à l'échange d'un nombre important de messages. Nous proposons une approche de reformulation efficace basée sur une sélection à priori des mappings pertinents en minimisant le nombre de messages échangés entre les pairs et en évitant les cycles.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.1">Architecture et Principe de fonctionnement</head><p>L'architecture de notre approche est illustrée par l'exemple de la figure. Nous considérons que les pairs n'échangent que les sources de données à base ontologique <ref type="foot" target="#foot_2">7</ref> . En effet chaque pair pouvant stocker à la fois le contenu usuel d'une base de données et l'ontologie qui décrit la sémantique de ces données. Le principe de notre approche consiste à l'établissement d'un plan de reformulation à priori en intégrant deux idées : d'une part, avoir une information sur les mappings les plus pertinents (pour cela un degré de similarité<ref type="foot" target="#foot_3">8</ref> est associé à chaque mappings) et d'autre part, utiliser l'information provenant des requêtes passées (pour cela un historique des requêtes est envisagé). Ces deux types d'informations sont exploités par un module supplémentaire au niveau de chaque pair que nous appelons ici une Expertise, notant qu'une conceptualisation partagée (ontologie de domaine) est toujours recommandée (ontologie pour la perspective de réconciliation <ref type="bibr" target="#b16">[17]</ref>).</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.2">Algorithmes de l'approche proposée</head><p>Le fonctionnement de notre approche est donné par l'algorithme de reformulationefficace et l'algorithme récursif de sélection (P, Q).</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>A-Algorithme de reformulation-efficace ;</head><p>Entrées </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Fin Si Fin</head><p>Comme il est décrit dans l'algorithme de reformulation efficace, notre approche fait appel à un algorithme de sélection qui assure le choix d'un plan de reformulation au préalable (Path). Ceci fait que le pair émetteur de la requête forme une vision plus au mois globale à propos du déroulement de sa requête. </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>B-Algorithme de Sélection (Pi</head></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.3">Exemple</head><p>Soit la requête Q : donner les titres des publications de l'année 2009, requête posée au pair P 1 (exemple précédent). Le déroulement de notre algorithme de reformulation est comme suit: Q est posé en terme de O 1 (l'ontologie locale de P 1 ). Au niveau de l'expertise de P 1 , une reformulation de Q en terme de O G est effectuée en détectant le sub-concept (publication), supposant que Path requêtes passées ← vide.</p><p>Toujours au niveau de E et en collaboration avec les expertises des autres pairs, on calcule les degrés de similarité par rapport au concept en question (publication) à savoir : eff (Mi, j). On abouti ainsi aux résultats suivants (Table <ref type="table" target="#tab_3">2</ref>.). </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="4">Implémentation</head><p>La démonstration de l'approche se fait par le développement d'un simulateur de système d'intégration p2p en se basant sur PeerSim <ref type="bibr" target="#b14">[15]</ref>: un outil<ref type="foot" target="#foot_4">9</ref> open source écrit en Java et qui présente l'avantage d'être spécialisé pour l'étude des systèmes p2p. De plus, il dispose d'une architecture ouverte et modulaire qui permet de l'adapter et le spécialiser. Notre simulateur doit avoir en entrée un jeu de données qui décrivent les pairs du système, la liste des sources de données ainsi que les requêtes qui seront lancées dans le réseau. Il effectue ensuite des simulations sur la base de ces données pour produire en sortie la liste des requêtes envoyées avec leurs chemins de propagation, la liste des réponses à chaque requête, les sources pertinentes, etc. Pour cela, notre Simulateur réalise les fonctions suivantes :  Construire le réseau (nombre de pairs et leurs caractéristiques).  Initialiser le réseau (sources de données, ensemble des mappings, ...).  Maintenir l'expertise (liste de voisinages actifs, paths des requêtes passées).  Implémenter les approches classiques (Gossiping, Noeud Central) et notre nouvelle approche (approche à base de sélection) pour effectuer une comparaison suivant des critères d'évaluation.</p><p>La figure suivante représente le diagramme de séquences du scénario Simulation. L'utilisateur lance la simulation à travers l'Interface Utilisateur. Ensuite la classe configuration s'occupe du chargement du contenu du fichier de configuration. Le simulateur initialise le réseau, et charge les différentes composantes du système, à savoir : les observers, dynamics et les protocoles avant d'entrer dans les boucles de la simulation. </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="4.1">Critères d'évaluation</head><p>Afin d'évaluer les performances de notre approche, nous considérons les critères suivants :</p><p> L'efficacité du traitement : signifie la terminaison du processus de la reformulation dans un temps tolérable. Nous mesurons l'efficacité en fonction du temps de réponse moyen.  La qualité de la réponse (IQ) : la réponse rendue doit être correcte (soundness) et doit inclure toutes les réponses qui existent (completeness). Nous jugeons IQ par rapport à une réponse modèle (pattern). L'intégration de sources de données est devenue un domaine de recherche très important du faite de l'explosion du nombre de sources et leurs hétérogénéités. Cependant, le passage à l'échelle et à un comportement dynamique est fonctionnellement problématique pour les systèmes d'intégration centralisés. D'où l'apparition d'une nouvelle classe d'outils pour l'intégration de données tirant profit des principes de fonctionnement des systèmes P2P. Beaucoup de contraintes s'imposent sur l'intégration de données dans les réseaux P2P. Il s'agit de systèmes de médiation sans schéma global où chaque pair dispose de son propre schéma local (ontologie locale) et de schéma de correspondance vers d'autres pairs. Il faut ici des algorithmes efficaces de réécriture et d'optimisation. Ce challenge est indispensable pour rendre un PDMS fonctionnel.</p><p>Dans cet article, nous avons présenté une approche de reformulation efficace de requête dans les systèmes d'intégration p2p. L'originalité de cette approche est quelle passe par une étape de sélection à priori, ce qui permettra de garantir l'autonomie des pairs mais aussi, de minimiser le nombre de messages échangés, aussi que les reformulations non pertinentes. Cette approche évitera aussi la redondance, tout en assurant une qualité supérieure de la réponse (soundness, completeness). Ce travail présente l'avantage de tirer partie de l'historique des requêtes et vise l'élaboration d'un plan d'exécution à priori qui offre au pair une vision globale sur le déroulement de sa requête. La démonstration de l'approche se fait par le développement d'un simulateur de système d'intégration p2p.</p></div><figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_0"><head>Fig. 1 .</head><label>1</label><figDesc>Fig. 1. Architecture d'un système d'intégration p2p.</figDesc><graphic coords="3,173.16,147.37,260.40,133.44" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_1"><head>Fig. 2 .</head><label>2</label><figDesc>Fig. 2. Architecture de l'Approche Proposée : Exemple.</figDesc></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_2"><head>1 . 2 . 4 . 6 .</head><label>1246</label><figDesc>: N &lt;P, O, M&gt; (un système d'intégration P2P); Q (une requête posé au pair P i ) ; E (Expertise) ; Sorties : l'évaluation de Q globalement suivant un Path de reformulation ; Début Prétraitement de la requête ; /* Décomposition des requêtes complexes et translater en terme de l'ontologie global */ Consulter l'expertise du pair ; 3. Si (existe-déjà (Q) = vrai) Alors Path (Q) ← E.Path; Sinon Path ← Sélection (Pi, Q) ; 5. Fin Si Traitement de la requête ; / * suivant les mappings du Path choisi, reformuler en Q', Q'',… et répondre à chaque Requête localement */ 7. Si (qualité(R) = vrai) Alors E.Path ← Path ; /* Mise à jour de l'expertise */ 8.</figDesc></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_3"><head>Fig. 3 .</head><label>3</label><figDesc>Fig. 3. Diagramme de séquence du scénario Simulation.</figDesc><graphic coords="9,136.20,181.81,345.72,275.40" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_0"><head>Table 1 .</head><label>1</label><figDesc>Comparaison entre quelque PDMS</figDesc><table><row><cell></cell><cell>Piazza</cell><cell cols="2">SomeWhere Glue</cell><cell>PeerDB</cell></row><row><cell>Découverte de</cell><cell>Statique</cell><cell>Statique</cell><cell>Semi -</cell><cell>dynamique</cell></row><row><cell>mappings</cell><cell></cell><cell></cell><cell>automatique</cell><cell></cell></row><row><cell>Principe</cell><cell>PPL</cell><cell>FOL</cell><cell>Machine learning</cell><cell>Agent mobile</cell></row><row><cell>Reformulation</cell><cell>faite par un</cell><cell>totalement</cell><cell>Collaboration</cell><cell>basé sur</cell></row><row><cell>de requêtes</cell><cell>noeud central</cell><cell>décentralisée</cell><cell>d'un nombre</cell><cell>annotation des</cell></row><row><cell></cell><cell></cell><cell></cell><cell>important</cell><cell>mots clés</cell></row><row><cell></cell><cell></cell><cell></cell><cell>d'utilisateur</cell><cell></cell></row><row><cell>Passage à</cell><cell>√ (Jusqu'à</cell><cell>√√</cell><cell>√√</cell><cell>√√</cell></row><row><cell>l'échelle</cell><cell>80 pairs)</cell><cell>(Mille</cell><cell></cell><cell></cell></row><row><cell></cell><cell></cell><cell>pairs)</cell><cell></cell><cell></cell></row></table></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_1"><head>Approche de reformulation efficace dirigée par la sélection</head><label></label><figDesc>Chaque utilisateur interroge le réseau via un pair de son choix ; 2. Les requêtes complexes sont décomposées au niveau du pair; 3. Transmission des requêtes atomiques aux autres pairs concernés ; 4. Chaque pair traite la requête atomique reçue ; 5. Les réponses sont exprimées en terme de langage de mappings utilisé ; 6. Les réponses d'une requête complexe doivent être recombinées. Ce processus est itératif. L'étape 3 est fondamentale, raison pour laquelle l'effort de notre approche s'y focalise. Ainsi, on peut formaliser le problème de reformulation des requêtes comme suit : soit N (P i , O i , M) un système d'intégration P2P (avec P i=1...n collection de pairs, O i ontologies locales, M ensemble de mappings), Q une requête posé à un pair (en termes de O i ). L'objectif est de Calculer les reformulations de Q en fonction de M (les réécritures maximales Q</figDesc><table><row><cell>Considérant le processus du traitement des requêtes dans les systèmes d'intégration</cell></row><row><cell>p2p suivant :</cell></row><row><cell>1.</cell></row></table><note>e de Q).</note></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_3"><head>Table 2 .</head><label>2</label><figDesc>eff (M ij )/Publication Nous choisissons parmi les mappings supérieur à un seuil, celle dont la valeur d'efficacité est la plus élevée. En suite nous passons à une deuxième itération (Q←Q' reformuler Q en fonction de M choisi dans l'étape 4 et P 1 ←P 2 ). Le path résultant (formé des mappings sélectionnés) M 12 , M 34 avec un seuil donné (0,5), donc la réponse à la requête en question est fournie par P 1 , P 2 et P 3 . Cet exemple montre l'efficacité de notre algorithme en évitant le cycle (M 42 ) et le pair non pertinent (P 4 ).</figDesc><table><row><cell cols="2">eff (M 12 ) eff (M 14 )</cell><cell>eff (M 23 )</cell><cell>eff (M 34 )</cell><cell>eff (M 42 )</cell></row><row><cell>0,8</cell><cell>0,4</cell><cell>0,6</cell><cell>0,3</cell><cell>0,3</cell></row></table></figure>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="6" xml:id="foot_0">Time To Live de 4 à</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="7" xml:id="foot_1">selon le niveau de complétude de résultat que l'on souhaite.</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="7" xml:id="foot_2">Le concept Base de données à base ontologique est développé dans le cadre du projet OntoDB au sein du LISI.</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="8" xml:id="foot_3">Le domaine de l'identification de la similarité a été considéré comme un sujet de recherche fortement recommandé dans les domaines du Web sémantique, de l'intelligence artificielle et de la littérature linguistique. Dans<ref type="bibr" target="#b17">[18]</ref>, un état de l'art sur les mesures de similarité ainsi qu'une proposition d'une nouvelle mesure (pour laquelle on a opté) sont présentés.</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="9" xml:id="foot_4">C'est un projet Java libre (licence GPL) de l'université de Bologne.</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" xml:id="foot_5">Une amélioration peut être atteinte en enrichissant l'expertise (de nouvelles mesures de sélection, des algorithmes d'apprentissage de type neuronal, d'ajouter la connaissance des centres d'intérêt des utilisateurs), et/ou en introduisant la notion des agents (agent intelligent). Le rajout d'un mécanisme de retour dans l'algorithme s'avère indispensable afin de pouvoir établir plusieurs plans d'exécution (Paths) candidats permettant la tolérance aux pannes. Cependant, notre travail ne maintient pas l'étape de la reformulation proprement dite qui reste la tâche la plus difficile mais également dont l'impacte est prometteuse, donc une perspective à long terme est d'étudier cette étape en bas niveau (encodage en logique descriptive).</note>
		</body>
		<back>
			<div type="references">

				<listBibl>

<biblStruct xml:id="b0">
	<monogr>
		<title level="m" type="main">Home Page</title>
		<ptr target="http://setiathome.ssl.berkely.edu/»" />
		<imprint/>
		<respStmt>
			<orgName>SETI@home</orgName>
		</respStmt>
	</monogr>
</biblStruct>

<biblStruct xml:id="b1">
	<monogr>
		<title level="m" type="main">OceanStore: architecture for global-scale Perststent storage</title>
		<author>
			<persName><surname>Kubiatowiczj</surname></persName>
		</author>
		<author>
			<persName><forename type="first">D</forename><surname>Bindel</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Y</forename><surname>Chen</surname></persName>
		</author>
		<author>
			<persName><forename type="first">S</forename><surname>Czerwinski</surname></persName>
		</author>
		<author>
			<persName><forename type="first">P</forename><surname>Eaton</surname></persName>
		</author>
		<author>
			<persName><forename type="first">D</forename><surname>Geels</surname></persName>
		</author>
		<author>
			<persName><forename type="first">R</forename><surname>Gummadi</surname></persName>
		</author>
		<author>
			<persName><forename type="first">S</forename><surname>Rhea</surname></persName>
		</author>
		<author>
			<persName><forename type="first">H</forename><surname>Weatherspoon</surname></persName>
		</author>
		<author>
			<persName><forename type="first">C</forename><surname>Wells</surname></persName>
		</author>
		<author>
			<persName><forename type="first">B</forename><surname>Zhao</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2000">2000</date>
			<publisher>ACM SIG ARCH</publisher>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b2">
	<monogr>
		<title/>
		<author>
			<persName><surname>Napster</surname></persName>
		</author>
		<ptr target="www.napster.com»" />
		<imprint/>
	</monogr>
</biblStruct>

<biblStruct xml:id="b3">
	<monogr>
		<title/>
		<author>
			<persName><surname>Kazaa</surname></persName>
		</author>
		<ptr target="www.kazaa.com»" />
		<imprint/>
	</monogr>
</biblStruct>

<biblStruct xml:id="b4">
	<analytic>
		<title level="a" type="main">Research problems in data warehousing</title>
		<author>
			<persName><forename type="first">J</forename><surname>Widom</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Conference on Information and Knowledge Management</title>
				<imprint>
			<date type="published" when="1995">1995</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b5">
	<monogr>
		<title level="m" type="main">Mediators in the architecture of future information systems</title>
		<author>
			<persName><forename type="first">G</forename><surname>Wiederhold</surname></persName>
		</author>
		<imprint>
			<date type="published" when="1992">1992</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b6">
	<analytic>
		<title level="a" type="main">Piazza: Data Management Infrastructure for Semantic Web Applications</title>
		<author>
			<persName><forename type="first">A</forename><surname>Halevy</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Z</forename><forename type="middle">G</forename><surname>Ives</surname></persName>
		</author>
		<author>
			<persName><forename type="first">P</forename><surname>Mork</surname></persName>
		</author>
		<author>
			<persName><forename type="first">I</forename><surname>Tatarinov</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Proceedings of the twelfth international conference on World Wide Web Budapest</title>
				<meeting>the twelfth international conference on World Wide Web Budapest</meeting>
		<imprint>
			<date type="published" when="2003">2003</date>
			<biblScope unit="page" from="556" to="567" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b7">
	<analytic>
		<title level="a" type="main">Somewhere in the semantic web</title>
		<author>
			<persName><forename type="first">P</forename><surname>Adjiman</surname></persName>
		</author>
		<author>
			<persName><forename type="first">P</forename><surname>Chatalic</surname></persName>
		</author>
		<author>
			<persName><forename type="first">F</forename><surname>Goasdoué</surname></persName>
		</author>
		<author>
			<persName><forename type="first">M-C</forename><surname>Rousset</surname></persName>
		</author>
		<author>
			<persName><forename type="first">L</forename><surname>Simon</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">International workshop on principles and practice of semantic web reasoning</title>
				<imprint>
			<date type="published" when="2005">2005</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b8">
	<monogr>
		<title level="m" type="main">Peerdb: A p2p-based system for distributed data sharing</title>
		<author>
			<persName><forename type="first">W</forename><forename type="middle">S</forename><surname>Ng</surname></persName>
		</author>
		<author>
			<persName><forename type="first">B</forename><forename type="middle">C</forename><surname>Ooi</surname></persName>
		</author>
		<author>
			<persName><forename type="first">K-L.</forename><surname>Tan</surname></persName>
		</author>
		<author>
			<persName><forename type="first">A</forename><surname>Zhou</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2003">2003</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b9">
	<analytic>
		<title level="a" type="main">Intégration de bases de données : Panorama des problèmes et des approches</title>
		<author>
			<persName><forename type="first">C</forename><surname>Parent</surname></persName>
		</author>
		<author>
			<persName><forename type="first">S</forename><surname>Spaccapietra</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Ing. Des Syst. D&apos;Info</title>
		<imprint>
			<biblScope unit="volume">4</biblScope>
			<biblScope unit="issue">3</biblScope>
			<date type="published" when="1996">1996</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b10">
	<analytic>
		<title level="a" type="main">Learning to match the schemas of data sources: A multistrategy approach</title>
		<author>
			<persName><forename type="first">A</forename><surname>Doan</surname></persName>
		</author>
		<author>
			<persName><forename type="first">P</forename><surname>Domingos</surname></persName>
		</author>
		<author>
			<persName><forename type="first">A</forename><surname>Halevy</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Mach. Learn</title>
		<imprint>
			<date type="published" when="2003">2003</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b11">
	<monogr>
		<title level="m" type="main">Principles of p2p data integration</title>
		<author>
			<persName><forename type="first">M</forename><surname>Lenzerini</surname></persName>
		</author>
		<editor>Zohra Bellahsene and Peter McBrien</editor>
		<imprint>
			<date type="published" when="2004">2004</date>
			<publisher>DIWeb</publisher>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b12">
	<monogr>
		<author>
			<persName><forename type="first">François-Elie</forename><surname>Calvier</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Chantal</forename><surname>Reynaud</surname></persName>
		</author>
		<title level="m">Découverte de correspondances entre ontologies distribuées LRI</title>
				<meeting><address><addrLine>Orsay Cedex, France</addrLine></address></meeting>
		<imprint>
			<date type="published" when="2007">2007</date>
		</imprint>
		<respStmt>
			<orgName>Univ. Paris-Sud &amp; INRIA Futurs</orgName>
		</respStmt>
	</monogr>
</biblStruct>

<biblStruct xml:id="b13">
	<analytic>
		<title level="a" type="main">Découverte de correspondances sémantiques par inférences dans un environnement P2P</title>
		<author>
			<persName><forename type="first">Lionel</forename><surname>Médini</surname></persName>
		</author>
		<author>
			<persName><forename type="first">C</forename><surname>Ferreira Da Silva</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Nicolas</forename><surname>Lumineau</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Patrick</forename><surname>Hoffmann</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Parisa</forename><surname>Ghodous</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">DECOR Passage à l&apos;échelle des techniques de découverte de correspondances</title>
				<meeting><address><addrLine>Namur, Belgique janvier</addrLine></address></meeting>
		<imprint>
			<date type="published" when="2007">2007</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b14">
	<monogr>
		<title/>
		<author>
			<persName><surname>Peersim</surname></persName>
		</author>
		<ptr target="http://sourceforge.net/projects/peersim»" />
		<imprint/>
	</monogr>
</biblStruct>

<biblStruct xml:id="b15">
	<analytic>
		<title level="a" type="main">Intégration de sources de données autonomes par articulation à priori d&apos;ontologies</title>
		<author>
			<persName><forename type="first">Ladjel</forename><surname>Bellatreche</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Guy</forename><surname>Pierra</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Dung</forename><surname>Nguyen Xuan</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Dehainsala</forename><surname>Hondjack</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">proceeding of the XXIIème Congrès INFORSID</title>
				<meeting>eeding of the XXIIème Congrès INFORSID<address><addrLine>Biarritz, France</addrLine></address></meeting>
		<imprint>
			<date type="published" when="2004-05">May (2004</date>
			<biblScope unit="page" from="25" to="28" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b16">
	<monogr>
		<title level="m" type="main">Intégration Sémantique de Données guidée par une Ontologie</title>
		<author>
			<persName><forename type="first">Sais</forename><surname>Fatiha</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2007-12">Décembre. 2007</date>
		</imprint>
		<respStmt>
			<orgName>Université Paris-Sud</orgName>
		</respStmt>
	</monogr>
	<note type="report_type">Thèse de Doctorat de l&apos;</note>
</biblStruct>

<biblStruct xml:id="b17">
	<analytic>
		<title level="a" type="main">Une extension de mesure de similarité entre les concepts d&apos;une ontologie</title>
		<author>
			<persName><forename type="first">Thabet</forename><surname>Slimani</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Boutheina</forename><surname>Ben Yaghlane</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Khaled</forename><surname>Mellouli</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">SETIT2007 4 rth International Conference: Sciences of Electronic</title>
				<imprint>
			<publisher>Technologies of Information and Telecommunications-TUNISIA</publisher>
			<date type="published" when="2007">2007</date>
		</imprint>
	</monogr>
</biblStruct>

				</listBibl>
			</div>
		</back>
	</text>
</TEI>
