<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Interrogation à base d'annotation sémantique</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>LATRECHE Abdelkrim</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>LEHIRECHE Ahmed</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>BENYAHIA Kadda</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Laboratoire EEDIS, UDL de Sidi Bel Abbes</institution>
          ,
          <addr-line>ALGERIE</addr-line>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>Mots-Clés : Web Sémantique</institution>
          ,
          <addr-line>Recherche Sémantique, Annotation, Ontologie, RDF, SPARQL</addr-line>
        </aff>
      </contrib-group>
      <abstract>
        <p>Résumé. Les approches de la recherche d'information (RI) actuelles ne saisissent pas formellement la signification explicite d'une requête à base de mots-clés mais fournissent une voie confortable pour l'utilisateur qui spécifie ces besoins en informations sur la base des mots-clés. La recherche sémantique promet de fournir des résultats plus précis que la traditionnelle recherche par mots-clés. Toutefois, les progrès de la recherche sémantique ont été retardés en raison de la complexité de ses langages de requête. Dans ce document, nous explorons une nouvelle approche pour l'adaptation des requêtes motsclés pour pouvoir interroger le web sémantique en se basant sur les annotations sémantiques: l'approche traduit automatiquement des requêtes mots clés en des requêtes formelles, afin de permettre aux utilisateurs finaux familiarisés avec l'utilisation des mots clés d'utiliser ces mots-clés pour effectuer des recherches sémantiques. Un prototype de système a été mis en oeuvre sur la lumière de cette approche. Etant donné une requête mots clés, notre système donne en résultats une liste classé de requêtes SPARQL en tant que résultat de la traduction. La traduction dans notre système se compose de trois grandes étapes: Mapping des mots clés aux éléments de la B.C., Construction des graphes requêtes et Classement des requêtes. Avec les premiers tests notre système a réalisé des résultats de traduction encourageant.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>
        La quantité d’information disponible sur internet est aujourd’hui gigantesque et sa
croissance est exponentielle, le nombre d’usagers d’internet double chaque année. On
estime que la taille du Web couvert par les moteurs de recherche est estimée à au
moins 24 milliards de pages1. Mais la spécificité de telles sources d’informations les
rend difficilement exploitables. La raison principale est que les documents sont
fragmentés, dispersés, hétérogènes et sont souvent très peu structurés. Cependant,
grâce aux efforts de la communauté du Web sémantique (W3C), une deuxième
génération est établie dont la vision initiée en 1998 par Sir Tim Berners-Lee [
        <xref ref-type="bibr" rid="ref2">2</xref>
        ]
a pour objectif de structurer les informations disponibles sur le Web. Pour
cela, les ressources, textuelles ou multimédias, doivent être sémantiquement
annotées par des métadonnées afin que les agents logiciels puissent les
exploiter. La représentation explicite des contenus des ressources
documentaires du Web est rendue possible grâce notamment aux
ontologies qui proposent une compréhension commune et partagée d’un
domaine, tant au niveau des utilisateurs humains qu’au niveau des applications
logicielles [
        <xref ref-type="bibr" rid="ref3">3</xref>
        ]. Dans [
        <xref ref-type="bibr" rid="ref9">9</xref>
        ] l’annotation sémantique est définit comme “une
représentation formelle d’un contenu, exprimée à l’aide de concepts, relations et
instances décrits dans une ontologie, et reliée à la ressource documentaire source”.
Pour ce faire, le Web Sémantique fournit un ensemble de langages et de
technologies pour la modélisation des ontologies et l’annotation sémantique
des contenus documentaires en fonction de ces ontologies [
        <xref ref-type="bibr" rid="ref4">4</xref>
        ]. Les standards du W3C,
tels que XML [
        <xref ref-type="bibr" rid="ref5">5</xref>
        ], RDF [
        <xref ref-type="bibr" rid="ref6">6</xref>
        ] et les schémas RDF (RDFS) offrent un format uniforme
pour la description et l’échange du contenu du Web. D’autres efforts accomplis par
des communautés commerciales et/ou académiques tels que DAML+OIL [
        <xref ref-type="bibr" rid="ref7">7</xref>
        ], OWL
[
        <xref ref-type="bibr" rid="ref8">8</xref>
        ]. L’utilisation des annotations sémantiques, en recherche d’information est devenue
une voie très explorée. Dans cette optique, plusieurs systèmes de recherche
d’informations à base d’annotations et d’ontologies ont été proposés. Dans ce type
d’outils de recherche, de manière générale, les pages Web sont (peut-être incomplète)
des instances de certaines ontologies de domaine, et ils contiennent des données
sémantiquement annotées selon les sous-tendent ontologie de domaine, pour plus de
détails voir [
        <xref ref-type="bibr" rid="ref11 ref12">11,12</xref>
        ].
      </p>
      <p>
        De même, que de nombreux langages de requêtes sémantiques (par exemple, RQL
[
        <xref ref-type="bibr" rid="ref16">16</xref>
        ], RDQL2, SquishQL [
        <xref ref-type="bibr" rid="ref17">17</xref>
        ] et SPARQL3) ont été proposés pour interroger ces
annotations. En particulier le langage SPARQL, qui une recommandation du W3C
dont la standardisation finale datte du 15 Janvier 2008. Toutefois, pour pouvoir
utiliser ces langages sémantiques, les utilisateurs doivent maîtriser les représentations
complexes de la logique formelle et être familier aves les ontologies sous-adjacentes.
Ceci devient un fossé critique entre la recherche sémantique et les utilisateurs finaux.
Par conséquent, il est important de permettre aux utilisateurs d'effectuer des
recherches sémantiques simplement en entrant des requêtes à base de mots clés. Pour
adapter la recherche par mots clés à la recherche sémantique, nous avons à surmonter
les obstacles suivants [
        <xref ref-type="bibr" rid="ref24">24</xref>
        ]: 1) Le fossé vocabulaire : Les utilisateurs du web
traditionnel généralement n'ont pas de connaissances sur le contenu et la structure de
la base de connaissances (annotations et ontologies sous-jacentes). 2) Le manque de
relations : les relations entre les ressources de la base de connaissances sont exigées
pour être explicitement énoncées dans les requêtes formelles, qui sont souvent
manquantes dans les requêtes mots-clés des utilisateurs. 3) Classement des Requête:
En raison de l'ambiguïté de la recherche par mots clés, il peut y avoir de multiples
requêtes formelles produites à partir d'une requête mots-clés.
      </p>
      <p>
        Dans le contexte de Web sémantique il existe des travaux sur la traduction des
requêtes mots-clés en requêtes sémantiques. Royo et al. [
        <xref ref-type="bibr" rid="ref18">18</xref>
        ] propose un mapping des
2
http://www.w3.org/Submission/2004/SUBM-RDQL-20040109/
http://www.w3.org/TR/rdf-sparql-query/
mots-clés à leurs correspondant synsets de WordNet.. Bernstein et al. [
        <xref ref-type="bibr" rid="ref19">19</xref>
        ] explore les
langages contrôlés fourni et les interfaces guidées par le langage naturel [
        <xref ref-type="bibr" rid="ref26">26</xref>
        ]. Du
point de vue de l'affinement des requêtes [
        <xref ref-type="bibr" rid="ref20">20</xref>
        ] [
        <xref ref-type="bibr" rid="ref21">21</xref>
        ], l'écart entre les besoins en
information des utilisateurs et leurs requêtes sémantique est quantifié par la mesure
de plusieurs types d’ambiguïtés des requêtes à travers les interactions progressives. La
recherche à base de graphe [
        <xref ref-type="bibr" rid="ref22">22</xref>
        ] contribue également dans cette voie, par la
construction des graphes requêtes par le biais de la navigation et de sélection sur
l'ontologie. SemSearch [
        <xref ref-type="bibr" rid="ref14">14</xref>
        ], a une petite interface structurée de requête mots-clés
pour cacher la complexité de la recherche sémantique. Avatar Semantic Search [
        <xref ref-type="bibr" rid="ref23">23</xref>
        ]
est un prototype de moteur de recherche qui exploite les annotations dans le contexte
de la recherche par mot-clé classique. Une autre application représentative de la
recherche sémantique à base de mot clé est OntoLook [
        <xref ref-type="bibr" rid="ref28">28</xref>
        ]: un prototype de moteur de
recherche à base de relation. Dans [
        <xref ref-type="bibr" rid="ref10">10</xref>
        ], les auteurs ont proposés une approche pour
traduire les requêtes mots-clés en requêtes conjonctives DL en utilisons les
connaissances disponibles dans une ontologie. Dans [
        <xref ref-type="bibr" rid="ref24">24</xref>
        ] la construction des graphes
requêtes se base sur l’application de l’algorithme MST (Minimum Spanning Tree).
Thanh et al. [
        <xref ref-type="bibr" rid="ref25">25</xref>
        ] présentent une approche de recherche par mot-clé sur les données
structurées en graphe, en mettant l'accent en particulier sur le modèle de données
RDF. Beaucoup de méthodologies pour décider des meilleures requêtes ont été
proposés [
        <xref ref-type="bibr" rid="ref24 ref25 ref26 ref27">26, 27, 24, 25</xref>
        ].
      </p>
      <p>Sur la base des travaux présentés ci-dessus, nous présentons une approche qui
permet de traduire automatiquement des requêtes mots-clés en requêtes formelle
SPARQL en vertu de la base de connaissances (base d’annotations sémantiques). Les
étapes principales de traduction sont: 1) Le mapping des mots clés aux éléments de la
BC, 2) Construction des graphes requêtes et 3) Classement des requêtes.
De cette façon, les utilisateurs peuvent garder l'habitude de saisir les mots-clés pour
interroger le Web sémantiques sur la base d’annotation sémantique d'une manière
transparente, ce qui augmentent l'utilisation sociale de la recherche sémantique.</p>
      <p>Le reste de ce document est organisé comme suit: section 2 définit le problème de
la construction des requêtes formelles. Section 3 décrit les principales étapes de
construction de requête formelle SPARQL. L’implémentation et les résultats
expérimentaux sont présentés dans la section 4. Nous donnons la conclusion et les
travaux futurs dans la dernière section.</p>
    </sec>
    <sec id="sec-2">
      <title>Définition du problème</title>
      <p>Dans une base de connaissances RDF, une requête sémantique correspond à un
graphe requête avec des noeuds objets et des arcs propriété. Ainsi, nous pouvons
réduire le problème de la traduction des requêtes mots clés en requêtes formelles
conjonctives au problème de la construction des graphes requêtes équivalent. Pour
clarifier le problème, nous donnons la définition formelle comme suit:
Base de connaissances (B.C) D :(C, I, L, R, ) est un graphe orienté GD où : C
et R définis respectivement des ensemble de concepts (classes) et de relations
(propriétés). I et L définis respectivement des ensembles d’individus
(ressources) et de littéraux. La fonction :(C I) X (C I L) R définit
tous les triples de D. En outre, nous utilisons le symbole éléments (entités)
{e} :{C R I L} pour représenter toutes les concepts (classes), individus
(ressources), relations (propriétés), et les littéraux.</p>
      <p>Requête mots clés Qu est un ensemble de mots-clés {k1,…,kn}.</p>
      <p>Requête formelle Qs :(C’, R’, I’, L’, V, ’) de D est un graphe GF subsumé par
GD.. V est l'ensemble des noeuds variable. ’ : (I’ C’ V) X (I’ C’ V</p>
      <p>L’) R’ définit l'ensemble des triples de Qs.</p>
      <p>Dans la section suivante, nous illustrerons notre approche en détaille.
3</p>
    </sec>
    <sec id="sec-3">
      <title>Aperçu de l’approche</title>
      <p>L’infrastructure de notre système se compose de deux modules (fig. 2) : Le module
prétraitement a pour rôle d’indexer automatiquement les entités de la base de
connaissances pour obtenir un index qui sera utilisé dans l’étape de Mapping des
mots clés aux éléments de la B.C. Alors que Le module de construction des requêtes
formelles prend en entrée les mots-clés, et renvoie en sortie une liste classées de
requêtes conjonctives SPARQL. Dans les sections suivantes, nous détaillerons ces
déférentes étapes.</p>
      <sec id="sec-3-1">
        <title>Mapping des mots clés aux éléments de la B.C.</title>
        <p>
          Le but de ce mapping est de trouver les éléments de la B.C. (c'est-à-dire concepts,
individus, relations et littéraux) correspondants à chaque mot clé de la requête de
l’utilisateur. Les noms et les étiquettes (labels) des éléments de la B.C. sont utilisées
pour le mapping. Dans notre approche, deux types de méthodes de mapping peuvent
être utilisées: 1) le mapping morphologique emploie les techniques de comparaison
de chaîne de caractères, tels que le stemming, Sub-String et Levenshtein Distance
pour trouver les mots morphologiquement semblables; 2) Le mapping sémantique
utilise principalement des dictionnaires généraux comme WordNet [
          <xref ref-type="bibr" rid="ref1">1</xref>
          ], afin de trouver
les mots sémantiquement approprié (par exemple, les synonymes, etc.). Nous
assignons un score prédéfini Sm(e) (Sm(e) [
          <xref ref-type="bibr" rid="ref1">0,1</xref>
          ]) à chaque méthode de mapping
pour déterminer la qualité du mapping. En règle générale, le score du mapping direct
est supérieur au mapping à base des synonymes. En conséquence le Mapping des
mots clés aux éléments de la BC associe à chaque terme de la requête mots clés un ou
plusieurs sens selon la base de connaissances. En particulier, le mapping peut être
définie comme fonction f : Qu D qui pour chaque terme de la requête mot clés
retourne un ensemble des éléments de la B.C. Pour des fins pratiques le moteur de
recherche Lucene4 est effectivement utilisée comme moteur d'index et de recherche.
C'est à dire, les noms et les étiquettes des éléments de la B.C. sont indexées, et en
utilisant la fonction de recherche de Lucene, une requête est générée pour chaque
mot-clé entré. Le moteur retourne les éléments de la B.C. classées en fonction de leurs
similarités syntaxique aux mots clés respectifs. Ces éléments appelés « éléments
mots clés » Dm = {f(ki) / Qu=(k1,..., Kn)} seront alors introduit dans l'étape de la
construction des graphes requêtes.
        </p>
        <p>Voir http://lucene.apache.org/java/docs/
Ce processus construit les graphes requête candidats avec les éléments mots clés trouvés dans
l’étape précédente. Tout d'abord, les éléments mots clés sont répartis en différentes ensembles
de requêtes. Le but de cette répartition est d’attribuer un sens à chaque requête formelle par
l’énumération de toutes les combinaisons possibles des différents sens pour chaque terme ki de
Qu. Ensuite, un certain nombre d’algorithmes sont appliqués pour construire de possible
graphes requêtes pour chaque ensemble de requêtes.
3.2.1</p>
      </sec>
      <sec id="sec-3-2">
        <title>Calcul des graphes de Connexions</title>
        <p>Dans notre approche, l’exploration des relatons se limite aux relations de type : (i, c), (i1, R, i2)
et (i, U, j) où i, i1, i2 I, j L, c C, R R , U U avec I (Individus), L
(littéraux), C (Concepts), R (propriétés d’objets) et U (propriétés de données) Par
l'utilisation de ces axiomes, nous explorons touts les éléments de la B.C. liées aux éléments de
Dm identifiés dans la première étape selon l'algorithme montré à la Fig. 3. Le processus du
calcule des graphes de connexions se déroule comme suit :
1.</p>
        <p>Explorer les liens entre les éléments de la B.C :.Fondamentalement, l'exploration
comprend la traversée des voisins pour chacun des éléments de Dm. Ensuite, selon le type
de l'élément particulier em Dm, différents parcours sont effectués pour construire un
graphe connectant em à tous ces voisins sur une distance spécifique d. Soit un concept, tous
les individus sont recherchés par l'intermédiaire de l’axiome (i, c). Compte tenu une
relation, les axiomes (i1, R, i2) et (i, U, j) sont utilisées pour naviguer vers les individus et
les littéraux, respectivement. La figure 4, montre le pseudocode de l’algorithme pour la
traversée récursif d'un individu ou d’un littéral particulier à ses voisins concepts, individus
et littéraux. La valeur de d est réduite de un à chaque étape de récusions pour assurer à ce
que cette traversée sera limitée à une certaine distance. En fin de compte, nous obtenons</p>
        <p>un graphe g contenant touts les éléments de D qui ont une distance graphique qui ne
dépasse pas d au moins à un des éléments de Dm. Ainsi, quelques éléments découverts
peuvent vraiment ne pas être nécessaires pour connecter des éléments de Dm. Par
conséquent, à partir de ce graphe, ont choisis seulement les chemins où le premier et le
dernier sommet correspond est un élément de Dm. En particulier, une version modifiée de
la procédure DFS (Depth First Search) sur les graphes est utilisé pour le calcul de tous les
chemins p P pour chaque paire possible tel que (a, b) Dm tel que p= (a, e1, ..., en, b),
et aucun des sommets n’est visité plus d'une fois. Ces chemins seront introduits dans
l'étape suivante.</p>
        <p>Le calcul des Connexions : Une requête peut être dérivée quand tous les éléments Dm
identifiés dans la première étape sont connectés. En fusionnant tous les chemins P calculés
dans l'étape précédente, nous obtenons toutefois un graphe qui peut contenir plusieurs
différents sous-graphes connectant tous les éléments de Dm. Le sous-graphe connectant les
éléments de Dm sont calculés par une procédure récursive montrée dans l'algorithme de la
fig.5. L'entrée de l'algorithme est l'ensemble des chemins P calculée précédemment La
récusions commence par la sélection d’un certain chemin connectant deux sommets
arbitraires et entre d'autres récusions pour ajouter des sommets supplémentaires. De cette
façon, tous les sous-graphes en forme d’arbre possibles connectant des éléments de D sont
déterminés.</p>
        <p>Algorithme Traversé ( i, d, t, g)</p>
      </sec>
      <sec id="sec-3-3">
        <title>Mapping des graphes de Connexions aux graphes requête</title>
        <p>Enfin, Chacun des graphes de connexion Gc trouvé précédemment est ensuite traduit
en un graphe requête comme suit : une arête dans Gc de la forme type (vi, vc)
(représentant la connexion (i, c)) est considéré comme arête dans le graphe requête de
la forme Type(x, C), où vi, est un sommet construit au moyen d'un individu, vc est
construit en utilisant un concept, et x est un individu ou une variable. Lorsqu’un
individu de vi correspond à certains éléments em Dm, il est considéré comme une
constante, sinon une variable est utilisé pour ce terme. Comme le même individu peut
être utilisé dans beaucoup d’arêtes, la même variable doit être utilisée pour le même
individu. Les arêtes construit avec les axiomes de la forme R (vi, vj), où vi (vj) est
construit en utilisant soit un individu ou un littérale (connexions (i1, R, i2) et (i, U, j)).
Ces arêtes sont considérés comme arêtes dans le graphe requête de la forme R(x, y),
où un sommet construits au moyen d'un individu est associé à une variable ou une
constante comme décrit ci-dessus. Lorsque vi (vj) est construit en utilisant un littérale,
il est tout simplement considéré comme noeud associé à une constant. Dans notre
exemple de la Fig.1, il existe un seul graphe de connexion donc un seul graphe
requête.</p>
        <p>Puisque SPARQL est un langage d'interrogation basé sur les motifs de graphes, il
est facile de convertir un graphe requête en une requête SPARQL.</p>
        <p>Algorithme Calculer-graphe-connexion (P, C, R, G, g)
1 Entrée l’ensemble de chemins P calculer par DFS pour tous les éléments mots clés de Dm
2 Sortie Tous les sous-graphes connectant les sommets de Dm
4 Alors Pour {i, j} R
5 Faire G=NouveauGraphe
6 Pour chaque chemin p entre i et j (calculer par DFS)
7 Faire ajouter (i, p, j) dans G
8 Calculer-graphe-connexion (P\p, C
9 g=g G
10 Sinon Pour i R
11 Faire Pour j C
12 Faire Pour chaque chemin p entre i et j
13 Faire ajouter (i, p, j) dans G
14 Calculer-graphe-connexion (P\p, C
{i, j}, R\{i, j}, G)
{i}, R\{i}, G)
Après l'étape de la construction des graphes requêtes, plusieurs requêtes formelles
candidates peuvent être produites à partir de la requête mots-clés initiale
correspondant à toutes les interprétations possibles des mots clés. Un problème se
pose: comment prendre la requête formelle qui correspond aux besoins de
l’utilisateur?.</p>
        <p>Le calcule du score des réponses a été largement discuté dans le domaine de la
recherche d'information. Dans le contexte des données structurées en graphe, Les
métriques standard souvent utilisés sont "PageRank" (pour calculer le score des
sommets) et le plus court chemin (pour calculer le score des chemins). Les graphes
sont construits à partir d'un ensemble de chemins P. Le score d'un tel graphe est défini
comme agrégation monotonique des scores de ses chemins. En particulier, CG =
pi P</p>
        <p>Cpi est utilisé, où Cpi et CG dénotent des coûts. En général, le coût d'un
mapping des éléments d’un graphe requête. CG =
chemin est calculé à partir du coût de ses éléments, c'est-à-dire Cpi=
arêtes, où |V| est le nombre total de sommets dans le graphe d’exploration, |vagg| est le
nombre des individus qui sont relies au sommet v, |E| est le nombre total d'arêtes et
|eagg| est le nombre d’arêtes correspondant à e dans le graphe d’exploration.
Notre système est implémenté en Java et Jena5 API. Un utilisateur saisi sa requête
mots-clés et il obtient en revanche une liste classée des requêtes SPARQL. Ces
requêtes SPARQL traduites peuvent ainsi être directement envoyées à moteur de
recherche ARQ6 pour avoir les ressources relatives à sa requête.</p>
        <p>Nous allons maintenant discuter les expériences que nous avons réalisées pour
évaluer l'efficacité et le rendement de notre approche. Pour évaluer notre approche,
nous utilisons une base d’annotation RDF au sujet des publications scientifiques sur
l’informatique. Notre expérience a été réalisée sur un PC avec un CPU Pentium de 3,2
GHz et 2 Go de mémoire. Afin d'évaluer l'efficacité de notre approche, nous avons
demandé à des collègues de nous fournir des requêtes mots-clés avec leurs
descriptions en Langage Naturel (LN). 20 requêtes différentes ont été proposées. Un
exemple de requête est : "publications SmartWeb Pascal Hitzler 2002" (retrouver
toutes les publications publié par Pascal Hitzler dans SmartWeb en 2002).</p>
        <p>Nous avons pris deux métriques pour l'évaluation: Rappel et MRR : Le rappel est
défini comme le nombre des requêtes mots-clés correctement traduites divisées par
toutes les requêtes mots-clés de l’ensemble d'évaluation (c.-à-d. 20 dans notre cas).
Tandis que MRR, se concentre sur les performances globales du système. Pour
5
http://jena.sourceforge.net/
http://jena.sourceforge.net/ARQ/
évaluer l'efficacité de la génération des requêtes et leur classement, une métrique
standard en RI appelé Reciprocal Rank (RR), définie comme RR =1/r est utilisé, où r
est le rang de la bonne requête. Selon notre définition du problème, une requête est
correcte si elle correspond au besoin en information (la description LN fournie). Si
aucune des requêtes générées ne correspondent à la description LN, RR est égale à 0.
Nous avons calculé MRR qui est la moyenne de RR de toutes les requêtes mots-clés
de notre test. Nous avons obtenus un rappel de 0.825 et un MRR de 0.745 (Fig. 6)
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0</p>
        <p>Rappel</p>
        <p>MRR</p>
      </sec>
    </sec>
    <sec id="sec-4">
      <title>Conclusion et travaux futurs</title>
      <p>Dans ce document, nous avons formalisé le problème de la construction des requêtes
formelle et présenter une approche efficace pour le résoudre. Notre système vise à
traduire les requêtes mots-clés en requêtes SPARQL en utilisant les connaissances
disponibles dans une base de d’annotation pour réduire l'écart entre la recherche
sémantique basé sur la logique formelle et les utilisateurs finaux habitué à utiliser les
moteur de recherche classique basé sur les mots clé. Notre approche peut se résumé
ainsi : Une fois un utilisateur entre une requête mots-clés, la première étape qui est
réalisée est le mapping des mots clés aux éléments de la BC, cette étape utilise un
ensemble de méthodes de mapping pour trouver les éléments correspondants dans la
base de connaissances en fonction des mots-clés de l'utilisateur. Ensuite, l'étape de
construction des graphes requête énumère toutes les combinaisons possibles de
requête et applique un certain nombre d’algorithmes pour construire les graphes
requêtes avec différents sens des éléments mots clés. Enfin, l'étape de classement des
requête évalue les requêtes formelles construites à en utilisant un modèle probabiliste
de classement des requêtes. Une liste de requêtes SPARQL classée sera remis à
l'utilisateur final. Avec les premiers tests notre système a réalisé des résultats de
traduction encourageant. La principale contribution de ce document est l’exploitation
des annotations sémantiques dans la recherche d’information sur le Web.</p>
      <p>Dans les travaux futurs, nous estimons améliorer notre approche de plusieurs
façons: 1) élargir la portée des requêtes par l'introduction de certains opérateurs
structurés (par exemple, NOT, OR, les filtres etc.) et en améliorant le support
d'interaction humaine pour traduire les besoins en informations plus complexes. 2)
Les travaux futurs seront axés sur le renforcement de la performance. Nous
envisageons d'exploiter la connaissance disponible dans l’ontologie pour une
«exploration guidée » des liens entre les entités d'ontologie pour réduire le nombre de
requêtes. 3) étendre notre approche sur une base d’annotation plus consistante et
reparti sur le Web.</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          1.
          <string-name>
            <surname>Miller</surname>
            ,
            <given-names>G.A.</given-names>
          </string-name>
          :
          <article-title>Wordnet: a lexical database for english</article-title>
          .
          <source>Commun. ACM</source>
          <volume>38</volume>
          (
          <issue>11</issue>
          ) (
          <year>1995</year>
          )
          <fpage>39</fpage>
          -
          <lpage>41</lpage>
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          2.
          <string-name>
            <surname>BERNERS-LEE</surname>
            <given-names>T.</given-names>
          </string-name>
          , Weaving the Web, Harper Eds, San Francisco,
          <year>1998</year>
          , 226 p.
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          3.
          <string-name>
            <surname>Fensel</surname>
            ,
            <given-names>D.</given-names>
          </string-name>
          et al eds.
          <year>2003</year>
          .
          <article-title>Spinning the Semantic Web:Bringing the World Wide Web to Its Full Potential</article-title>
          . Cambridge, Mass.: MIT Press.
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          4. UREN V.,
          <string-name>
            <given-names>CIMIANO P.</given-names>
            , HANDSCHUH S.,
            <surname>VARGAS-VERA</surname>
          </string-name>
          <string-name>
            <surname>M.</surname>
          </string-name>
          ,
          <string-name>
            <surname>MOTTA E. &amp; CIRAVEGNA F.</surname>
          </string-name>
          ,
          <article-title>Semantic annotation for knowledge management: requirements and a survey of the state of the art</article-title>
          ,
          <source>in Journal of Web Semantics, Science, Services and Agents on the World Wide Web</source>
          ,
          <volume>4</volume>
          (
          <issue>1</issue>
          ), Elsevier,
          <year>2006</year>
          , pp.
          <fpage>14</fpage>
          -
          <lpage>26</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          5.
          <string-name>
            <surname>Bray</surname>
            ,
            <given-names>T.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>J.</given-names>
            <surname>Paoli</surname>
          </string-name>
          , and
          <string-name>
            <given-names>C.M.</given-names>
            <surname>Sperberg-McQueen</surname>
          </string-name>
          (
          <year>1998</year>
          ).
          <article-title>Extensible Markup Language (XML) 1.0</article-title>
          .
          <string-name>
            <given-names>W3C</given-names>
            <surname>Recommendation</surname>
          </string-name>
          , February
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          6.
          <string-name>
            <surname>Lassila</surname>
            ,
            <given-names>O.</given-names>
          </string-name>
          ,
          <article-title>and</article-title>
          <string-name>
            <given-names>R.</given-names>
            <surname>Swick</surname>
          </string-name>
          , (
          <year>1999</year>
          ).
          <article-title>Resource Description Framework (RDF) Model and Syntax Specification, W3C Recommendation</article-title>
          .
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          7.
          <string-name>
            <surname>Harmelen</surname>
            ,
            <given-names>F.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>P.F.</given-names>
            <surname>Patel-Schneider</surname>
          </string-name>
          ,
          <string-name>
            <surname>and I. Horrocks</surname>
          </string-name>
          (
          <year>2001</year>
          ).
          <article-title>Reference Description of the DAML+OIL. Ontology markup language</article-title>
          .html.
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          8.
          <string-name>
            <surname>Ding</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>P.</given-names>
            <surname>Kolari</surname>
          </string-name>
          ,
          <string-name>
            <given-names>T.</given-names>
            <surname>Finin</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Joshi</surname>
          </string-name>
          ,
          <string-name>
            <given-names>Y.</given-names>
            <surname>Peng</surname>
          </string-name>
          , and
          <string-name>
            <given-names>Y.</given-names>
            <surname>Yesha</surname>
          </string-name>
          (
          <year>2005</year>
          ).
          <article-title>On Homeland Securityand the Semantic Web: A Provenance and Trust Aware Inference Framework</article-title>
          .
          <source>AAAI Spring Symposium on AI Technologies for Homeland Security</source>
          , Stanford University, CA.
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          9.
          <string-name>
            <surname>Amardeilh</surname>
            ,
            <given-names>F.</given-names>
          </string-name>
          (
          <year>2007</year>
          ).
          <article-title>Web Sémantique et Informatique Linguistique :propositions méthodologiques et réalisation d'une plateforme logicielle</article-title>
          . Thèse de doctorat.
          <source>Discipline : Informatique</source>
          . Université Paris X - Nanterre, Mai 2007
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          10. T. Tran,
          <string-name>
            <given-names>P.</given-names>
            <surname>Cimiano</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S.</given-names>
            <surname>Rudolph</surname>
          </string-name>
          , and
          <string-name>
            <given-names>R.</given-names>
            <surname>Studer</surname>
          </string-name>
          , “
          <article-title>Ontology-based interpretation of keywords for semantic search</article-title>
          ,” in ISWC/ASWC,
          <year>2007</year>
          , pp.
          <fpage>523</fpage>
          -
          <lpage>536</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          11.
          <string-name>
            <given-names>K. S.</given-names>
            <surname>Esmaili</surname>
          </string-name>
          and
          <string-name>
            <given-names>H.</given-names>
            <surname>Abolhassani</surname>
          </string-name>
          .
          <article-title>A categorization scheme for semantic web search engines</article-title>
          .
          <source>In 4th ACS/IEEE Int. Conf. on Computer Systems and Applications (AICCSA06)</source>
          ,
          <year>2006</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          12.
          <string-name>
            <surname>Peter</surname>
            <given-names>Scheir</given-names>
          </string-name>
          , Viktoria Pammer,
          <string-name>
            <given-names>Stefanie N.</given-names>
            <surname>Lindstaedt</surname>
          </string-name>
          ,Information Retrieval on the Semantic Web - Does it exist?,
          <year>2007</year>
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          13.
          <string-name>
            <given-names>Y</given-names>
            <surname>Lei</surname>
          </string-name>
          ,
          <string-name>
            <given-names>V S</given-names>
            <surname>Uren</surname>
          </string-name>
          and
          <string-name>
            <given-names>E</given-names>
            <surname>Motta</surname>
          </string-name>
          ,
          <article-title>Avatar: A search engine for the semantic web</article-title>
          .
          <source>EKAW</source>
          <year>2006</year>
          , pp.
          <fpage>238</fpage>
          -
          <lpage>245</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          14.
          <string-name>
            <surname>Lei</surname>
            ,
            <given-names>Y.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Uren</surname>
            ,
            <given-names>V.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Motta</surname>
          </string-name>
          , E.:
          <article-title>Semsearch: A search engine for the semantic web</article-title>
          .
          <source>Lecture Notes in Computer Science : Managing Knowledge in a World of Networks</source>
          (
          <year>2006</year>
          )
          <fpage>238</fpage>
          -
          <lpage>245</lpage>
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          15.
          <string-name>
            <surname>Victoria</surname>
            <given-names>Uren</given-names>
          </string-name>
          , Yuangui Lei, Enrico Motta ,
          <source>SemSearch: Refining Semantic Search</source>
          ,
          <year>2008</year>
        </mixed-citation>
      </ref>
      <ref id="ref16">
        <mixed-citation>
          16.
          <string-name>
            <surname>Karvounarakis</surname>
            ,
            <given-names>G.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Alexaki</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Christophides</surname>
            ,
            <given-names>V.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Plexousakis</surname>
            ,
            <given-names>D.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Scholl</surname>
            ,
            <given-names>M.:</given-names>
          </string-name>
          <article-title>RQL: A Declarative Query Language for RDF</article-title>
          .
          <source>In: Proceedings of WWW'02</source>
          , New York, NY, USA, ACM Press (
          <year>2002</year>
          )
          <fpage>592</fpage>
          -
          <lpage>603</lpage>
        </mixed-citation>
      </ref>
      <ref id="ref17">
        <mixed-citation>
          17.
          <string-name>
            <surname>Miller</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Seaborne</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Reggiori</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          :
          <article-title>Three Implementations of SquishQL, a Simple RDF Query Language</article-title>
          . In: Proceedings of ISWC'
          <year>2002</year>
          . (
          <year>2002</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref18">
        <mixed-citation>
          18.
          <string-name>
            <surname>Royo</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Mena</surname>
            ,
            <given-names>E.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Bernard</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Illarramendi</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          :
          <article-title>Searching the web: From keywords to semantic queries</article-title>
          .
          <source>In: Proceedings of the Third International Conference on Information Technology and Applications (ICITA'05)</source>
          , IEEE Computer Society (
          <year>2005</year>
          )
          <fpage>244</fpage>
          -
          <lpage>249</lpage>
        </mixed-citation>
      </ref>
      <ref id="ref19">
        <mixed-citation>
          19.
          <string-name>
            <surname>Bernstein</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Kaufmann</surname>
          </string-name>
          , E.,
          <string-name>
            <surname>Gohring</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Kiefer</surname>
            ,
            <given-names>C.</given-names>
          </string-name>
          :
          <article-title>Querying ontologies: A controlled English interface for end-users</article-title>
          .
          <source>In: Proceedings of ISWC'</source>
          <year>2005</year>
          . (
          <year>2005</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref20">
        <mixed-citation>
          20.
          <string-name>
            <surname>Stojanovic</surname>
            ,
            <given-names>N.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Stojanovic</surname>
            ,
            <given-names>L.:</given-names>
          </string-name>
          <article-title>A Logic-based Approach for Query Refinement in Ontology-based Information Retrieval Systems</article-title>
          .
          <source>In: Proceedings of the 16th IEEE Int. Conf. on Tools with Artifical Intelligence</source>
          . (
          <year>2004</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref21">
        <mixed-citation>
          21.
          <string-name>
            <surname>Carlos</surname>
            <given-names>A.</given-names>
          </string-name>
          <string-name>
            <surname>Hurtado</surname>
            ,
            <given-names>A.P.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Wood</surname>
          </string-name>
          , P.T.:
          <article-title>A Relaxed Approach to RDF Querying</article-title>
          . In: Proceedings of ISWC'
          <year>2006</year>
          . (
          <year>2006</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref22">
        <mixed-citation>
          22.
          <string-name>
            <given-names>N</given-names>
            <surname>Athanasis</surname>
          </string-name>
          ,
          <string-name>
            <given-names>V.C.</given-names>
            ,
            <surname>Kotzinos</surname>
          </string-name>
          ,
          <string-name>
            <surname>D.:</surname>
          </string-name>
          <article-title>Generating On the Fly Queries for the Semantic Web: The ICS-FORTH Graphical RQL Interface (GRQL)</article-title>
          .
          <source>In: Proceedings of ISWC'</source>
          <year>2004</year>
          . (
          <year>2004</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref23">
        <mixed-citation>
          23.
          <string-name>
            <surname>Kandogan</surname>
            ,
            <given-names>E.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Krishnamurthy</surname>
            ,
            <given-names>R.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Raghavan</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Vaithyanathan</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Zhu</surname>
          </string-name>
          , H.:
          <article-title>Avatar Semantic Search: A Database Approach to Information Retrieval</article-title>
          .
          <source>In: Proceedings of SIGMOD'06</source>
          , New York, NY, USA, ACM Press (
          <year>2006</year>
          )
          <fpage>790</fpage>
          -
          <lpage>792</lpage>
        </mixed-citation>
      </ref>
      <ref id="ref24">
        <mixed-citation>
          24.
          <string-name>
            <surname>Zhou</surname>
            ,
            <given-names>Q.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Wang</surname>
            ,
            <given-names>C.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Xiong</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Wang</surname>
            ,
            <given-names>H.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Yu</surname>
            ,
            <given-names>Y.</given-names>
          </string-name>
          :
          <article-title>SPARK :Adapting keyword query to semantic search</article-title>
          . In: ISWC/ASWC. (
          <year>2007</year>
          )
          <fpage>694</fpage>
          -
          <lpage>707</lpage>
        </mixed-citation>
      </ref>
      <ref id="ref25">
        <mixed-citation>
          25.
          <string-name>
            <surname>Thanh</surname>
            <given-names>Tran</given-names>
          </string-name>
          , Haofen Wang ,
          <string-name>
            <given-names>Sebastian</given-names>
            <surname>Rudolph</surname>
          </string-name>
          , Philipp Cimiano ,
          <article-title>Top-k Exploration of Query Graph Candidates for Efficient Keyword Search on</article-title>
          RDF,
          <year>2008</year>
        </mixed-citation>
      </ref>
      <ref id="ref26">
        <mixed-citation>
          26.
          <string-name>
            <surname>Stojanovic</surname>
            ,
            <given-names>N.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Gonzalez</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Stojanovic</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          :
          <article-title>Ontologer: A System for Usage-Driven Management of Ontology-Based Information Portals</article-title>
          . In: Proceedings of L-CAP'
          <year>2003</year>
          . (
          <year>2003</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref27">
        <mixed-citation>
          27.
          <string-name>
            <surname>Anyanwu</surname>
            ,
            <given-names>K.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Maduko</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Sheth</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          :
          <article-title>SemRank: ranking complex relationship search results on the semantic web</article-title>
          .
          <source>In: Proceedings of WWW'</source>
          <year>2005</year>
          , New York, NY, USA, ACM Press (
          <year>2005</year>
          )
          <fpage>117</fpage>
          -
          <lpage>127</lpage>
        </mixed-citation>
      </ref>
      <ref id="ref28">
        <mixed-citation>
          28.
          <string-name>
            <surname>Li</surname>
            ,
            <given-names>Y.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Wang</surname>
            ,
            <given-names>Y.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Huang</surname>
            ,
            <given-names>X.</given-names>
          </string-name>
          :
          <article-title>A Relation-Based Search Engine in Semantic Web</article-title>
          .
          <source>Proceedings of IEEE Transactions on Knowledge and Data Engineering</source>
          <volume>19</volume>
          (
          <issue>2</issue>
          ) (
          <year>2007</year>
          )
          <fpage>273</fpage>
          -
          <lpage>282</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref29">
        <mixed-citation>
          29.
          <string-name>
            <surname>Toumouh</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          <string-name>
            <surname>Lehireche</surname>
            ,
            <given-names>D.</given-names>
          </string-name>
          <string-name>
            <surname>Widdows</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          <string-name>
            <surname>Malki</surname>
          </string-name>
          .
          <article-title>Adapting WordNet to the Medical Domain using Lexicosyntactic Patterns in the Ohsumed Corpus: 4th</article-title>
          <source>ACS/IEEE International Conference on Computer Systems and Applications (AICCSA-06)</source>
          , , Dubai/Sharjah, UAE.
          <year>2006</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref30">
        <mixed-citation>
          30.
          <string-name>
            <given-names>D.</given-names>
            <surname>Widdows</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Toumouh</surname>
          </string-name>
          ,
          <string-name>
            <given-names>B.</given-names>
            <surname>Dorow</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Lehireche</surname>
          </string-name>
          .
          <article-title>Ongoing Developments in Automatically Adapting Lexical Resources to the Biomedical Domain</article-title>
          ,
          <source>International Conference On Language Resources And Evaluation</source>
          , , Italy,
          <string-name>
            <surname>LREC</surname>
          </string-name>
          <year>2006</year>
          .
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>