Journées portes ouvertes sur la Faculté des Sciences Exactes JFSE 2017


   Constitution d’un lexique bilingue (Français,
       Arabe) à base d’un corpus parallèle
                                Abbaoui Houda, Tahri Soumia, Hoceini Youssef
                                     Département Mathématique et Informatique
                                 Faculté Sciences Exactes, Université Tahri Mohamed
                                                   Bechar, Algérie
                                                yhoceini@gmail.com

 Abstract—Ce travail s’inscrit dans le cadre du Traitement Automatique des Langues (TAL), plus précisément dans le
domaine de la Traduction Automatique. La traduction automatique en tant que tel a besoin des ressources linguistique
multilingue (lexique bilingue). L’utilité des corpus pour la lexicographie bilingue est mentionnée depuis certain temps et
les projets de dictionnaire ont fait appel à des corpus parallèle tel que (Oxforf-Hachette French Dictionnary).
L’extraction de ces lexiques bilingues faits à partir de corpus parallèle qui sont constitués de plusieurs volets
correspondant chacun à une version d’un même texte dans deux langues différentes ou plus. Cette entité textuelle est un
ensemble de versions électroniques de traductions et de leurs originaux respectifs, alignés au niveau des paragraphes,
phrases ou même des mots. Dans notre application nous avons choisit un corpus parallèle formé d’un bi texte composé
des arrêtés et décrets téléchargé à partir du site du ministère de l’enseignement supérieur et la recherché scientifique. La
méthodologie adoptée dans la phase d’alignement (phrase à phrase et mot à mot) est bien celle d’un model linguistique
qui repose sur l’ordre des mots dans les deux langues le français et l’arabe.

    Keywords—Traitement automatique des langues, traduction automatique, corpus parallèle, alignement, lexique
bilingue.


                                                            54