<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Entre TBX et Ontolex-Lemon : Quelles Nouvelles Perspectives en Terminologie ?</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Silvia Piccini</string-name>
          <email>silvia.piccini@ilc.cnr.it</email>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Federica Vezzani</string-name>
          <email>federica.vezzani@unipd.it</email>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>et Andrea Bellandi</string-name>
          <email>andrea.bellandi@ilc.cnr.it</email>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          ,
          <addr-line>56124 Pisa PI</addr-line>
          ,
          <country country="IT">Italia</country>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>Università degli Studi di Padova, Dipartimento di Studi Linguistici e letterari</institution>
          ,
          <addr-line>Via Elisabetta Vendramini, 13 35137 Padova PD</addr-line>
          ,
          <country country="IT">Italia</country>
        </aff>
      </contrib-group>
      <abstract>
        <p>Cet article porte sur une analyse contrastive multi-niveaux des technologies à la base de TBX et de Ontolex-lemon afin de modéliser les données terminologiques multilingues au sein de ressources terminologiques. 1. Résumé étendu Le développement de ressources terminologiques et leur maintenance optimale sont des activités laborieuses et chronophages qui nécessitent souvent d'investissements économiques substantiels. C'est la raison pour laquelle l'élaboration de normes pour la représentation et l'échange de données occupent une place essentielle dans le domaine de la terminologie. L'interopérabilité2 entre les formats terminologiques est assurée par l'adoption de la norme ISO 30042 : 2019 qui promeut l'adoption du format TermBase eXchange (TBX), à savoir une famille XML de formats d'échange terminologique basée sur le méta-modèle structurel hiérarchique Terminological Markup Framework (TMF) (ISO16642 : 2017). Au cours des dernières années, des solutions intéressantes ont été proposées afin de favoriser l'interopérabilité par le biais de technologies du Web Sémantique (WS) [2] et des principes promus par l'initiative des « données liées » (Linked data) [3, 5], qui permettent de partager et de réutiliser les données entre différentes applications et de les relier aux ressources disponibles sur le Web. Dans cette optique, le modèle Ontolex-Lemon (https://www.w3.org/2016/05/ontolex/) a été développé en s'imposant en tant que standard de facto pour la représentation des ressources linguistiques et terminologiques dans le WS. Les avantages offerts par ces technologies sont incontestables. Premièrement, elles assurent la trouvabilité, l'accessibilité, l'interopérabilité et la réutilisabilité des données de la recherche (de l'acronyme anglais FAIR) [31] conformément à la philosophie de la science ouverte et aux stratégies de recherche et d'innovation de la Commission européenne pour la période 2020-2024. Deuxièmement, le modèle de données RDF, à la base du WS, permet d'atteindre non seulement une interopérabilité syntaxique ̶ déjà garantie par la structure de données XML à la base de TBX ̶ mais également une interopérabilité sémantique, assurant ainsi un échange de données caractérisées par une sémantique désambigüisée et partagée. L'utilisation des technologies du WS signifie en effet représenter des données terminologiques sous forme de triplets RDF et structurer formellement la sémantique de ces données en ontologies au moyen</p>
      </abstract>
      <kwd-group>
        <kwd>1 Terminologie</kwd>
        <kwd>TermBase eXchange</kwd>
        <kwd>Ontolex-Lemon</kwd>
      </kwd-group>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>
        du langage Web Ontology Language (OWL). Ce dernier, basé sur un sous-ensemble de la logique du
premier ordre, rend les machines capables de comprendre et d'interpréter les données et d'effectuer des
inférences logiques, déduisant ainsi de nouveaux faits. Ainsi, de nombreuses solutions ont été proposées
dans la littérature afin de transformer une structure de données XML en une formalisation ontologique
plus expressive [
        <xref ref-type="bibr" rid="ref1 ref4 ref6">1, 4, 6</xref>
        ] permettant, de cette façon, de définir les relations hiérarchiques qui existent
entre deux ou plusieurs concepts, de préciser les propriétés des relations (transitivité, symétrie,
réflexivité, etc.) et les contraintes (ou axiomes) générales et formelles entre les concepts, les attributs et
les relations, et enfin d’élaborer des règles permettant de déduire de nouvelles connaissances [20]. Il
n'est donc pas surprenant que la terminologie ait commencé à s'intéresser à ces technologies, comme en
témoigne le nombre croissant de jeux de données ouverts et interconnectés publiés dans le cadre du
Web de données [26, 27] ou les études et les outils visant à transformer et à publier des terminologies
en tant que « données liées » [
        <xref ref-type="bibr" rid="ref10 ref13">10, 13</xref>
        ]. À cet égard, sont indicatives les solutions engagées en appui à la
Stratégie européenne d'interopérabilité (EIS) visant à transformer en RDF deux ressources d'intérêt
stratégique pour la Communauté européenne telles que IATE [29] et EuroVoc [
        <xref ref-type="bibr" rid="ref11">11</xref>
        ].
      </p>
      <p>
        Les avantages technologiques incontestés ont souvent constitué la force motrice vers le paradigme
des données liées comme en témoigne la croissance constante du soi-disant Linguistic Linked Open
Data Cloud (LLOD) [
        <xref ref-type="bibr" rid="ref8">8</xref>
        ]. Cependant, les avantages ne se limitent pas seulement à ces aspects. Cet article
vise à étudier les effets théoriques que l'adoption des technologies du WS et du paradigme des « données
liées » peut entraîner dans les études terminologiques en tant que pistes de réflexion qui, à notre avis,
n'ont pas encore été suffisamment explorées. Le format TBX reflète, en effet, la vision traditionnelle de
la terminologie qui remonte aux travaux d'Eugen Wüster [32, 33].
      </p>
      <p>
        Bien qu'une description précise et détaillée des aspects linguistiques d'un terme puisse être
accomplie au moyen de catégories de données spécifiques (ISO 12620 : 2019), le concept est
généralement vu comme une entité simple et universellement partagée selon une vision de la
réminiscence aristotélicienne (ταὐτά πᾶσι). Cette perspective, qui est à la base des principales bases de
données terminologiques mises en place autour des années 70/80 (i.e. EURODICAUTOM, IATE,
TERMIUM Plus, etc.), est très efficace pour les tâches de traduction. Par conséquent, il n'est pas
surprenant que les outils de TAO soient capables d'exporter et/ou d'importer des glossaires dans le
format TBX. Cependant, comme l'ont montré de nombreuses approches terminologiques [
        <xref ref-type="bibr" rid="ref12 ref16 ref7">12, 7, 19, 16,
28, 24</xref>
        ], le concept doit plutôt être vu comme une entité complexe et multiforme, à savoir une liste des
conditions nécessaires et suffisantes résultant de catégorisations qui peuvent varier intra- et
interlinguistiquement ainsi que diachroniquement.
      </p>
      <p>
        Comme les études variationnistes l'ont mis en évidence [
        <xref ref-type="bibr" rid="ref14 ref15 ref17">17, 18, 15, 14</xref>
        ] les langues peuvent se
focaliser sur le concept sous différents angles : certains traits peuvent se traduire en sens dans une
langue mais rester dans l'ombre dans une autre langue (tout en restant accessible à la pensée et à
l'expérience), donnant lieu à des phénomènes d'anisomorphisme. La variation peut également être
intralinguistique : au sein d'une même langue de spécialité, un concept peut se matérialiser en plusieurs
dénominations synonymes et dans chacune d'elles les caractéristiques du concept considérées comme
cognitivement plus saillantes se cristallisent et se transforment en sens lexical.
      </p>
      <p>Comme nous essaierons de le (de)montrer, l'utilisation des technologies du WS, telles que les
ontologies, devient fondamentale pour décrire la complexité à la fois du concept et du sens d'un terme
et ainsi faire comprendre aux chercheurs la dynamique qui se cache derrière les phénomènes de la
polysémie, de la synonymie, de l'anisomorphisme et de la variation diachronique.</p>
      <p>En d'autres termes, les technologies du WS sont particulièrement efficaces pour capturer et décrire
les concepts dits endocentriques [25]. Ces derniers ̶ à la différence des concepts exocentriques ancrés
dans une expérience partagée par des individus au-delà des frontières linguistiques particulières ̶
dépendent fortement du système de relations lexicales propre à une langue, et ne peuvent être
pleinement compris sans une description qui prend en compte le caractère complexe des concepts et la
dimension du sens du terme.</p>
      <p>Après une analyse contrastive multi-niveaux (syntaxe, sémantique, tâches, outils) des technologies
à la base de TBX et de Ontolex-lemon, des études de cas extraites à partir du domaine médical seront
illustrées. En particulier, nous examinerons des cas de variation diachronique de conceptualisation (par
exemple pour le concept d’“hystérie”), de variation socio-culturelle (le cas du terme “SIDA”) et de
variation interlinguistique liée à des aspects connotatifs (français “sein”/”mamelle” ~ italien
seno/mammella) qui peuvent influencer la perception des termes/concepts en perspective multilingue.
Enfin, pour favoriser une synergie profonde entre les ressources en TBX et les ressources en RDF, nous
proposerons un outil pour convertir automatiquement les ressources créées dans la version la plus
récente de TBX (de 2019) en RDF (et notamment en Ontolex-Lemon). À l'heure actuelle, le seul outil
existant TBXtoRDF créé par Cimiano et al. (2015) n'est compatible qu'avec une version désormais
obsolète de TBX (2008) et de Ontolex-Lemon. En ce sens, nous proposons donc un système qui prend
en charge toutes les spécificités de la nouvelle version de TBX datée de 2019 et les dernières
spécifications de Ontolex-Lemon.
2. Références
[18] J. Freixa Aymerich, S. Fernández Silva, M. T. Cabré Castellví, La multiplicité des chemins
dénominatifs, Meta, LIII(4) (2008) 730-747.
[19] F. Gaudin, Socioterminologie. Une approche sociolinguistique de la terminologie, Duculot,</p>
      <p>Bruxelles, 2003.
[20] Y. Gil, V. Ratnakar, A Comparison of (Semantic) Markup Languages, in: Proceedings of the
Fifteenth International FLAIRS Conference, Pensacola Beach, AAAI Press, Florida, 2002, pp.
413-418.
[21] ISO-12620, Management of terminology resources – Data category specifications. Standard,</p>
      <p>International Organization for Standardization, Geneva, CH, 2019.
[22] ISO-30042, Management of terminology resources – TermBase eXchange (TBX). Standard,</p>
      <p>International Organization for Standardization, Geneva, CH, 2019.
[23] ISO-16642, Computer applications in terminology – Terminological markup framework. Standard,</p>
      <p>International Organization for Standardization, Geneva, CH, 2017.
[24] M. C. L’Homme, Lexical semantics for Terminology. An Introduction, John Benjamins Publishing</p>
      <p>Company, Amsterdam/Philadelphia, 2020.
[25] M. Prandi, The building blocks of meaning: ideas for a philosophical grammar, John Benjamins</p>
      <p>Company, Amsterdam/ Philadelphia, 2004.
[26] M. Salvadores, et al., Bioportal as a dataset of linked biomedical ontologies and terminologies in</p>
      <p>RDF, Semantic Web Journal 4(3) (2013) 277-284.
[27] B. Smith, et al., The OBO Foundry: coordinated evolution of ontologies to support biomedical data
integration, Nature biotechnology 25(11) (2007) 12-51.
[28] R. Temmermann, Towards New Ways of Terminology Description: The
Sociocognitive</p>
      <p>Approach, John Benjamins Publishing, Amsterdam/Philadelphia, 2000.
[29] D. Vellutino, et al., Verso l’interoperabilità semantica di IATE. Studio preliminare sul lessico dei
Fondi strutturali e d’Investimento Europei (Fondi SIE), Diversité et identité culturelle en Europe
XIII (1) (2016) 187-204.
[30] P. Wegner, Interoperability, ACM Computing Surveys (CSUR) 28(1) (1996) 285-287.
[31] M. D. Wilkinson, et al., The FAIR Guiding Principles for scientific data management and
stewardship, Scientific data 3.1 (2016) 1-9.
[32] E. Wüster, The Machine Tool. An Interlingual dictionary of basic concepts, 1 ed., Technical Press,</p>
      <p>London, 1968.
[33] E. Wüster, Einführung in die allgemeine Terminologielehre und terminologische Lexikographie,
Springer, Wien, 1979.</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          [1]
          <string-name>
            <given-names>R. R.</given-names>
            <surname>Amorim</surname>
          </string-name>
          ,
          <string-name>
            <given-names>M.</given-names>
            <surname>Lama</surname>
          </string-name>
          ,
          <string-name>
            <given-names>E.</given-names>
            <surname>Sánchez</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Riera</surname>
          </string-name>
          ,
          <string-name>
            <given-names>X. A.</given-names>
            <surname>Vila</surname>
          </string-name>
          ,
          <article-title>A learning design ontology based on the IMS specification</article-title>
          ,
          <source>Journal of Educational Technology &amp; Society</source>
          <volume>9</volume>
          (
          <issue>1</issue>
          ) (
          <year>2006</year>
          )
          <fpage>38</fpage>
          -
          <lpage>57</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          [2]
          <string-name>
            <given-names>T.</given-names>
            <surname>Berners-Lee</surname>
          </string-name>
          ,
          <string-name>
            <given-names>J.</given-names>
            <surname>Hendler</surname>
          </string-name>
          ,
          <string-name>
            <surname>O. Lassila,</surname>
          </string-name>
          <article-title>The semantic web</article-title>
          ,
          <source>Scientific American</source>
          <volume>284</volume>
          (
          <issue>5</issue>
          ) (
          <year>2001</year>
          )
          <fpage>34</fpage>
          -
          <lpage>43</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          [3]
          <string-name>
            <given-names>T.</given-names>
            <surname>Berners-Lee</surname>
          </string-name>
          ,
          <article-title>Linked data-design issues</article-title>
          ,
          <year>2006</year>
          . URL: http://www.w3.org/DesignIssues/LinkedData.html.
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          [4]
          <string-name>
            <given-names>S.</given-names>
            <surname>Bischof</surname>
          </string-name>
          ,
          <string-name>
            <given-names>N.</given-names>
            <surname>Lopes</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Polleres</surname>
          </string-name>
          ,
          <article-title>Improve Efficiency of Mapping Data between XML and RDF with XSPARQL</article-title>
          ,
          <source>in: Proceedings of Web Reasoning and Rule Systems - Fifth International Conference, RR2011</source>
          , volume
          <volume>6902</volume>
          of Lecture Notes in Computer Science (LNCS), SpringerVerlag , Galway, Ireland,
          <year>August</year>
          ,
          <year>2011</year>
          , pp.
          <fpage>232</fpage>
          -
          <lpage>237</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          [5]
          <string-name>
            <surname>Ch</surname>
            . Bizer,
            <given-names>T.</given-names>
          </string-name>
          <string-name>
            <surname>Heath</surname>
            ,
            <given-names>T.</given-names>
          </string-name>
          <string-name>
            <surname>Berners-Lee</surname>
          </string-name>
          ,
          <article-title>Linked data: The story so far</article-title>
          , in: A.
          <string-name>
            <surname>Sheth</surname>
          </string-name>
          (Ed.),
          <article-title>Semantic services, interoperability and web applications: emerging concepts</article-title>
          , 1st ed.,
          <source>IGI Global</source>
          , Hershey, Pennsylvania,
          <year>2011</year>
          , pp.
          <fpage>205</fpage>
          -
          <lpage>227</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          [6]
          <string-name>
            <given-names>H.</given-names>
            <surname>Bohring</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S.</given-names>
            <surname>Auer</surname>
          </string-name>
          , Mapping XML to OWL Ontologies, in: Proceedings of Marktplatz Internet:
          <article-title>Von e-Learning bis e-Payment, 13</article-title>
          .
          <string-name>
            <surname>Leipziger</surname>
          </string-name>
          Informatik-Tage (
          <article-title>LIT</article-title>
          <year>2005</year>
          ),
          <article-title>Gesellschaft für Informatik e</article-title>
          . V.,
          <string-name>
            <surname>Bonn</surname>
          </string-name>
          ,
          <year>2015</year>
          , pp.
          <fpage>147</fpage>
          -
          <lpage>156</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          [7]
          <string-name>
            <surname>M.T.</surname>
          </string-name>
          Cabré-Castellvi,
          <article-title>Theories of Terminology. Their description, prescription and explanation</article-title>
          ,
          <source>Terminology</source>
          <volume>9</volume>
          (
          <issue>2</issue>
          ), (
          <year>2003</year>
          )
          <fpage>163</fpage>
          -
          <lpage>200</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          [8]
          <string-name>
            <surname>Ch. Chiarcos</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          <string-name>
            <surname>Nordhoff</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          <string-name>
            <surname>Hellmann</surname>
          </string-name>
          , Linked Data in Linguistics, Springer, Heidelberg,
          <year>2012</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          [9]
          <string-name>
            <surname>Ph. Cimiano</surname>
            , Ch. Chiarcos,
            <given-names>J.</given-names>
          </string-name>
          <string-name>
            <surname>McCrae</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          <string-name>
            <surname>Gracia</surname>
          </string-name>
          , Linguistic Linked Data, Springer International Publishing,
          <year>2000</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          [10]
          <string-name>
            <surname>Ph. Cimiano</surname>
          </string-name>
          , et al.,
          <article-title>Linked terminologies: applying linked data principles to terminological resources</article-title>
          ,
          <source>in: Proceedings of the eLex 2015 Conference</source>
          ,
          <year>2015</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          [11]
          <string-name>
            <given-names>D.</given-names>
            <surname>Dechandon</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Gerencsér</surname>
          </string-name>
          ,
          <string-name>
            <given-names>M. R.</given-names>
            <surname>Ruiz</surname>
          </string-name>
          , Terminology:
          <article-title>Towards a Systematic Integration of Semantics and Metadata, in: Translating and the Computer 41, Proceedings of AsLing (The International Association for Advancement in Language Technology)</article-title>
          ,
          <source>Editions Tradulex, Geneva</source>
          ,
          <year>2020</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          [12]
          <string-name>
            <given-names>M.</given-names>
            <surname>Diki-Kidiri</surname>
          </string-name>
          , Une approche culturelle de la terminologie,
          <source>Terminologies nouvelles 21</source>
          (
          <year>2000</year>
          )
          <fpage>27</fpage>
          -
          <lpage>41</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          [13]
          <string-name>
            <given-names>M.P.</given-names>
            <surname>Di Buono</surname>
          </string-name>
          , et al.,
          <article-title>Terme-a-llod: Simplifying the conversion and hosting of terminological resources as linked data</article-title>
          ,
          <source>in: Proceedings of the 7th Workshop on Linked Data in Linguistics (LDL2020)</source>
          ,
          <year>2020</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          [14]
          <string-name>
            <given-names>P.</given-names>
            <surname>Drouin</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Francoeur</surname>
          </string-name>
          ,
          <string-name>
            <given-names>J.</given-names>
            <surname>Humbley</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Picton</surname>
          </string-name>
          ,
          <source>Multiple Perspectives on Terminological Variation, Terminology and Lexicography Research and Practice</source>
          ,
          <volume>18</volume>
          ,
          <string-name>
            <surname>John</surname>
            <given-names>Benjamins</given-names>
          </string-name>
          , Amsterdam,
          <year>2017</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          [15]
          <string-name>
            <given-names>P.</given-names>
            <surname>Dury</surname>
          </string-name>
          ,
          <article-title>Que montre l'étude de la variation d'une terminologie dans le temps. Quelques pistes de réflexion appliquées au domaine médical</article-title>
          ,
          <source>Debate Terminológico</source>
          <volume>9</volume>
          (
          <year>2013</year>
          )
          <fpage>2</fpage>
          -
          <lpage>10</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref16">
        <mixed-citation>
          [16]
          <string-name>
            <given-names>P.</given-names>
            <surname>Faber</surname>
          </string-name>
          ,
          <article-title>A cognitive linguistics view of terminology and specialized language</article-title>
          ,
          <source>Series: Applications of Cognitive Linguistics [ACL] 20</source>
          , 1st ed., De Gruyter Mouton, Berlin, Boston,
          <year>2012</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref17">
        <mixed-citation>
          [17]
          <string-name>
            <given-names>J.</given-names>
            <surname>Freixa</surname>
          </string-name>
          ,
          <article-title>Causes of denominative variation in terminology: A typology proposal</article-title>
          ,
          <source>Terminology</source>
          <volume>12</volume>
          (
          <issue>1</issue>
          ) (
          <year>2006</year>
          )
          <fpage>51</fpage>
          -
          <lpage>77</lpage>
          .
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>