=Paper= {{Paper |id=Vol-1749/paper43 |storemode=property |title=La Modellazione Diacronica di Risorse Termino–Ontologiche nell'Ambito delle Digital Humanities: Esperimenti su Clavius (Diachronic Modeling of Terminological-Ontological Resources within Digital Humanities: Experiments on Clavius) |pdfUrl=https://ceur-ws.org/Vol-1749/paper43.pdf |volume=Vol-1749 |authors=Silvia Piccini,Andrea Bellandi,Giulia Benotto,Emiliano Giovannetti |dblpUrl=https://dblp.org/rec/conf/clic-it/PicciniBBG16 }} ==La Modellazione Diacronica di Risorse Termino–Ontologiche nell'Ambito delle Digital Humanities: Esperimenti su Clavius (Diachronic Modeling of Terminological-Ontological Resources within Digital Humanities: Experiments on Clavius) == https://ceur-ws.org/Vol-1749/paper43.pdf
La Modellazione Diacronica di Risorse Termino-Ontologiche nell’Ambito
           delle Digital Humanities: Esperimenti su Clavius

            Silvia Piccini, Andrea Bellandi, Giulia Benotto, Emiliano Giovannetti
                       Istituto di Linguistica Computazionale A. Zampolli
                                Via G. Moruzzi, 1 - CNR Pisa, Italy
                                 name.surname@ilc.cnr.it


                     Abstract                              In questi ultimi anni, ed in particolar modo
                                                        nell’ambito delle Digital Humanities, si è sotto-
    English.      In this work, we present              lineata l’importanza di operare con tecnologie che
    an experiment in the modeling of a                  siano alla base del Semantic Web e dei Linked
    diachronic termino-ontological resource             Open Data per garantire interoperabilità e riuso
    named CLAVIUS through both the N-ary                delle risorse all’interno della comunità scientifica
    relations model and the 4D-fluents ap-              (Ciotti, 2014).
    proach. Some of the salient differences of             In questa ottica, le ontologie - e l’OWL, il loro
    these two models are discussed. The over-           linguaggio di rappresentazione standard - giocano
    all objective of this research is to illustrate     un ruolo fondamentale. Tuttavia, il carattere fon-
    the main advantages and disadvantages in            damentalmente statico di questi ultimi e la neces-
    the adoption of a given model to build di-          sità di modellare aspetti di evoluzione temporale
    achronic resources.                                 sembrano a prima vista inconciliabili.
                                                           Le riflessioni che presentiamo in questo arti-
    Italiano.     In questo lavoro, si illus-           colo nascono dalle esperienze condotte in seno
    tra un esperimento di modellazione di               al Progetto Clavius on the Web1 . Tra gli obi-
    una risorsa termino-ontologica diacron-             ettivi del Progetto, infatti, vi è anche quello di
    ica (CLAVIUS) secondo due approcci,                 creare una risorsa termino-ontologica (RTO) che
    quello N-ario e quello dei 4D-fluents. Le           rappresenti l’evoluzione delle teorie matematico-
    differenze salienti dei due approcci ver-           astronomiche dall’antichità al XVI - XVII secolo,
    ranno presentate e discusse. L’obiettivo            così come viene descritta da Clavius nei suoi Eu-
    generale della ricerca qui introdotta è             clidis Elementorum Libri XV. Accessit XVI e In
    quello di mostrare i principali vantaggi e          sphaeram Ioannis de Sacro Bosco Commentarius.
    svantaggi che l’adozione di un determi-
    nato modello può comportare nella model-            2       Il Contesto
    lazione di risorse diacroniche.
                                                        Come sottolineato nell’Introduzione, il linguaggio
                                                        OWL (e la sua estensione OWL2) è lo standard
1   Introduzione                                        W3C per la creazione e condivisione di ontologie
                                                        nel Semantic Web.
Pànta rei è la celebre espressione attribuita da Pla-      In particolare, OWL DL implementa la log-
tone ad Eraclito. Tutto è sottoposto alla inesora-      ica descrittiva SHOIN (Dn ), che garantisce una
bile legge del mutamento: la realtà, le categorie       maggiore espressività rispetto a RDF e RDFS,
attraverso le quali la organizziamo e le parole che     senza compromettere la decidibilità e il meccan-
usiamo per parlare di essa.                             ismo inferenziale.
   Quali sono gli strumenti a disposizione                 Tuttavia, OWL è un linguaggio statico; in esso
dell’umanista digitale di oggi, che si trovi a          le proprietà e le relazioni tra entità sono fonda-
dover rappresentare in modo esplicito e formale         mentalmente binarie, espresse sotto forma di triple
tale evoluzione diacronica dei concetti e dei           . Tale restrizione sin-
termini in un determinato ambito, in modo               tattica rende più complessa la rappresentazione
che tale formalizzazione sia computabile ad un
                                                            1
calcolatore?                                                    http://claviusontheweb.it (ultimo accesso: 13/10/2016)
di entità temporali, caratterizzate da relazioni        nomici e matematici. La superclasse TERM
ternarie.                                               si articola, invece, in due sottoclassi ASTRO-
   Diversi approcci sono stati proposti in let-         NOMICAL TERM e MATHEMATICAL TERM.
teratura per superare tale limite e rappresentare       Quest’ultima sussume le classi OWL disgiunte
l’evoluzione diacronica dei concetti (Krieger,          LATIN TERM e GREEK TERM, di cui i termini
2014; Welty et al., 2006). Tra questi vi sono:          latini e greci costituiscono le istanze. Nella risorsa
i) il versioning, che consiste nel creare una ver-      la parte concettuale è espressa in inglese mentre
sione differente dell’ontologia, una per ciascun        la parte terminologica è costituita dai termini la-
istante temporale (Grandi and Scalas, 2009), ii)        tini, legati ai concetti che essi evocano attraverso
l’estensione delle triple RDF con argomenti sup-        la relazione denotes e la sua inversa isDenotedBy.
plementari temporali (Krieger, 2012), iii) la           L’ontologia è attualmente composta da 106 classi
reficazione, che trasforma le proprietà in classi       organizzate in quattro livelli gerarchici, un in-
(Manola and Miller, 2004), iv) il modello N-            sieme di 10 Data Properties e 18 Object proper-
ario (Noy and Rector, 2006), v) il modello per-         ties, che permettono di dare una rappresentazione
durantista o dei 4D-fluents (Welty et al., 2006),       precisa dei concetti e termini. Le relazioni sono
vi) la codifica dell’estensione temporale attraverso    suddivise in: relazioni lessicali, paradigmatiche
nuove proprietà sintetiche (Gangemi, 2011). Allo        tra i termini (iperonimia, iponimia, meronimia,
stato dell’arte, i due principali approcci adottati     olonimia, sinonimia e antonimia); relazioni inter-
nella modellazione di risorse diacroniche (solita-      livello tra termini e concetti; relazioni concettuali,
mente ontologie) sono il modello delle relazioni        molte delle quali sono state introdotte per dare una
N-arie e il modello dei perduranti. Nel primo,          definizione più precisa del dominio matematico-
per ogni relazione temporale viene introdotto           astronomico (Piccini et al., 2016). Per quanto
un nuovo oggetto, istanza della classe EVENT.           concerne la modellazione degli aspetti temporali
La durata della relazione coincide con la durata        è stata importata l’ontologia OWL-Time, che si
dell’evento. In questo modello, pertanto, una pro-      basa sulle relazioni binarie tra intervalli introdotte
prietà n-aria è rappresentata come una classe, le       in (Allen and Ferguson, 1997) ed è stata integrata
cui istanze corrispondono alle istanze della pro-       una serie di regole Semantic Web Rule Language
prietà. Nel modello 4D-fluents, invece, le entità       (SWRL), elaborate in (Batsakis et al., 2016). In
coinvolte in relazioni temporali sono rappresentate     questo modo possono essere rappresentate e trat-
da oggetti 4-dimensionali detti timeslices. Ogni        tate dai motori inferenziali sia informazioni tem-
timeslice rappresenta una sorta di “fotogramma”,        porali quantitative (informazioni temporali pre-
in cui l’entità ad esso riferita ha natura immutabile   cise), sia informazioni temporali qualitative (delle
(perdurante) in quello specifico istante o intervallo   quali, cioè, non si possono specificare con esat-
di tempo.                                               tezza l’istante iniziale e finale). Queste ultime, in
                                                        particolare, sono molto frequenti nel testo di Clav-
3   La risorsa CLAVIUS                                  ius, e più in generale, nella letteratura, dove non
                                                        è sempre possibile definire con esattezza la data
Clavius costituisce una RTO. In accordo con le più      di inzio e di fine nella quale si è verificato o sus-
recenti acquisizioni teoriche (Roche, 2007; Tem-        siste un determinato fatto2 . Le relazioni tra le en-
merman et al., 2005), in essa infatti sono formal-      tità ontologiche sono state temporalizzate in base
izzate come indipendenti due componenti stret-          alla loro validità nel tempo, seguendo i due ap-
tamente legate tra di loro: la componente ter-          procci, quello N-ario e quello perdurantista, come
minologica nella quale vengono strutturati i ter-       descritto nella Sezione 2.
mini presenti in un testo e la componente on-
tologica attraverso la quale vengono formaliz-          4       Comparazione della risorsa nei due
zati i concetti evocati da quei termini. Il livello             modelli
più alto dell’ontologia è rappresentato così dalle
due classi OWL disgiunte CONCEPT e TERM.                In questa Sezione sono definiti i criteri di com-
La superclasse CONCEPT sussume due sotto-               parazione dei due modelli e vengono presentati
classi, ASTRONOMICAL CONCEPT e MATH-                        2
                                                            La rappresentazione di tali informazioni temporali è in-
EMATICAL CONCEPT, che a loro volta sus-                 dipendente dai modelli ivi trattati e non verrà pertanto dis-
sumono rispettivamente tutti i concetti astro-          cussa.
Figure 1: I due modelli a confronto. In rosso i nuovi oggetti da creare nei diversi modelli. Le linee
tratteggiate rappresentano la relazione di instance of.


i vantaggi e le criticità di entrambi nella loro        di rappresentazione di questi statements.
applicazione alla risorsa Clavius in OWL. Un               Le classi, le proprietà e le istanze in rosso, rap-
primo criterio di comparazione riguarda il nu-          presentano le entità ontologiche che debbono es-
mero di assiomi logici necessari alla rappresen-        sere introdotte per tradurre in linguaggio formale
tazione delle relazioni temporali. Come illus-          tali statements. Si nota come il modello dei perdu-
trato in precedenza, infatti, entrambi i modelli        ranti sia soggetto ad una maggiore proliferazione
richiedono l’introduzione di nuove entità tempo-        delle entità: accanto alla classe TIMESLICE sono
rali (eventi o timeslice). A titolo d’esempio, pre-     stati introdotti una nuova Object property (has-
sentiamo il mutamento nel tempo del concetto de-        TimeSlice), istanziata sei volte, e sei nuovi indi-
notato dal termine primum mobile. Il numero             vidui della classe TIMESLICE (le parti temporali
delle sfere ed il loro relativo ordine costituisce un   degli individui coinvolti nella temporalizzazione).
problema ampiamente dibattuto nell’astronomia              Il modello N-ario, d’altro canto, risulta più
del Seicento. Secondo la visione aristotelica del       snello, richiedendo solo la creazione di tre eventi,
kosmos il movimento dei sette cieli attorno alla        uno per ogni statement. Tuttavia, tale model-
terra era dovuto ad una sfera, la più esterna, detta    lazione modifica, da un punto di vista intuitivo,
primum mobile. Mano a mano che nei secoli si            la semantica della relazione denotes, spezzando e
vennero a scoprire maggiori dettagli sul moto dei       duplicando la proprietà per legare l’evento ai due
pianeti, divenne necessario aggiungere altre sfere:     individui coinvolti nella temporalizzazione. In en-
così con Tolomeo il loro numero salì a 9, nelle tav-    trambi i modelli il dominio e il codominio di una
ole alfonsine a 10, quindi a 11 ed infine a 12 con      proprietà temporale vengono modificati: nel mod-
Magini. Alla introduzione di una ulteriore sfera        ello N-ario si aggiunge ad essi la classe EVENT,
sul piano concettuale corrisponde un mutamento          nel modello dei perduranti si sostituiscono le classi
nel codominio della relazione interlivello denotes      originarie con la classe TIMESLICE. Precisiamo
il cui dominio è rappresentato dal termine primum       che la nostra analisi è limitata ai modelli delle
mobile: i) primum_mobile denotes eighth_sphere          relazioni da temporalizzare, ed è quindi indipen-
(dal 300 a.C. al 152 d.C.), ii) primum_mobile de-       dente sia rispetto al modo in cui gli intervalli e gli
notes ninth_sphere (dal 152 d.C. al 1252 d.C.), iii)    istanti temporali sono rappresentati (OWL-TIME
primum_mobile denotes tenth_sphere (dal 1252            in Figura 1), sia rispetto a come i costrutti e le re-
d.C. al 1589 d.C.). La Figura 1 mostra un esempio       gole di OWL (“SWRL rules” in Figura 1) vengono
                                      Table 1: Confronto tra i modelli
                                                  modello n-ario                 modello 4D-fluents
    Metriche dell’ontologia
    numero di classi                                     106                            106
    numero di individui                                  244                            265
    numero di istanze di object property                 117                            159
    Temporalizzazione del predicato
    pred : X → Y                                   predn−ary :                       predperd :
                                              X t Event → Y t Event           T imeSlice → T imeSlice
    Interrogazione
    query SPARQL: lunghezza del path                         2                            3
    query SPARQL: numero di variabili                        2                            3
    Tools
    Availability                                         yes                            no∗


combinati per fornire una procedura di reasoning         creazione di RTO diacroniche senza richiedere
solida e completa. Per una trattazione accurata          la conoscenza dei modelli matematici sottostanti.
di queste problematiche rimandiamo a (Batsakis           Per quanto riguarda il modello N-ario è disponi-
et al., 2016). In relazione ad una maggiore pro-         bile il plug-in di Protégé CHRONOS-ED (Preven-
liferazione di entità, inoltre, l’interrogazione della   tis et al., 2012). Il plug-in per il modello 4D-
risorsa può diventare più complessa e quindi mag-        fluents, al contrario, risulta ad oggi non funzio-
giormente prona ad errori. Per quanto riguarda           nante nelle ultime versioni di Protégé (vedi aster-
l’interrogazione, abbiamo considerato una sem-           isco in Tabella 1). I risulati dell’analisi compara-
plice query di interrogazione della risorsa per          tiva sono riassunti nella Tabella 1.
conoscere quali sono i concetti che il termine pri-
mum_mobile ha denotato nel tempo. Le query               5       Discussione e lavori futuri
sono state implementate tramite il linguaggio di         La modellazione della risorsa diacronica termino-
interrogazione SPARQL nei due modelli. Per il            ontologica CLAVIUS attraverso il modello a re-
modello N-ario abbiamo:                                  lazioni N-arie e quello 4D-fluents ha consentito
SELECT ?concept
WHERE { n-ary:primum_mobile a n-ary:TERM .
                                                         di valutare, empiricamente, quelle che sono le
n-ary:primum_mobile n-ary:denotes ?event .               differenze salienti tra i due paradigmi temporali.
?event a n-ary:EVENT .                                   Per quanto riguarda l’aspetto di authoring, di pri-
?event n-ary:denotes ?concept }
                                                         mario interesse in questo lavoro in quanto fun-
Per il modello dei perduranti abbiamo:                   zionale alla necessità di un umanista digitale nella
SELECT ?concept                                          costruzione (tipicamente manuale) di una risorsa
WHERE { ?ts@t1 4d:denotes ?ts@t2 .                       diacronica, i risultati hanno evidenziato come, ad
?ts@t1 a 4d:TIMESLICE .
?ts@t2 a 4d:TIMESLICE .
                                                         oggi, l’approccio a relazioni N-arie risulti il più
4d:primum_mobile a 4d:TERM .                             vantaggioso, in termini sia di numero di entità on-
4d:primum_mobile 4d:hasTimeSlice ?ts@t1 .                tologiche coinvolte, sia di complessità delle query
?concept 4d:hasTimeSlice ?ts@t2 }
                                                         SPARQL sia di disponibilità di strumenti di sup-
                                                         porto. Si intende approfondire questa ricerca pren-
   Da una analisi dei due codici si evince che per
                                                         dendo in considerazione gli aspetti che, natural-
interrogare il secondo modello occorre un numero
                                                         mente, seguono quelli più essenziali di formal-
maggiore di variabili nella query e che il path
                                                         izzazione della terminologia e della conoscenza.
dell’interrogazione del grafo è più lungo e coin-
                                                         In primis, verrà studiato l’impatto determinato
volge un maggior numero di entità ontologiche.
                                                         dall’adozione di un certo modello sui meccan-
Questo implica che, in termini di scalabilità ed
                                                         ismi di reasoning, e quindi, sulla possibilità da
efficienza nel processo di interrogazione, il mod-
                                                         parte di un motore inferenziale di derivare nuova
ello N-ario potrebbe risultare migliore. Come ul-
                                                         conoscenza a partire da quella rappresentata es-
timo criterio abbiamo considerato la disponibil-
                                                         plicitamente nella risorsa.
ità di strumenti che supportino l’umanista nella
References                                                Evren Sirin, Bijan Parsia, Bernardo C. Grau, Aditya
                                                            Kalyanpur, Yarden Katz 2007. Pellet: A practical
James F. Allen and George Ferguson. 1997 Actions            owl-dl reasoner. Web Semantics: science, services
  and Events in Interval Temporal Logic. In: Spa-           and agents on the World Wide Web, 5.2 51-53.
  tial and Temporal Reasoning. O. Stock, ed., Kluwer,
  Dordrecht, Netherlands, pp. 205-245.                    Rob Shearer, Boris Motik, and Ian Horrocks.
                                                            2008 HermiT: A Highly-Efficient OWL Reasoner.
Sotiris Batsakis, Euripides Petrakis, Ilias Tachmazidis     OWLED, Vol. 432.
  and Grigoris Antoniou 2016. Temporal Representa-
  tion and Reasoning in OWL 2. Semantic Web jour-         Rita Temmerman, Koen Kerremans, and Veerle Van-
  nal, ISSN 1570-0844.                                       dervoort     2005    La termontographie en con-
                                                             texte(s). In Blampain, D., Thoiron, P., Van Campen-
Fabio Ciotti. 2014 Digital Literary and Cultural Stud-
                                                             houdt, M. (eds). Mots, Termes et Contextes. Actes
  ies: State of the Art and Perspectives. Between, vol.
                                                             des septièmes Journées scientifiques du réseau de
  4, no. 8.
                                                             chercheurs Lexicologie Terminologie Traduction.
Noy N. Fridman, William Grosso, and Mark A. Musen            Bruxelles, 429- 439.
  2000. Knowledge-Acquisition Interfaces for Do-
                                                          Chris Welty, Richard Fikes, and Selene Makarios 2006
  main Experts: An Empirical Evaluation of Protege-
                                                            A reusable ontology for fluents in OWL. Proceed-
  2000. SEKE2000 Proceedings. Chicago.
                                                            ings of the 4th International Conference on Formal
Aldo Gangemi. 2011 SuperDuper schema: an                    Ontology in Information Systems (FOIS), Vol. 150.
  OWL2+RIF DnS pattern. KCAP 2011 Deep Knowl-               pp. 226–336
  edge Representation Challenge Workshop.
Fabio Grandi, and Maria Rita Scalas. 2009 The
  Valid Ontology: A simple OWL temporal version-
  ing framework. Advances in Semantic Process-
  ing, SEMAPRO’09. Third International Conference
  IEEE, 2009. pp. 98-102.
Hans U. Krieger. 2014 A detailed comparison of seven
  approaches for the annotation of time-dependent
  factual knowledge in RDF and OWL. Proceedings
  10th Joint ISO-ACL SIGSEM Workshop on Inter-
  operable Semantic Annotation, p. 1.
Hans U. Krieger. 2012 A temporal extension of the
  Hayester Horst entailment rules and an alternative
  to W3C’s n-ary relations. Proceedings of the 7th
  International Conference on Formal Ontology in In-
  formation Systems (FOIS), pp. 323–336.
Frank Manola and Eric Miller. 2004 RDF primer.
  Technical report, W3C.
Natasha Noy and Alan Rector. 2006 Defining N-
  ary Relations on the Semantic Web. W3C Work-
  ing Group Note 12, https://www.w3.org/TR/swbp-
  n-aryRelations/
Piccini, S., Bellandi, A., and Benotto, G. 2016
   Formalizing and Querying a Diachronic Termino-
   Ontological Resource: the CLAVIUS Case Study.
   Proceedings of From Digitization to Knowledge
   2016 workshop (D2K), July 11, 2016, Krakow
   (Poland).
Preventis A., Marki P., Petrakis E.G.M., Batsakis S.
  2016 Chronos: A Tool for Handling Temporal On-
  tologies in Protégé. Proceedings of the 24th Inter-
  national Conference on Tools with Artificial Intelli-
  gence, Athens, Greece.
Christophe Roche. 2007 Le terme et le concept: fonde-
  ments d’une ontoterminologie. Actes de la première
  conférence TOTh, pp.1–22, Annecy.