=Paper=
{{Paper
|id=Vol-1749/paper43
|storemode=property
|title=La Modellazione Diacronica di Risorse Termino–Ontologiche nell'Ambito delle Digital Humanities: Esperimenti su Clavius
(Diachronic Modeling of Terminological-Ontological Resources within Digital Humanities: Experiments on Clavius)
|pdfUrl=https://ceur-ws.org/Vol-1749/paper43.pdf
|volume=Vol-1749
|authors=Silvia Piccini,Andrea Bellandi,Giulia Benotto,Emiliano Giovannetti
|dblpUrl=https://dblp.org/rec/conf/clic-it/PicciniBBG16
}}
==La Modellazione Diacronica di Risorse Termino–Ontologiche nell'Ambito delle Digital Humanities: Esperimenti su Clavius
(Diachronic Modeling of Terminological-Ontological Resources within Digital Humanities: Experiments on Clavius)
==
La Modellazione Diacronica di Risorse Termino-Ontologiche nell’Ambito delle Digital Humanities: Esperimenti su Clavius Silvia Piccini, Andrea Bellandi, Giulia Benotto, Emiliano Giovannetti Istituto di Linguistica Computazionale A. Zampolli Via G. Moruzzi, 1 - CNR Pisa, Italy name.surname@ilc.cnr.it Abstract In questi ultimi anni, ed in particolar modo nell’ambito delle Digital Humanities, si è sotto- English. In this work, we present lineata l’importanza di operare con tecnologie che an experiment in the modeling of a siano alla base del Semantic Web e dei Linked diachronic termino-ontological resource Open Data per garantire interoperabilità e riuso named CLAVIUS through both the N-ary delle risorse all’interno della comunità scientifica relations model and the 4D-fluents ap- (Ciotti, 2014). proach. Some of the salient differences of In questa ottica, le ontologie - e l’OWL, il loro these two models are discussed. The over- linguaggio di rappresentazione standard - giocano all objective of this research is to illustrate un ruolo fondamentale. Tuttavia, il carattere fon- the main advantages and disadvantages in damentalmente statico di questi ultimi e la neces- the adoption of a given model to build di- sità di modellare aspetti di evoluzione temporale achronic resources. sembrano a prima vista inconciliabili. Le riflessioni che presentiamo in questo arti- Italiano. In questo lavoro, si illus- colo nascono dalle esperienze condotte in seno tra un esperimento di modellazione di al Progetto Clavius on the Web1 . Tra gli obi- una risorsa termino-ontologica diacron- ettivi del Progetto, infatti, vi è anche quello di ica (CLAVIUS) secondo due approcci, creare una risorsa termino-ontologica (RTO) che quello N-ario e quello dei 4D-fluents. Le rappresenti l’evoluzione delle teorie matematico- differenze salienti dei due approcci ver- astronomiche dall’antichità al XVI - XVII secolo, ranno presentate e discusse. L’obiettivo così come viene descritta da Clavius nei suoi Eu- generale della ricerca qui introdotta è clidis Elementorum Libri XV. Accessit XVI e In quello di mostrare i principali vantaggi e sphaeram Ioannis de Sacro Bosco Commentarius. svantaggi che l’adozione di un determi- nato modello può comportare nella model- 2 Il Contesto lazione di risorse diacroniche. Come sottolineato nell’Introduzione, il linguaggio OWL (e la sua estensione OWL2) è lo standard 1 Introduzione W3C per la creazione e condivisione di ontologie nel Semantic Web. Pànta rei è la celebre espressione attribuita da Pla- In particolare, OWL DL implementa la log- tone ad Eraclito. Tutto è sottoposto alla inesora- ica descrittiva SHOIN (Dn ), che garantisce una bile legge del mutamento: la realtà, le categorie maggiore espressività rispetto a RDF e RDFS, attraverso le quali la organizziamo e le parole che senza compromettere la decidibilità e il meccan- usiamo per parlare di essa. ismo inferenziale. Quali sono gli strumenti a disposizione Tuttavia, OWL è un linguaggio statico; in esso dell’umanista digitale di oggi, che si trovi a le proprietà e le relazioni tra entità sono fonda- dover rappresentare in modo esplicito e formale mentalmente binarie, espresse sotto forma di triple tale evoluzione diacronica dei concetti e dei. Tale restrizione sin- termini in un determinato ambito, in modo tattica rende più complessa la rappresentazione che tale formalizzazione sia computabile ad un 1 calcolatore? http://claviusontheweb.it (ultimo accesso: 13/10/2016) di entità temporali, caratterizzate da relazioni nomici e matematici. La superclasse TERM ternarie. si articola, invece, in due sottoclassi ASTRO- Diversi approcci sono stati proposti in let- NOMICAL TERM e MATHEMATICAL TERM. teratura per superare tale limite e rappresentare Quest’ultima sussume le classi OWL disgiunte l’evoluzione diacronica dei concetti (Krieger, LATIN TERM e GREEK TERM, di cui i termini 2014; Welty et al., 2006). Tra questi vi sono: latini e greci costituiscono le istanze. Nella risorsa i) il versioning, che consiste nel creare una ver- la parte concettuale è espressa in inglese mentre sione differente dell’ontologia, una per ciascun la parte terminologica è costituita dai termini la- istante temporale (Grandi and Scalas, 2009), ii) tini, legati ai concetti che essi evocano attraverso l’estensione delle triple RDF con argomenti sup- la relazione denotes e la sua inversa isDenotedBy. plementari temporali (Krieger, 2012), iii) la L’ontologia è attualmente composta da 106 classi reficazione, che trasforma le proprietà in classi organizzate in quattro livelli gerarchici, un in- (Manola and Miller, 2004), iv) il modello N- sieme di 10 Data Properties e 18 Object proper- ario (Noy and Rector, 2006), v) il modello per- ties, che permettono di dare una rappresentazione durantista o dei 4D-fluents (Welty et al., 2006), precisa dei concetti e termini. Le relazioni sono vi) la codifica dell’estensione temporale attraverso suddivise in: relazioni lessicali, paradigmatiche nuove proprietà sintetiche (Gangemi, 2011). Allo tra i termini (iperonimia, iponimia, meronimia, stato dell’arte, i due principali approcci adottati olonimia, sinonimia e antonimia); relazioni inter- nella modellazione di risorse diacroniche (solita- livello tra termini e concetti; relazioni concettuali, mente ontologie) sono il modello delle relazioni molte delle quali sono state introdotte per dare una N-arie e il modello dei perduranti. Nel primo, definizione più precisa del dominio matematico- per ogni relazione temporale viene introdotto astronomico (Piccini et al., 2016). Per quanto un nuovo oggetto, istanza della classe EVENT. concerne la modellazione degli aspetti temporali La durata della relazione coincide con la durata è stata importata l’ontologia OWL-Time, che si dell’evento. In questo modello, pertanto, una pro- basa sulle relazioni binarie tra intervalli introdotte prietà n-aria è rappresentata come una classe, le in (Allen and Ferguson, 1997) ed è stata integrata cui istanze corrispondono alle istanze della pro- una serie di regole Semantic Web Rule Language prietà. Nel modello 4D-fluents, invece, le entità (SWRL), elaborate in (Batsakis et al., 2016). In coinvolte in relazioni temporali sono rappresentate questo modo possono essere rappresentate e trat- da oggetti 4-dimensionali detti timeslices. Ogni tate dai motori inferenziali sia informazioni tem- timeslice rappresenta una sorta di “fotogramma”, porali quantitative (informazioni temporali pre- in cui l’entità ad esso riferita ha natura immutabile cise), sia informazioni temporali qualitative (delle (perdurante) in quello specifico istante o intervallo quali, cioè, non si possono specificare con esat- di tempo. tezza l’istante iniziale e finale). Queste ultime, in particolare, sono molto frequenti nel testo di Clav- 3 La risorsa CLAVIUS ius, e più in generale, nella letteratura, dove non è sempre possibile definire con esattezza la data Clavius costituisce una RTO. In accordo con le più di inzio e di fine nella quale si è verificato o sus- recenti acquisizioni teoriche (Roche, 2007; Tem- siste un determinato fatto2 . Le relazioni tra le en- merman et al., 2005), in essa infatti sono formal- tità ontologiche sono state temporalizzate in base izzate come indipendenti due componenti stret- alla loro validità nel tempo, seguendo i due ap- tamente legate tra di loro: la componente ter- procci, quello N-ario e quello perdurantista, come minologica nella quale vengono strutturati i ter- descritto nella Sezione 2. mini presenti in un testo e la componente on- tologica attraverso la quale vengono formaliz- 4 Comparazione della risorsa nei due zati i concetti evocati da quei termini. Il livello modelli più alto dell’ontologia è rappresentato così dalle due classi OWL disgiunte CONCEPT e TERM. In questa Sezione sono definiti i criteri di com- La superclasse CONCEPT sussume due sotto- parazione dei due modelli e vengono presentati classi, ASTRONOMICAL CONCEPT e MATH- 2 La rappresentazione di tali informazioni temporali è in- EMATICAL CONCEPT, che a loro volta sus- dipendente dai modelli ivi trattati e non verrà pertanto dis- sumono rispettivamente tutti i concetti astro- cussa. Figure 1: I due modelli a confronto. In rosso i nuovi oggetti da creare nei diversi modelli. Le linee tratteggiate rappresentano la relazione di instance of. i vantaggi e le criticità di entrambi nella loro di rappresentazione di questi statements. applicazione alla risorsa Clavius in OWL. Un Le classi, le proprietà e le istanze in rosso, rap- primo criterio di comparazione riguarda il nu- presentano le entità ontologiche che debbono es- mero di assiomi logici necessari alla rappresen- sere introdotte per tradurre in linguaggio formale tazione delle relazioni temporali. Come illus- tali statements. Si nota come il modello dei perdu- trato in precedenza, infatti, entrambi i modelli ranti sia soggetto ad una maggiore proliferazione richiedono l’introduzione di nuove entità tempo- delle entità: accanto alla classe TIMESLICE sono rali (eventi o timeslice). A titolo d’esempio, pre- stati introdotti una nuova Object property (has- sentiamo il mutamento nel tempo del concetto de- TimeSlice), istanziata sei volte, e sei nuovi indi- notato dal termine primum mobile. Il numero vidui della classe TIMESLICE (le parti temporali delle sfere ed il loro relativo ordine costituisce un degli individui coinvolti nella temporalizzazione). problema ampiamente dibattuto nell’astronomia Il modello N-ario, d’altro canto, risulta più del Seicento. Secondo la visione aristotelica del snello, richiedendo solo la creazione di tre eventi, kosmos il movimento dei sette cieli attorno alla uno per ogni statement. Tuttavia, tale model- terra era dovuto ad una sfera, la più esterna, detta lazione modifica, da un punto di vista intuitivo, primum mobile. Mano a mano che nei secoli si la semantica della relazione denotes, spezzando e vennero a scoprire maggiori dettagli sul moto dei duplicando la proprietà per legare l’evento ai due pianeti, divenne necessario aggiungere altre sfere: individui coinvolti nella temporalizzazione. In en- così con Tolomeo il loro numero salì a 9, nelle tav- trambi i modelli il dominio e il codominio di una ole alfonsine a 10, quindi a 11 ed infine a 12 con proprietà temporale vengono modificati: nel mod- Magini. Alla introduzione di una ulteriore sfera ello N-ario si aggiunge ad essi la classe EVENT, sul piano concettuale corrisponde un mutamento nel modello dei perduranti si sostituiscono le classi nel codominio della relazione interlivello denotes originarie con la classe TIMESLICE. Precisiamo il cui dominio è rappresentato dal termine primum che la nostra analisi è limitata ai modelli delle mobile: i) primum_mobile denotes eighth_sphere relazioni da temporalizzare, ed è quindi indipen- (dal 300 a.C. al 152 d.C.), ii) primum_mobile de- dente sia rispetto al modo in cui gli intervalli e gli notes ninth_sphere (dal 152 d.C. al 1252 d.C.), iii) istanti temporali sono rappresentati (OWL-TIME primum_mobile denotes tenth_sphere (dal 1252 in Figura 1), sia rispetto a come i costrutti e le re- d.C. al 1589 d.C.). La Figura 1 mostra un esempio gole di OWL (“SWRL rules” in Figura 1) vengono Table 1: Confronto tra i modelli modello n-ario modello 4D-fluents Metriche dell’ontologia numero di classi 106 106 numero di individui 244 265 numero di istanze di object property 117 159 Temporalizzazione del predicato pred : X → Y predn−ary : predperd : X t Event → Y t Event T imeSlice → T imeSlice Interrogazione query SPARQL: lunghezza del path 2 3 query SPARQL: numero di variabili 2 3 Tools Availability yes no∗ combinati per fornire una procedura di reasoning creazione di RTO diacroniche senza richiedere solida e completa. Per una trattazione accurata la conoscenza dei modelli matematici sottostanti. di queste problematiche rimandiamo a (Batsakis Per quanto riguarda il modello N-ario è disponi- et al., 2016). In relazione ad una maggiore pro- bile il plug-in di Protégé CHRONOS-ED (Preven- liferazione di entità, inoltre, l’interrogazione della tis et al., 2012). Il plug-in per il modello 4D- risorsa può diventare più complessa e quindi mag- fluents, al contrario, risulta ad oggi non funzio- giormente prona ad errori. Per quanto riguarda nante nelle ultime versioni di Protégé (vedi aster- l’interrogazione, abbiamo considerato una sem- isco in Tabella 1). I risulati dell’analisi compara- plice query di interrogazione della risorsa per tiva sono riassunti nella Tabella 1. conoscere quali sono i concetti che il termine pri- mum_mobile ha denotato nel tempo. Le query 5 Discussione e lavori futuri sono state implementate tramite il linguaggio di La modellazione della risorsa diacronica termino- interrogazione SPARQL nei due modelli. Per il ontologica CLAVIUS attraverso il modello a re- modello N-ario abbiamo: lazioni N-arie e quello 4D-fluents ha consentito SELECT ?concept WHERE { n-ary:primum_mobile a n-ary:TERM . di valutare, empiricamente, quelle che sono le n-ary:primum_mobile n-ary:denotes ?event . differenze salienti tra i due paradigmi temporali. ?event a n-ary:EVENT . Per quanto riguarda l’aspetto di authoring, di pri- ?event n-ary:denotes ?concept } mario interesse in questo lavoro in quanto fun- Per il modello dei perduranti abbiamo: zionale alla necessità di un umanista digitale nella SELECT ?concept costruzione (tipicamente manuale) di una risorsa WHERE { ?ts@t1 4d:denotes ?ts@t2 . diacronica, i risultati hanno evidenziato come, ad ?ts@t1 a 4d:TIMESLICE . ?ts@t2 a 4d:TIMESLICE . oggi, l’approccio a relazioni N-arie risulti il più 4d:primum_mobile a 4d:TERM . vantaggioso, in termini sia di numero di entità on- 4d:primum_mobile 4d:hasTimeSlice ?ts@t1 . tologiche coinvolte, sia di complessità delle query ?concept 4d:hasTimeSlice ?ts@t2 } SPARQL sia di disponibilità di strumenti di sup- porto. Si intende approfondire questa ricerca pren- Da una analisi dei due codici si evince che per dendo in considerazione gli aspetti che, natural- interrogare il secondo modello occorre un numero mente, seguono quelli più essenziali di formal- maggiore di variabili nella query e che il path izzazione della terminologia e della conoscenza. dell’interrogazione del grafo è più lungo e coin- In primis, verrà studiato l’impatto determinato volge un maggior numero di entità ontologiche. dall’adozione di un certo modello sui meccan- Questo implica che, in termini di scalabilità ed ismi di reasoning, e quindi, sulla possibilità da efficienza nel processo di interrogazione, il mod- parte di un motore inferenziale di derivare nuova ello N-ario potrebbe risultare migliore. Come ul- conoscenza a partire da quella rappresentata es- timo criterio abbiamo considerato la disponibil- plicitamente nella risorsa. ità di strumenti che supportino l’umanista nella References Evren Sirin, Bijan Parsia, Bernardo C. Grau, Aditya Kalyanpur, Yarden Katz 2007. Pellet: A practical James F. Allen and George Ferguson. 1997 Actions owl-dl reasoner. Web Semantics: science, services and Events in Interval Temporal Logic. In: Spa- and agents on the World Wide Web, 5.2 51-53. tial and Temporal Reasoning. O. Stock, ed., Kluwer, Dordrecht, Netherlands, pp. 205-245. Rob Shearer, Boris Motik, and Ian Horrocks. 2008 HermiT: A Highly-Efficient OWL Reasoner. Sotiris Batsakis, Euripides Petrakis, Ilias Tachmazidis OWLED, Vol. 432. and Grigoris Antoniou 2016. Temporal Representa- tion and Reasoning in OWL 2. Semantic Web jour- Rita Temmerman, Koen Kerremans, and Veerle Van- nal, ISSN 1570-0844. dervoort 2005 La termontographie en con- texte(s). In Blampain, D., Thoiron, P., Van Campen- Fabio Ciotti. 2014 Digital Literary and Cultural Stud- houdt, M. (eds). Mots, Termes et Contextes. Actes ies: State of the Art and Perspectives. Between, vol. des septièmes Journées scientifiques du réseau de 4, no. 8. chercheurs Lexicologie Terminologie Traduction. Noy N. Fridman, William Grosso, and Mark A. Musen Bruxelles, 429- 439. 2000. Knowledge-Acquisition Interfaces for Do- Chris Welty, Richard Fikes, and Selene Makarios 2006 main Experts: An Empirical Evaluation of Protege- A reusable ontology for fluents in OWL. Proceed- 2000. SEKE2000 Proceedings. Chicago. ings of the 4th International Conference on Formal Aldo Gangemi. 2011 SuperDuper schema: an Ontology in Information Systems (FOIS), Vol. 150. OWL2+RIF DnS pattern. KCAP 2011 Deep Knowl- pp. 226–336 edge Representation Challenge Workshop. Fabio Grandi, and Maria Rita Scalas. 2009 The Valid Ontology: A simple OWL temporal version- ing framework. Advances in Semantic Process- ing, SEMAPRO’09. Third International Conference IEEE, 2009. pp. 98-102. Hans U. Krieger. 2014 A detailed comparison of seven approaches for the annotation of time-dependent factual knowledge in RDF and OWL. Proceedings 10th Joint ISO-ACL SIGSEM Workshop on Inter- operable Semantic Annotation, p. 1. Hans U. Krieger. 2012 A temporal extension of the Hayester Horst entailment rules and an alternative to W3C’s n-ary relations. Proceedings of the 7th International Conference on Formal Ontology in In- formation Systems (FOIS), pp. 323–336. Frank Manola and Eric Miller. 2004 RDF primer. Technical report, W3C. Natasha Noy and Alan Rector. 2006 Defining N- ary Relations on the Semantic Web. W3C Work- ing Group Note 12, https://www.w3.org/TR/swbp- n-aryRelations/ Piccini, S., Bellandi, A., and Benotto, G. 2016 Formalizing and Querying a Diachronic Termino- Ontological Resource: the CLAVIUS Case Study. Proceedings of From Digitization to Knowledge 2016 workshop (D2K), July 11, 2016, Krakow (Poland). Preventis A., Marki P., Petrakis E.G.M., Batsakis S. 2016 Chronos: A Tool for Handling Temporal On- tologies in Protégé. Proceedings of the 24th Inter- national Conference on Tools with Artificial Intelli- gence, Athens, Greece. Christophe Roche. 2007 Le terme et le concept: fonde- ments d’une ontoterminologie. Actes de la première conférence TOTh, pp.1–22, Annecy.