=Paper=
{{Paper
|id=Vol-1908/paper1
|storemode=property
|title=Alinhamento entre Ontologias de Topo e de Domínio Usando WordNet(Top-level and Domain Ontologies Alignment via WordNet)
|pdfUrl=https://ceur-ws.org/Vol-1908/paper1.pdf
|volume=Vol-1908
|authors=Rafael Basso,Daniela Schmidt,Cassia Trojahn,Renata Vieira
|dblpUrl=https://dblp.org/rec/conf/ontobras/BassoSSV17
}}
==Alinhamento entre Ontologias de Topo e de Domínio Usando WordNet(Top-level and Domain Ontologies Alignment via WordNet)==
Alinhamento entre Ontologias de Topo e de Domı́nio usando WordNet Rafael Basso∗ , Daniela Schmidt∗ , Cassia Trojahn† , Renata Vieira∗ 1∗ Pontifı́cia Universidade Católica do Rio Grande do Sul (Brasil) rafael.basso, daniela.schmidt@acad.pucrs.br, renata.vieira@pucrs.br † Institut de Recherche en Informatique de Toulouse (France) {cassia.trojahn}@irit.fr Abstract. Matching domain and top-level ontologies is an important task but still an open problem in the ontology matching field, particularly due to their different levels of abstraction. In this paper we propose an approach for mat- ching domain and top ontologies that exploits the background knowledge from WordNet as an intermediate layer. We evaluate our approach using two well- known top-level ontologies, namely DOLCE and SUMO, and one domain onto- logy from the OAEI conference data set. Resumo. Alinhar ontologias de domı́nio e topo é uma tarefa importante, mas ainda é um problema em aberto na área de alinhamento de ontologias, prin- cipalmente devido aos diferentes nı́veis de abstração que estas ontologias re- presentam. Este artigo aborda o alinhamento entre ontologias de topo e de domı́nio, explorando o conhecimento do WordNet como uma ponte semântica entre ontologias de diferentes nı́veis. Para avaliar a nossa abordagem, nós con- sideramos duas ontologias de topo bem conhecidas, DOLCE e SUMO, e uma ontologia de domı́nio do conjunto de dados de avaliação do OAEI. 1. Introdução Ontologias podem ser classificadas de acordo com seu nı́vel de generalidade. As onto- logias de topo descrevem conceitos genéricos, como, por exemplo, espaço e tempo, ou seja, conceitos básicos, universais e comuns a qualquer domı́nio. Dessa forma, garantem expressividade e generalidade para uma vasta área de domı́nios. Por outro lado, as onto- logias de domı́nio descrevem um campo especı́fico relacionado a um domı́nio, como por exemplo, a aeronáutica ou a biologia. Ontologias de topo executam um papel importante no desenvolvimento de ontologias sendo utilizadas como um guia para a modelagem de ontologias de domı́nio, ou para incrementar a expressividade e o escopo de ontologias de domı́nio existentes. Nesse contexto, alinhar ontologias de domı́nio e topo surge como uma área de pesquisa com potencial de expansão, visto que essa tarefa tem sido executada em sua maioria, de forma manual, conforme as abordagens propostas na literatura. De acordo com [Euzenat and Shvaiko 2007], o processo de encontrar corres- pondências entre entidades de duas ontologias é conhecido como ontology matching. Esse processo obtém como saı́da um conjunto de correspondências que é chamado de alinha- mento. O alinhamento entre ontologias de topo e de domı́nio enfrentam desafios, em particular devido ao seus diferentes nı́veis de abstração. Assim, este artigo apresenta uma abordagem de alinhamento automático entre ontologias de topo e de domı́nio, baseando- se no WordNet e na noção de contexto, que tem sido explorado de diferentes manei- ras no processo de correspondência ontológica [Maedche and Staab 2002, Wang 2011, Schadd and Roos 2012, Djeddi and Khadir 2014, Schmidt et al. 2016b]. Para avaliar o nosso protótipo, foram executados experimentos utilizando uma ontologia de domı́nio de conferências e duas ontologias de topo (DOLCE e SUMO). O conjunto de corres- pondências resultante foi avaliado manualmente. O restante do artigo é organizado como segue. §2 introduz ontologias de topo, o processo de alinhamento entre ontologias e a estrutura do Wordnet. §3 descreve a aborda- gem proposta. §4 apresenta os experimentos e resultados alcançados. §5 discute trabalhos relacionados e, por fim, §6 conclui o artigo e apresenta direções para trabalhos futuros. 2. Fundamentação Teórica Nessa seção introduzimos os principais tópicos que serão utilizados como base teórica para o desenvolvimento do nosso trabalho. 2.1. Ontologias de Topo Ontologias de topo descrevem conceitos genéricos e universais, garantindo generalidade e expressividade para uma grande área de domı́nios. Na literatura, diversas ontologias de topo têm sido desenvolvidas, tais como a SUMO (Suggested Upper Merged Ontology) [Niles and Pease 2001] e a DOLCE (Descriptive Ontology for Linguistic and Cognitive Engeneering) [Gangemi et al. 2002] (utilizadas neste trabalho). Porém muitas outras fo- ram desenvolvidas (detalhes em, [Mascardi et al. 2007], os quais fazem a análise de dife- rente ontologias de topo). Abaixo, introduzimos as ontologias de topo consideradas neste trabalho. A DOLCE [Gangemi et al. 2002] foi desenvolvida por Nicola Guarino e sua equipe no LOA (Laboratory for Applied Ontology). O foco da DOLCE é compreen- der as categorias subjacentes das tarefas cognitivas humanas e o ambiente sociocultural. Inclui conceitos como abstract quality, abstract region, physical object, process, etc. É implementada em First Order Logic, KIF (Knowledge Interchange Format) e OWL (Web Ontology Language). A SUMO [Niles and Pease 2001] foi desenvolvida pelo Standard Upper Ontology Working Group, um grupo de colaboradores do IEEE dos campos de engenharia, filosofia e ciência da informação. É utilizada para pesquisas e aplicações em áreas como linguı́stica e raciocı́nio. Inclui conceitos como abstract, human, social role, etc. É implementada em SUO-KIF (Standard Upper Ontology Knowledge Interchange Format) e existe uma tradução em OWL (Web Ontology Language). 2.2. Alinhamento entre Ontologias De acordo com [Euzenat and Shvaiko 2007], um alinhamento é definido como um con- junto de correspondências entre duas ontologias. O alinhamento é o resultado de um processo de matching de ontologias. A definição formal de correspondência dada por [Euzenat and Shvaiko 2007] é: Uma tupla, tal que: es e et são entidades (e.g., conceitos, propriedades, instâncias) de os e ot (ontologias fonte e alvo), respectivamente; r é uma relação entre duas entidades es e et , (por exemplo, equivalence, subsumption, disjointness, overlapping); e n é um número de medida de confiança no intervalo [0;1]. A medida de confiança atribui um grau de confiabilidade para a correspondência encontrada no processo de matching. 2.3. WordNet e seu Mapeamento para Ontologias de Topo WordNet [Miller 1995] é uma base lexical do inglês composta por substantivos, verbos, adjetivos e adverbios, que são agrupados em conjuntos de sinônimos cognitivos, chama- dos de synsets. Em outras palavras, um synset é um grupo de termos que tem um signifi- cado comum dentro de um certo contexto. O WordNet também fornece descrições textu- ais dos synsets, chamadas de gloss que contêm exemplos e definições dos mesmos. Como exemplo, temos o conceito Poster, representado pelo synsets que agrupa os sinônimos poster, posting, placard, notice, bill, card, com a descrição “a sign posted in a public place as an advertisement; a poster advertised the coming attractions”. Os synsets estão interligados por meio de relações conceituais-semânticas e lexicais. Assim, além da si- nonı́mia, o WordNet inclui relações de super e subordinação, ou hiponı́mia e hiperonı́mia. Devido a essas caracterı́sticas, o WordNet é semelhante a uma ontologia [Gangemi et al. 2002], onde relações de hiponı́mia são como relações de subsunção para os conceitos. Entretanto, o WordNet, para ser considerado como uma ontologia, deve- ria poder ser interpretado de acordo com uma semântica formal que nos diz algo so- bre o mundo e não apenas sobre a linguagem. Para isso [Gangemi et al. 2002] apre- sentam esforços para alinhar o WordNet com a DOLCE. Da mesma forma, também é possı́vel encontrar alinhamentos com outras ontologias de topo, como a SUMO [Niles and Pease 2003]. O alinhamento entre o WordNet e a DOLCE apresentado por [Gangemi et al. 2002] considera a taxonomia dos substantivos da versão 1.6 do WordNet. Os autores assumem que a relação de hiponı́mia poderia ser mapeada com a relação de subsunção e a noção de synset poderia ser mapeada com a noção de conceito. Em seguida, os conceitos nomeados foram normalizados para obter um nome distinto para cada synset. Assim, se um termo tiver um único significado, então seu synset é unificado e usado como nome do conceito (e.g world wide web web www). Se o termo for polissêmico, então os diferentes conceitos serão enumerados (e.g window 1, window 2) para os synsets com a descrição “a rectangular part of a computer screen that contains a display different from the rest of the screen” e “a framework of wood or metal that contains a glass windowpane and is built into a wall or roof to admit light or air”, por exemplo. Na mesma linha, [Niles and Pease 2003], desenvolveram um alinhamento entre a ontologia de topo SUMO e o WordNet. Os autores também utilizaram a versão 1.6 do WordNet. A metodologia utilizada consiste em identificar relações de sinonı́mia, hipe- ronı́mia e instanciação de conceitos da SUMO com synsets do WordNet. Um exemplo da estrutura do alinhamento do WordNet com a SUMO, indicando uma relação de equi- valência (=) pode ser conferido a seguir: 00008864 03 n 03 plant 0 flora 0 plant life 0 027 @ . . . — a living organism lacking the power of locomotion &%Plant= Os primeiros 8 dı́gitos indicam o ID do synset, as três palavras seguintes são as palavras que compõem o synset, a definição do synset segue logo após a barra horizontal e por último o conceito da SUMO e o tipo de relação sucedem o prefixo &% . 3. Abordagem Proposta Neste trabalho, apresentamos o desenvolvimento de uma abordagem para alinhamento de ontologias de topo e de domı́nio. Nossa abordagem utiliza os alinhamentos existentes entre as ontologias de topo DOLCE e SUMO e WordNet. Dessa forma, o WordNet atua como uma camada intermediária entre a ontologia de topo e a ontologia de domı́nio. Um protótipo foi implementado utilizando a linguagem Java, e recursos como Ontology API, Alignment API e WordNet. O processo de matching divide-se em duas fases. A primeira fase, de identificação do synset, é composta por três etapas: a constituição do contexto; o processamento do contexto; e a seleção do synset adequado. Essas etapas ocorrem para cada conceito da ontologia de domı́nio. A segunda fase é responsável por utilizar o synset recuperado na primeira fase e identificar o mapeamento do mesmo com a ontologia de topo. Esta fase é diferente para as ontologias de topo DOLCE e SUMO. Conforme descrito na seção 2.3, os alinhamentos entre o WordNet e as ontologias de topo são modelados de maneira dife- rente. Para DOLCE, os autores desenvolveram uma ontologia em formato OWL composta pelos conceitos na ontologia de topo e o conceito que representa o synset do WordNet de- vidamente mapeados. Já para a SUMO, os autores desenvolveram um arquivo texto que descreve o synset com seu respectivo alinhamento com o conceito de topo. Assim, imple- mentamos o nosso protótipo considerando os diferentes formatos de alinhamento entre as ontologias e o WordNet. Os passos do mapeamento serão detalhados a seguir: 3.1. Fase 1 : Constituição do Contexto Essa etapa foi sub-dividida em três tarefas: a extração dos conceitos; a extração da anotação do conceito; e a extração dos conceitos de nı́veis superiores e inferiores. Após a realização dessas três etapas, o processo cria um contexto pré-processado, ou seja, composto por todos os elementos recuperados incluindo termos repetidos, compostos e sentenças. O processo inicia carregando a ontologia de domı́nio. Logo após, extrai-se os conceitos da ontologia e, para cada conceito extraı́do recupera-se sua descrição, o seu nome e o seus vizinhos (super-conceitos e sub-conceitos). Adicionando essas informações no contexto de cada conceito. Todo conceito extraı́do é armazenado em uma lista, junto com seu contexto. Um exemplo de um conceito extraı́do, indicando a estrutura do seu contexto é apresentado a seguir: • Conceito: Committee member; • Super-conceitos: Person (Neste caso há apenas um super-conceito, entretanto pode variar a quantidade); • Sub-conceitos: Chair e Co-chair; • Anotação (descrição): Nulo (Neste caso a ontologia não fornece descrições para seus conceitos, sendo assim, a descrição é nula). Com base nessas informações, a estrutura do contexto fica da seguinte forma: • Contexto: Committee member, Person, Chair, Co-chair O processo de constituição de contexto é implementado conforme descrito no Al- goritmo 1. O contexto é construı́do apenas para os conceitos das ontologias (as proprie- dades não são consideradas). Input: ontologia ( ontologia de domı́nio ); for ( OWLClass cls IN getConcepts (ontologia )) do Conceito cnp = new Conceito( ); List context = new List( ); if ( ! isAnonymous( cls )) then cnp.setConceito( cls ); context.add( cls.getID( )); context.add( cls.getAnnotation( )); extractSuperConceitos( cls, context ); extractSubConcepitos( cls, context ); cnp.setContext( context ); listaConceitos.add( cnp ); end end Algoritmo 1: Constituição do contexto 3.2. Fase 1 : Processamento do Contexto Nessa etapa, a entrada é o contexto de cada conceito. Primeiro, removemos os caracte- res especiais, em seguida todos os termos compostos e sentenças são transformados em termos simples (função singleTerms, modifica a lista passada por parâmetro). A seguir todos os termos repetidos são removidos (função rmRepeatedW, modifica a lista passada por parâmetro) e por último removemos as stopwords. Um exemplo do processamento do contexto, dando continuidade ao exemplo an- terior pode ser visualizado a seguir: • Contexto pré-processado: Committee member, Person, Chair, Co-chair • Primeiro passo: Committee member, Person, Chair, Co chair • Segundo passo: Committee, member, Person, Chair, Co O processo de processamento do contexto pode ser visualizado no Algoritmo 2. for ( Conceito cnp IN listaConceitos ) do List < String > cntxt = new List( ); cntxt = cnp.getContext( ); List temp = new List( ); if ( cntxt != NULL ) then temp = rmEspecialChar( cntxt ); singleTerms( temp ); rmRepeatedW( tem p); cntxt.clear( ); cntxt = temp.rmStopW( ); cnp.setContext( cntxt ); end end Algoritmo 2: Processamento do contexto 3.3. Fase 1 : Seleção do Synset Adequado Conceitos representados em ontologias podem apresentar diferentes significados, ou seja, ser polissêmicos, variando de acordo com o domı́nio que os mesmos estão representando. Para identificar o significado que o conceito visa representar, nos baseamos no contexto construı́do para o mesmo e no uso do WordNet como um recurso externo auxiliar na identificação dos diferentes significados que um conceito pode representar. Assim, iden- tificado um conjunto de synsets correspondentes no WordNet, utiliza-se o contexto para selecionar o synset que melhor expressa o conceito. A seguir, essas etapas serão detalha- das. Inicialmente ocorre o acesso ao WordNet e passa-se por parâmetro o nome do con- ceito quando trata-se de conceito simples. Para conceitos com nomes compostos, adotou- se apenas a última palavra do conceito no acesso ao WordNet (e.g Committee member, busca-se apenas member no WN). Caso o nome do conceito composto tenha um adjetivo, esse adjetivo é removido, e assim utiliza-se a palavra restante. Então é recuperado o IDictionary (função recoverDictionary). Com o dictionary aberto recupera-se um Index passando por parâmetro o nome do conceito juntamente com um atributo que indica que a palavra passada por parâmetro é um substântivo. IDctionary dict = recoverDictonary(); dict.open( ); for ( Conceito cnp IN listaConceitot ) do List context = cnp.getContext( ); IIndexWord idxWord = dict.getIndexWord( cnp.getName( ), POS.NOUN); if ( idxWord != NULL ) then int max = 0; List listaSynset = idxWord.getISynsets( ); for ( ISynset synset IN listSynset ) do List synsetContext = recoverSynsetContext( wordId ); int size = intersection( context, synsetContext ); if ( size > max ) then max = size; cnp.setGoodSynset( synset ); end end end end dict.close( ); Algoritmo 3: Seleção do Synset adequado Se esse Index for diferente de nulo, então ocorrerá a recuperação do synset. Entre- tanto, um conjunto de synsets (listSynsets) será recuperado e para selecionar o correto é necessário criar um contexto para o synset, formado pelas palavras que o compõem e pelo seu gloss (definição do synset). Após criado esse novo contexto, compara-se ele com o contexto do conceito (função intersection), o contexto dos synsets com o maior número de elementos iguais aos elementos do contexto do conceito tem seu synset selecionado como adequado para o conceito. O processo de seleção do synset adequado pode ser visuali- zado no Algoritmo 3. Como mencionado anteriormente, a segunda etapa da abordagem é diferente para as ontologias DOLCE e SUMO, que será descrito nas próximas seções. 3.4. Fase 2 : Alinhamento entre Ontologias de Domı́nio e SUMO Para o alinhamento entre a ontologia de domı́nio com a ontologia SUMO, nossa aborda- gem utiliza o alinhamento prévio entre o WordNet e a SUMO descrito em 2.3. Para cada conceito já extraido da ontologia de domı́nio, foram utilizados o ID do synset já selecionado como adequado. Após selecionar o ID, percorre-se o ar- quivo WordNetMapping-nouns (função findAli), para encontrar o conceito alinhado com a SUMO. Por último utiliza-se a classe Mapping para gerar um arquivo de saı́da em for- mato .rdf, contendo como atributos source (nome do conceito de domı́nio), target (nome do conceito de topo), relation (tipo de relação) e o measure (informa a confiabilidade dos dois conceitos). Utiliza-se a mesma função (findAli) para selecionar o target, rela- tion e measure. Passa-se o Mapping de cada conceito para um função que gera o arquivo de saı́da em RDF. O processo de alinhamento com a ontologia de topo SUMO pode ser visualizado no Algoritmo 4. for ( Concept concept IN listConcept ) do Mapping map = new Mapping( ); String code = concept.getGoodSynset( ).getID( ); map.setSource( concept.getName( )); findAli( code, map ); preRDF( map ); end outRdfFile(); Algoritmo 4: Alinhamento com a ontologia de topo SUMO 3.5. Fase 2 : Alinhamento entre Ontologias de Domı́nio e DOLCE Essa fase utiliza o alinhamento prévio entre a ontologia de topo DOLCE e o WordNet. Para cada conceito previamente extraı́do da ontologia de domı́nio, identifica-se (a partir do synset anteriormente desambiguado) o conceito correspondente na ontologia que re- presenta o alinhamento entre o WordNet e a DOLCE. Essa identificação ocorre de duas maneiras: a primeira ocorre pelos termos que compõem o synset (função compareW), que é comparado com os termos que compõem o nome do conceito do WordNet no ma- peamento com a DOLCE. E a segunda ocorre pelo gloss do synset (função compareG), comparando-o com a anotação do conceito do WordNet no mapeamento com a DOLCE. Após encontrar o conceito equivalente ao synset, extrai-se o conceito de nı́vel mais alto a partir dele (função extractSuper), esse conceito de nı́vel mais alto equivale ao conceito da DOLCE. A instância da classe Mapping é utilizada para gerar a saı́da. A saı́da dessa fase é o próprio alinhamento em formato RDF. O processo de alinhamento com a ontologia de topo DOLCE pode ser visualizado no Algoritmo 5. 4. Experimentos Com o propósito de avaliar nossa abordagem, executamos experimentos envolvendo uma ontologia do domı́nio de conferências (ontologia conference), que faz parte do jogo de Input: onto2 ( wnNounsyn-v7.owl ); for ( Conceito cnp IN listaConceito ) do Mapping map = new Mapping( ); Conceito cnp2 = new Concept( ); Conceito cnp3 = new Concept( ); ISynset synset = cnp.getGoodSynset( ); List synsetWords = getWords( synset ); map.setSource( cnp.getName( )); cnp2 = compareW( synsetWords, onto2 ); if ( cnp2 == NULL ) then String gloss = synset.getGloss (); cnp2 = compareG( gloss, onto2 ); end cnp3 = extractSuper( cnp 2); map.setTarget( cnp3.getName( )); map.setRealation( > ); map.setMeasure( true ); preRDF( map ); end outRdfFile(); Algoritmo 5: Alinhamento com a ontologia de topo DOLCE Tabela 1. Resultado da avaliação manual das correspondências entre a ontologia de conferência e as ontologias de topo DOLCE e SUMO Avaliação Manual Conferência e DOLCE Conferência e SUMO Corretos 26 43,33% 35 58,34% Incorretos 27 45,00% 17 28,33% Nulos 7 11,67% 8 13,33% testes Conference das campanhas de avaliação OAEI1 . A ontologia é composta por 60 conceitos. No primeiro experimento, avaliamos o nosso algoritmo na tarefa de alinhar a ontologia de domı́nio com a ontologia DOLCE. Nesse experimento, dos 60 conceitos de domı́nio, para 7 não foram encontrados os synsets no WordNet retornando como nulo (11, 67%). Em 26 casos o alinhamento resultante foi considerado correto na avaliação manual (43, 33%) e para 27 casos, o alinhamento não foi considerado correto (45%). Posteriormente, executamos o mesmo experimento, porém na tarefa de alinhar a ontologia de domı́nio com a ontologia de topo SUMO. Nesse experimento, dos 60 conceitos de domı́nio, para 8 não foram encontrados os synsets no WordNet retornando como nulo (13, 33%). Em 35 casos o alinhamento resultante foi considerado correto na avaliação manual (58, 34%) e para 17 casos, o alinhamento não foi considerado correto (28, 33%). A Tabela 1 sumariza os resultados da avaliação manual envolvendo as corres- pondências identificadas pelo protótipo entre a ontologia de domı́nio de conferências e as ontologias de topo DOLCE e SUMO. 1 http://oaei.ontologymatching.org/ As Tabelas 2 e 3 apresentam um fragmento das correspondências encontradas entre os conceitos da ontologia de domı́nio (coluna 1) e as ontologias de topo DOLCE (coluna 2) e SUMO (coluna 2) juntamente com o resultado da avaliação manual (coluna 3). Os conceitos estão representados em negrito juntamente com sua hierarquia na onto- logia. Na avaliação manual, Y indica que a correspondência foi considerada correta pelos avaliadores, N indica que a correspondência não foi considerada correta e null indica que não foram recuperados synsets no WordNet para o conceito de domı́nio, logo, não foi possı́vel determinar o alinhamento com o conceito de topo via WordNet. Tabela 2. Fragmento das correspondências geradas entre a ontologia de domı́nio e a ontologia de topo DOLCE Avaliação Conceitos de Conference DOLCE Manual particular/spatio-temporal-particular/ endurant/non-physical-endurant/ Person/Conference participant/ non-physical-object/social-object/ Y Active conference participant agentive-social-object/agentive-figure/ socially-constructed-person particular/spatio-temporal-particular/ endurant/non-physical-endurant/ Person/Conference contributor/ non-physical-object/social-object/ Y Invited speaker agentive-social-object/agentive-figure/ socially-constructed-person Person/Conference contributor/ null - Regular author/Contribution co-author particular/spatio-temporal-particular/ Conference document/Conference endurant/non-physical-endurant/ contribution/ Written contribution/ non-physical-object/social-object/ N Regular contribution/ Extended abstract non-agentive-social-object/ collection/non-physical-collection particular/spatio-temporal-particular/ Person/Track-workshop chair N endurant/physical-endurant Nossa abordagem apresenta resultados preliminares e a análise foi desenvolvida utilizando apenas uma ontologia de domı́nio, além disso, a ontologia utilizada não contém a descrição do conceito e isso pode ter gerado um contexto que não é rico o suficiente para desambiguar os synsets selecionados. Ainda assim, podemos observar resultados promis- sores com o uso do WordNet atuando como uma camada intermediária entre ontologias de topo e de domı́nio na tarefa de alinhar ontologias com diferentes nı́veis de abstração na representação dos conceitos. 5. Trabalhos Relacionados Na literatura, diversas abordagens utilizam o WordNet na tarefa de alinhamento de ontolo- gias de domı́nio para melhorar as métricas de similaridade. Em [Kwak and Yong 2010], a similaridade léxica para matching de ontologias considera a taxa de inclusão de no- mes de entidades ontologicas e palavras de synset do WordNet em um conjunto agre- gado (incluindo relações de hypernyms, hyponyms, holonyms e meronyms). De ma- neira similar a nossa abordagem, os autores sobrepõe conjuntos de termos construı́dos a partir de informações disponı́veis sobre entidades de ontologias. No entanto, em Tabela 3. Fragmento das correspondências geradas entre a ontologia de domı́nio e a ontologia de topo SUMO Avaliação Conceitos de Conference SUMO Manual Person/Conference participant/ Entity/physical/object/ Y Active conference participant agent/IT agent/Human Person/Conference contributor/ Entity/abstract/attribute/ Y Invited speaker relational attribute/SocialRole Person/Conference contributor/ null - Regular author/Contribution co-author Conference document/Conference contribution/ Written contribution/ Entity/Abstract N Regular contribution/ Extended abstract Entity/physical/object/artifact/ Person/Track-workshop chair N furniture/seat/Chair nosso trabalho, exploramos o contexto das entidades ontológicas, incluindo seus sub- conceitos, super-conceitos e anotações, mas limitando-se a relação de hiperonı́mia. Em [Yatskevich and Giunchiglia 2004], é proposto um conjunto de element-level matchers que utilizam o WordNet. Os autores distinguem knowledge-based matchers (que explo- ram as propriedades estruturais do WordNet, frequentemente combinados com estatı́sticas de corpora em larga escala) e gloss-based matchers (que exploram a descrição dos syn- sets em WordNet). Nós também exploramos as propriedades estruturais do WordNet, mas com foco nas relações de hiperonı́mia e os glosses dos synsets. No entanto, em [Yatskevich and Giunchiglia 2004], não é explorada a noção de contexto de entidades on- tológicas. Para medidas de similaridade terminológica, o matcher automático YAM++ [Ngo and Bellahsene 2013] inclui métricas baseadas em WordNet. O matcher XMAP [Djeddi and Khadir 2014] define uma medida de similaridade semântica usando o re- curso UMLS (Unified Medical Language System) e WordNet. Em [Schmidt et al. 2016b], WordNet é usado para validar automaticamente conjuntos de correspondências gerados por matchers. Nos experimentos realizados, a validação envolve o alinhamento resultante entre uma ontologia de domı́nio e três ontologias de topo. Em relação ao uso de ontologias de topo na tarefa de alinhamento de ontolo- gias, [Lacasta et al. 2013] propõe um processo para converter automaticamente um mo- delo de conhecimento em uma ontologia através do alinhamento com a ontologia de topo DOLCE. Os autores têm o objetivo de transformar um tesauro e uma base de dados bibli- ográficos em uma ontologia. De acordo com os autores, o alinhamento prévio entre a on- tologia DOLCE e WordNet foi utilizado como um passo intermediário para a identificação de correspondências entre as bases de dados e a ontologia de topo. As ontologias de topo são também usadas como um recurso para obter ou melhorar o alinhamento entre on- tologias de domı́nio, como apresentado em [Padilha et al. 2012, Silva et al. 2011]. Em [Padilha et al. 2012], os autores alinham manualmente ontologias do domı́nio de confe- rencia do OAEI utilizando a ontologia de topo UFO. O processo consiste em adotar um conjunto de padrões definidos pelos autores e fundamentados pela UFO. Assim, para cada conceito de domı́nio, é identificada uma correspondência em UFO, então, após as ontolo- gias de domı́nio serem mapeadas para UFO, as mesmas são alinhadas entre si com base nos padrões especificados. Já em [Silva et al. 2011], o objetivo é auxiliar na identificação de termos equivalentes entre a GO (genome ontology) e outras ontologias biomédicas. A abordagem consiste em uma fase de preparação que identifica a ontologia de origem, destino e de topo que será utilizada no processo. A abordagem é semi-automática, onde o alinhamento entre os conceitos de domı́nio e topo ocorre manualmente, após, o ali- nhamento entre ontologias de mesmo domı́nio é realizada de forma automática por meio de um algoritmo que implementa métricas de similaridade extensional, similaridade de domı́nio e escopo e similaridade de conceitos. A ontologia de topo BFO é adotada nos experimentos. O nosso trabalho também foca no alinhamento entre ontologias de topo e de domı́nio, mas diferentemente de [Padilha et al. 2012, Silva et al. 2011], o alinhamento entre as ontologias é realizado automaticamente e utiliza o WordNet como uma camada intermediária, visto que existem alinhamentos prévios do WordNet com as ontologias de topo utilizadas. Além do mais, a nossa abordagem adota a noção de contexto que é cons- truı́da a partir de informações extraı́das das ontologias, e não é explorada nos trabalhos mencionados. 6. Conclusão e Trabalhos Futuros Alinhar ontologias de domı́nio e topo é um desafio, em particular dado os diferentes nı́veis de abstração destas ontologias. Este trabalho apresenta uma abordagem inicial para o alinhamento entre ontologias de topo e domı́nio, que utiliza o WordNet como uma camada intermediária. Foi realizada uma avaliação preliminar, cujos resultados apontam para as vantagens e limitações da nossa abordagem. Em particular, observamos que al- guns contextos não são ricos o suficiente para realizar a desambiguação; e o problema da recuperação de synsets nulos, quando não foram identificados os termos no WordNet. Ainda assim, consideramos que o uso do WordNet atuando como uma camada inter- mediária entre ontologias de topo e de domı́nio é uma abordagem promissora. Nos expe- rimentos realizados, observamos que a maioria dos conceitos representados na ontologia de domı́nio participaram de alinhamentos com a ontologia de topo, por meio do WordNet. Além do mais, observamos um número razoável de correspondências consideradas corre- tas na avaliação manual, fato que não ocorre quando utilizamos diretamente ferramentas de matching de ontologias disponı́veis (como abordado em [Schmidt et al. 2016a]). No entanto, estamos cientes de que, no caso de domı́nios mais especı́ficos, pode ocorrer a falta de cobertura no WordNet. Dessa forma essa abordagem é restrita aos casos de domı́nios mais gerais como o caso do domı́nio Conferência, estudado neste trabalho. Como trabalhos futuros, pretendemos explorar outras técnicas de alinhamento de ontologias com o objetivo de apoiar a identificação de correspondências entre conceitos, principalmente a relação de subsunção que é altamente desejável quando alinhamos on- tologias de domı́nio e topo. Pretendemos também desenvolver experimentos utilizando outras ontologias de domı́nio para que possamos obter uma avaliação mais abrangente da nossa abordagem. Referências Djeddi, W. E. and Khadir, M. T. (2014). A novel approach using context-based measure for matching large scale ontologies. In Data Warehousing and Knowl. Discovery, pages 320–331. Euzenat, J. and Shvaiko, P. (2007). Ontology Matching. Springer-Verlag, 1st edition. Gangemi, A., Guarino, N., Masolo, C., Oltramari, A., and Schneider, L. (2002). Sweete- ning Ontologies with DOLCE. In Knowl. Engin. and Knowl. Manag., pages 166–181. Kwak, J. and Yong, H. (2010). Ontology matching based on hypernym, hyponym, ho- lonym and meronym sets in wordnet. Web and Semantic Technology, 1(2):1–14. Lacasta, J., Nogueras-Iso, J., Falquet, G., Teller, J., and Zarazaga-Soria, F. J. (2013). Design and Evaluation of a Semantic Enrichment Process for Bibliographic Databases. Data Knowledge Engineering, 88:94–107. Maedche, A. and Staab, S. (2002). Measuring similarity between ontologies. In Kno- wledge Engineering and Knowledge Management, pages 251–263. Mascardi, V., Cordı̀, V., and Rosso, P. (2007). A Comparison of Upper Ontologies. In Joint Workshop on Agents and Industry, pages 55–64. Miller, G. A. (1995). WordNet: A Lexical Database for English. Communications ACM, 38(11):39–41. Ngo, D. and Bellahsene, Z. (2013). YAM++ - Results for OAEI 2013. In Workshop on Ontology Matching, pages 211–218. Niles, I. and Pease, A. (2001). Towards a Standard Upper Ontology. In Formal Ontology in Information Systems, pages 2–9. Niles, I. and Pease, A. (2003). Mapping wordnet to the sumo ontology. In Knowledge Engineering Conference, pages 23–26. Padilha, N. F., Baião, F., and Revoredo, K. (2012). Alignment Patterns based on Unified Foundational Ontology. In Brazilian Ontology Research Seminar, pages 48–59. Schadd, F. C. and Roos, N. (2012). Coupling of wordnet entries for ontology mapping using virtual documents. In Workshop on Ontology Matching, pages 25–36. Schmidt, D., Trojahn, C., and Vieira, R. (2016a). Analysing Top-level and Domain Onto- logy Alignments from Matching Systems. In Workshop on Ontology Matching, pages 1–12. Schmidt, D., Trojahn, C., Vieira, R., and Kamel, M. (2016b). Validating Top-level and Domain Ontology Alignments using WordNet. In Brazilian Ontology Research Semi- nar, pages 119–130. Silva, V. S., Campos, M. L. M., Silva, J. C. P., and Cavalcanti, M. C. (2011). An ap- proach for the alignment of biomedical ontologies based on foundational ontologies. Information and Data Management, 2(3):557–572. Wang, P. (2011). Lily Results on SEALS Platform for OAEI 2011. In Workshop on Ontology Matching, pages 156–162. Yatskevich, M. and Giunchiglia, F. (2004). Element level semantic matching using Word- Net. In Meaning Coordination and Negotiation Workshop, pages 37–48.