=Paper= {{Paper |id=Vol-1908/paper1 |storemode=property |title=Alinhamento entre Ontologias de Topo e de Domínio Usando WordNet(Top-level and Domain Ontologies Alignment via WordNet) |pdfUrl=https://ceur-ws.org/Vol-1908/paper1.pdf |volume=Vol-1908 |authors=Rafael Basso,Daniela Schmidt,Cassia Trojahn,Renata Vieira |dblpUrl=https://dblp.org/rec/conf/ontobras/BassoSSV17 }} ==Alinhamento entre Ontologias de Topo e de Domínio Usando WordNet(Top-level and Domain Ontologies Alignment via WordNet)== https://ceur-ws.org/Vol-1908/paper1.pdf
       Alinhamento entre Ontologias de Topo e de Domı́nio
                       usando WordNet
         Rafael Basso∗ , Daniela Schmidt∗ , Cassia Trojahn† , Renata Vieira∗

            1∗ Pontifı́cia Universidade Católica do Rio Grande do Sul (Brasil)

          rafael.basso, daniela.schmidt@acad.pucrs.br, renata.vieira@pucrs.br
              † Institut de Recherche en Informatique de Toulouse (France)

                                 {cassia.trojahn}@irit.fr

    Abstract. Matching domain and top-level ontologies is an important task but
    still an open problem in the ontology matching field, particularly due to their
    different levels of abstraction. In this paper we propose an approach for mat-
    ching domain and top ontologies that exploits the background knowledge from
    WordNet as an intermediate layer. We evaluate our approach using two well-
    known top-level ontologies, namely DOLCE and SUMO, and one domain onto-
    logy from the OAEI conference data set.

    Resumo. Alinhar ontologias de domı́nio e topo é uma tarefa importante, mas
    ainda é um problema em aberto na área de alinhamento de ontologias, prin-
    cipalmente devido aos diferentes nı́veis de abstração que estas ontologias re-
    presentam. Este artigo aborda o alinhamento entre ontologias de topo e de
    domı́nio, explorando o conhecimento do WordNet como uma ponte semântica
    entre ontologias de diferentes nı́veis. Para avaliar a nossa abordagem, nós con-
    sideramos duas ontologias de topo bem conhecidas, DOLCE e SUMO, e uma
    ontologia de domı́nio do conjunto de dados de avaliação do OAEI.

1. Introdução
Ontologias podem ser classificadas de acordo com seu nı́vel de generalidade. As onto-
logias de topo descrevem conceitos genéricos, como, por exemplo, espaço e tempo, ou
seja, conceitos básicos, universais e comuns a qualquer domı́nio. Dessa forma, garantem
expressividade e generalidade para uma vasta área de domı́nios. Por outro lado, as onto-
logias de domı́nio descrevem um campo especı́fico relacionado a um domı́nio, como por
exemplo, a aeronáutica ou a biologia. Ontologias de topo executam um papel importante
no desenvolvimento de ontologias sendo utilizadas como um guia para a modelagem de
ontologias de domı́nio, ou para incrementar a expressividade e o escopo de ontologias
de domı́nio existentes. Nesse contexto, alinhar ontologias de domı́nio e topo surge como
uma área de pesquisa com potencial de expansão, visto que essa tarefa tem sido executada
em sua maioria, de forma manual, conforme as abordagens propostas na literatura.
        De acordo com [Euzenat and Shvaiko 2007], o processo de encontrar corres-
pondências entre entidades de duas ontologias é conhecido como ontology matching. Esse
processo obtém como saı́da um conjunto de correspondências que é chamado de alinha-
mento. O alinhamento entre ontologias de topo e de domı́nio enfrentam desafios, em
particular devido ao seus diferentes nı́veis de abstração. Assim, este artigo apresenta uma
abordagem de alinhamento automático entre ontologias de topo e de domı́nio, baseando-
se no WordNet e na noção de contexto, que tem sido explorado de diferentes manei-
ras no processo de correspondência ontológica [Maedche and Staab 2002, Wang 2011,
Schadd and Roos 2012, Djeddi and Khadir 2014, Schmidt et al. 2016b]. Para avaliar o
nosso protótipo, foram executados experimentos utilizando uma ontologia de domı́nio
de conferências e duas ontologias de topo (DOLCE e SUMO). O conjunto de corres-
pondências resultante foi avaliado manualmente.
        O restante do artigo é organizado como segue. §2 introduz ontologias de topo, o
processo de alinhamento entre ontologias e a estrutura do Wordnet. §3 descreve a aborda-
gem proposta. §4 apresenta os experimentos e resultados alcançados. §5 discute trabalhos
relacionados e, por fim, §6 conclui o artigo e apresenta direções para trabalhos futuros.

2. Fundamentação Teórica
Nessa seção introduzimos os principais tópicos que serão utilizados como base teórica
para o desenvolvimento do nosso trabalho.

2.1. Ontologias de Topo
Ontologias de topo descrevem conceitos genéricos e universais, garantindo generalidade
e expressividade para uma grande área de domı́nios. Na literatura, diversas ontologias de
topo têm sido desenvolvidas, tais como a SUMO (Suggested Upper Merged Ontology)
[Niles and Pease 2001] e a DOLCE (Descriptive Ontology for Linguistic and Cognitive
Engeneering) [Gangemi et al. 2002] (utilizadas neste trabalho). Porém muitas outras fo-
ram desenvolvidas (detalhes em, [Mascardi et al. 2007], os quais fazem a análise de dife-
rente ontologias de topo). Abaixo, introduzimos as ontologias de topo consideradas neste
trabalho.
        A DOLCE [Gangemi et al. 2002] foi desenvolvida por Nicola Guarino e sua
equipe no LOA (Laboratory for Applied Ontology). O foco da DOLCE é compreen-
der as categorias subjacentes das tarefas cognitivas humanas e o ambiente sociocultural.
Inclui conceitos como abstract quality, abstract region, physical object, process, etc. É
implementada em First Order Logic, KIF (Knowledge Interchange Format) e OWL (Web
Ontology Language).
         A SUMO [Niles and Pease 2001] foi desenvolvida pelo Standard Upper Ontology
Working Group, um grupo de colaboradores do IEEE dos campos de engenharia, filosofia
e ciência da informação. É utilizada para pesquisas e aplicações em áreas como linguı́stica
e raciocı́nio. Inclui conceitos como abstract, human, social role, etc. É implementada
em SUO-KIF (Standard Upper Ontology Knowledge Interchange Format) e existe uma
tradução em OWL (Web Ontology Language).

2.2. Alinhamento entre Ontologias
De acordo com [Euzenat and Shvaiko 2007], um alinhamento é definido como um con-
junto de correspondências entre duas ontologias. O alinhamento é o resultado de um
processo de matching de ontologias. A definição formal de correspondência dada por
[Euzenat and Shvaiko 2007] é: Uma tupla , tal que: es e et são entidades (e.g.,
conceitos, propriedades, instâncias) de os e ot (ontologias fonte e alvo), respectivamente;
r é uma relação entre duas entidades es e et , (por exemplo, equivalence, subsumption,
disjointness, overlapping); e n é um número de medida de confiança no intervalo [0;1]. A
medida de confiança atribui um grau de confiabilidade para a correspondência encontrada
no processo de matching.
2.3. WordNet e seu Mapeamento para Ontologias de Topo
WordNet [Miller 1995] é uma base lexical do inglês composta por substantivos, verbos,
adjetivos e adverbios, que são agrupados em conjuntos de sinônimos cognitivos, chama-
dos de synsets. Em outras palavras, um synset é um grupo de termos que tem um signifi-
cado comum dentro de um certo contexto. O WordNet também fornece descrições textu-
ais dos synsets, chamadas de gloss que contêm exemplos e definições dos mesmos. Como
exemplo, temos o conceito Poster, representado pelo synsets que agrupa os sinônimos
poster, posting, placard, notice, bill, card, com a descrição “a sign posted in a public
place as an advertisement; a poster advertised the coming attractions”. Os synsets estão
interligados por meio de relações conceituais-semânticas e lexicais. Assim, além da si-
nonı́mia, o WordNet inclui relações de super e subordinação, ou hiponı́mia e hiperonı́mia.
         Devido a essas caracterı́sticas, o WordNet é semelhante a uma ontologia
[Gangemi et al. 2002], onde relações de hiponı́mia são como relações de subsunção para
os conceitos. Entretanto, o WordNet, para ser considerado como uma ontologia, deve-
ria poder ser interpretado de acordo com uma semântica formal que nos diz algo so-
bre o mundo e não apenas sobre a linguagem. Para isso [Gangemi et al. 2002] apre-
sentam esforços para alinhar o WordNet com a DOLCE. Da mesma forma, também
é possı́vel encontrar alinhamentos com outras ontologias de topo, como a SUMO
[Niles and Pease 2003].
         O alinhamento entre o WordNet e a DOLCE apresentado por
[Gangemi et al. 2002] considera a taxonomia dos substantivos da versão 1.6 do
WordNet. Os autores assumem que a relação de hiponı́mia poderia ser mapeada com a
relação de subsunção e a noção de synset poderia ser mapeada com a noção de conceito.
Em seguida, os conceitos nomeados foram normalizados para obter um nome distinto
para cada synset. Assim, se um termo tiver um único significado, então seu synset é
unificado e usado como nome do conceito (e.g world wide web web www). Se o
termo for polissêmico, então os diferentes conceitos serão enumerados (e.g window 1,
window 2) para os synsets com a descrição “a rectangular part of a computer screen
that contains a display different from the rest of the screen” e “a framework of wood or
metal that contains a glass windowpane and is built into a wall or roof to admit light or
air”, por exemplo.
         Na mesma linha, [Niles and Pease 2003], desenvolveram um alinhamento entre a
ontologia de topo SUMO e o WordNet. Os autores também utilizaram a versão 1.6 do
WordNet. A metodologia utilizada consiste em identificar relações de sinonı́mia, hipe-
ronı́mia e instanciação de conceitos da SUMO com synsets do WordNet. Um exemplo
da estrutura do alinhamento do WordNet com a SUMO, indicando uma relação de equi-
valência (=) pode ser conferido a seguir:
00008864 03 n 03 plant 0 flora 0 plant life 0 027 @ . . . — a living organism lacking the
                              power of locomotion &%Plant=
         Os primeiros 8 dı́gitos indicam o ID do synset, as três palavras seguintes são as
palavras que compõem o synset, a definição do synset segue logo após a barra horizontal
e por último o conceito da SUMO e o tipo de relação sucedem o prefixo &% .
3. Abordagem Proposta
Neste trabalho, apresentamos o desenvolvimento de uma abordagem para alinhamento de
ontologias de topo e de domı́nio. Nossa abordagem utiliza os alinhamentos existentes
entre as ontologias de topo DOLCE e SUMO e WordNet. Dessa forma, o WordNet atua
como uma camada intermediária entre a ontologia de topo e a ontologia de domı́nio. Um
protótipo foi implementado utilizando a linguagem Java, e recursos como Ontology API,
Alignment API e WordNet.
        O processo de matching divide-se em duas fases. A primeira fase, de identificação
do synset, é composta por três etapas: a constituição do contexto; o processamento do
contexto; e a seleção do synset adequado. Essas etapas ocorrem para cada conceito da
ontologia de domı́nio. A segunda fase é responsável por utilizar o synset recuperado na
primeira fase e identificar o mapeamento do mesmo com a ontologia de topo. Esta fase é
diferente para as ontologias de topo DOLCE e SUMO. Conforme descrito na seção 2.3,
os alinhamentos entre o WordNet e as ontologias de topo são modelados de maneira dife-
rente. Para DOLCE, os autores desenvolveram uma ontologia em formato OWL composta
pelos conceitos na ontologia de topo e o conceito que representa o synset do WordNet de-
vidamente mapeados. Já para a SUMO, os autores desenvolveram um arquivo texto que
descreve o synset com seu respectivo alinhamento com o conceito de topo. Assim, imple-
mentamos o nosso protótipo considerando os diferentes formatos de alinhamento entre as
ontologias e o WordNet. Os passos do mapeamento serão detalhados a seguir:

3.1. Fase 1 : Constituição do Contexto
Essa etapa foi sub-dividida em três tarefas: a extração dos conceitos; a extração da
anotação do conceito; e a extração dos conceitos de nı́veis superiores e inferiores. Após
a realização dessas três etapas, o processo cria um contexto pré-processado, ou seja,
composto por todos os elementos recuperados incluindo termos repetidos, compostos e
sentenças. O processo inicia carregando a ontologia de domı́nio. Logo após, extrai-se
os conceitos da ontologia e, para cada conceito extraı́do recupera-se sua descrição, o seu
nome e o seus vizinhos (super-conceitos e sub-conceitos). Adicionando essas informações
no contexto de cada conceito. Todo conceito extraı́do é armazenado em uma lista, junto
com seu contexto.
       Um exemplo de um conceito extraı́do, indicando a estrutura do seu contexto é
apresentado a seguir:
• Conceito: Committee member;
• Super-conceitos: Person (Neste caso há apenas um super-conceito, entretanto pode
  variar a quantidade);
• Sub-conceitos: Chair e Co-chair;
• Anotação (descrição): Nulo (Neste caso a ontologia não fornece descrições para seus
  conceitos, sendo assim, a descrição é nula).
       Com base nessas informações, a estrutura do contexto fica da seguinte forma:
• Contexto: Committee member, Person, Chair, Co-chair
       O processo de constituição de contexto é implementado conforme descrito no Al-
goritmo 1. O contexto é construı́do apenas para os conceitos das ontologias (as proprie-
dades não são consideradas).
       Input: ontologia ( ontologia de domı́nio );
       for ( OWLClass cls IN getConcepts (ontologia )) do
           Conceito cnp = new Conceito( );
           List context = new List( );
           if ( ! isAnonymous( cls )) then
                cnp.setConceito( cls );
                context.add( cls.getID( ));
                context.add( cls.getAnnotation( ));
                extractSuperConceitos( cls, context );
                extractSubConcepitos( cls, context );
                cnp.setContext( context );
                listaConceitos.add( cnp );
           end
       end
                        Algoritmo 1: Constituição do contexto


3.2. Fase 1 : Processamento do Contexto
Nessa etapa, a entrada é o contexto de cada conceito. Primeiro, removemos os caracte-
res especiais, em seguida todos os termos compostos e sentenças são transformados em
termos simples (função singleTerms, modifica a lista passada por parâmetro). A seguir
todos os termos repetidos são removidos (função rmRepeatedW, modifica a lista passada
por parâmetro) e por último removemos as stopwords.
        Um exemplo do processamento do contexto, dando continuidade ao exemplo an-
terior pode ser visualizado a seguir:
• Contexto pré-processado: Committee member, Person, Chair, Co-chair
• Primeiro passo: Committee member, Person, Chair, Co chair
• Segundo passo: Committee, member, Person, Chair, Co
       O processo de processamento do contexto pode ser visualizado no Algoritmo 2.

       for ( Conceito cnp IN listaConceitos ) do
           List < String > cntxt = new List( );
           cntxt = cnp.getContext( );
           List temp = new List( );
           if ( cntxt != NULL ) then
                temp = rmEspecialChar( cntxt );
                singleTerms( temp );
                rmRepeatedW( tem p);
                cntxt.clear( );
                cntxt = temp.rmStopW( );
                cnp.setContext( cntxt );
           end
       end
                       Algoritmo 2: Processamento do contexto
3.3. Fase 1 : Seleção do Synset Adequado
Conceitos representados em ontologias podem apresentar diferentes significados, ou seja,
ser polissêmicos, variando de acordo com o domı́nio que os mesmos estão representando.
Para identificar o significado que o conceito visa representar, nos baseamos no contexto
construı́do para o mesmo e no uso do WordNet como um recurso externo auxiliar na
identificação dos diferentes significados que um conceito pode representar. Assim, iden-
tificado um conjunto de synsets correspondentes no WordNet, utiliza-se o contexto para
selecionar o synset que melhor expressa o conceito. A seguir, essas etapas serão detalha-
das.
        Inicialmente ocorre o acesso ao WordNet e passa-se por parâmetro o nome do con-
ceito quando trata-se de conceito simples. Para conceitos com nomes compostos, adotou-
se apenas a última palavra do conceito no acesso ao WordNet (e.g Committee member,
busca-se apenas member no WN). Caso o nome do conceito composto tenha um adjetivo,
esse adjetivo é removido, e assim utiliza-se a palavra restante.
        Então é recuperado o IDictionary (função recoverDictionary). Com o dictionary
aberto recupera-se um Index passando por parâmetro o nome do conceito juntamente com
um atributo que indica que a palavra passada por parâmetro é um substântivo.

        IDctionary dict = recoverDictonary();
        dict.open( );
        for ( Conceito cnp IN listaConceitot ) do
            List context = cnp.getContext( );
            IIndexWord idxWord = dict.getIndexWord( cnp.getName( ),
              POS.NOUN);
            if ( idxWord != NULL ) then
                 int max = 0;
                 List listaSynset = idxWord.getISynsets( );
                 for ( ISynset synset IN listSynset ) do
                     List synsetContext = recoverSynsetContext( wordId );
                     int size = intersection( context, synsetContext );
                     if ( size > max ) then
                          max = size; cnp.setGoodSynset( synset );
                     end
                 end
            end
        end
        dict.close( );
                        Algoritmo 3: Seleção do Synset adequado

        Se esse Index for diferente de nulo, então ocorrerá a recuperação do synset. Entre-
tanto, um conjunto de synsets (listSynsets) será recuperado e para selecionar o correto é
necessário criar um contexto para o synset, formado pelas palavras que o compõem e pelo
seu gloss (definição do synset). Após criado esse novo contexto, compara-se ele com o
contexto do conceito (função intersection), o contexto dos synsets com o maior número de
elementos iguais aos elementos do contexto do conceito tem seu synset selecionado como
adequado para o conceito. O processo de seleção do synset adequado pode ser visuali-
zado no Algoritmo 3. Como mencionado anteriormente, a segunda etapa da abordagem é
diferente para as ontologias DOLCE e SUMO, que será descrito nas próximas seções.

3.4. Fase 2 : Alinhamento entre Ontologias de Domı́nio e SUMO
Para o alinhamento entre a ontologia de domı́nio com a ontologia SUMO, nossa aborda-
gem utiliza o alinhamento prévio entre o WordNet e a SUMO descrito em 2.3.
        Para cada conceito já extraido da ontologia de domı́nio, foram utilizados o ID
do synset já selecionado como adequado. Após selecionar o ID, percorre-se o ar-
quivo WordNetMapping-nouns (função findAli), para encontrar o conceito alinhado com
a SUMO. Por último utiliza-se a classe Mapping para gerar um arquivo de saı́da em for-
mato .rdf, contendo como atributos source (nome do conceito de domı́nio), target (nome
do conceito de topo), relation (tipo de relação) e o measure (informa a confiabilidade
dos dois conceitos). Utiliza-se a mesma função (findAli) para selecionar o target, rela-
tion e measure. Passa-se o Mapping de cada conceito para um função que gera o arquivo
de saı́da em RDF. O processo de alinhamento com a ontologia de topo SUMO pode ser
visualizado no Algoritmo 4.

       for ( Concept concept IN listConcept ) do
           Mapping map = new Mapping( );
           String code = concept.getGoodSynset( ).getID( );
           map.setSource( concept.getName( ));
           findAli( code, map );
           preRDF( map );
       end
       outRdfFile();
             Algoritmo 4: Alinhamento com a ontologia de topo SUMO

3.5. Fase 2 : Alinhamento entre Ontologias de Domı́nio e DOLCE
Essa fase utiliza o alinhamento prévio entre a ontologia de topo DOLCE e o WordNet.
Para cada conceito previamente extraı́do da ontologia de domı́nio, identifica-se (a partir
do synset anteriormente desambiguado) o conceito correspondente na ontologia que re-
presenta o alinhamento entre o WordNet e a DOLCE. Essa identificação ocorre de duas
maneiras: a primeira ocorre pelos termos que compõem o synset (função compareW),
que é comparado com os termos que compõem o nome do conceito do WordNet no ma-
peamento com a DOLCE. E a segunda ocorre pelo gloss do synset (função compareG),
comparando-o com a anotação do conceito do WordNet no mapeamento com a DOLCE.
Após encontrar o conceito equivalente ao synset, extrai-se o conceito de nı́vel mais alto a
partir dele (função extractSuper), esse conceito de nı́vel mais alto equivale ao conceito da
DOLCE. A instância da classe Mapping é utilizada para gerar a saı́da. A saı́da dessa fase
é o próprio alinhamento em formato RDF. O processo de alinhamento com a ontologia de
topo DOLCE pode ser visualizado no Algoritmo 5.

4. Experimentos
Com o propósito de avaliar nossa abordagem, executamos experimentos envolvendo uma
ontologia do domı́nio de conferências (ontologia conference), que faz parte do jogo de
        Input: onto2 ( wnNounsyn-v7.owl );
        for ( Conceito cnp IN listaConceito ) do
            Mapping map = new Mapping( );
            Conceito cnp2 = new Concept( );
            Conceito cnp3 = new Concept( );
            ISynset synset = cnp.getGoodSynset( );
            List synsetWords = getWords( synset );
            map.setSource( cnp.getName( ));
            cnp2 = compareW( synsetWords, onto2 );
            if ( cnp2 == NULL ) then
                 String gloss = synset.getGloss ();
                 cnp2 = compareG( gloss, onto2 );
            end
            cnp3 = extractSuper( cnp 2);
            map.setTarget( cnp3.getName( ));
            map.setRealation( > );
            map.setMeasure( true );
            preRDF( map );
        end
        outRdfFile();
             Algoritmo 5: Alinhamento com a ontologia de topo DOLCE


     Tabela 1. Resultado da avaliação manual das correspondências entre a ontologia
     de conferência e as ontologias de topo DOLCE e SUMO
          Avaliação Manual        Conferência e DOLCE     Conferência e SUMO
          Corretos                  26              43,33%   35             58,34%
          Incorretos                27              45,00%   17             28,33%
          Nulos                     7               11,67%   8              13,33%


testes Conference das campanhas de avaliação OAEI1 . A ontologia é composta por 60
conceitos. No primeiro experimento, avaliamos o nosso algoritmo na tarefa de alinhar
a ontologia de domı́nio com a ontologia DOLCE. Nesse experimento, dos 60 conceitos
de domı́nio, para 7 não foram encontrados os synsets no WordNet retornando como nulo
(11, 67%). Em 26 casos o alinhamento resultante foi considerado correto na avaliação
manual (43, 33%) e para 27 casos, o alinhamento não foi considerado correto (45%).
         Posteriormente, executamos o mesmo experimento, porém na tarefa de alinhar
a ontologia de domı́nio com a ontologia de topo SUMO. Nesse experimento, dos 60
conceitos de domı́nio, para 8 não foram encontrados os synsets no WordNet retornando
como nulo (13, 33%). Em 35 casos o alinhamento resultante foi considerado correto na
avaliação manual (58, 34%) e para 17 casos, o alinhamento não foi considerado correto
(28, 33%). A Tabela 1 sumariza os resultados da avaliação manual envolvendo as corres-
pondências identificadas pelo protótipo entre a ontologia de domı́nio de conferências e as
ontologias de topo DOLCE e SUMO.

   1 http://oaei.ontologymatching.org/
        As Tabelas 2 e 3 apresentam um fragmento das correspondências encontradas
entre os conceitos da ontologia de domı́nio (coluna 1) e as ontologias de topo DOLCE
(coluna 2) e SUMO (coluna 2) juntamente com o resultado da avaliação manual (coluna
3). Os conceitos estão representados em negrito juntamente com sua hierarquia na onto-
logia. Na avaliação manual, Y indica que a correspondência foi considerada correta pelos
avaliadores, N indica que a correspondência não foi considerada correta e null indica que
não foram recuperados synsets no WordNet para o conceito de domı́nio, logo, não foi
possı́vel determinar o alinhamento com o conceito de topo via WordNet.


     Tabela 2. Fragmento das correspondências geradas entre a ontologia de domı́nio
     e a ontologia de topo DOLCE
                                                                                    Avaliação
            Conceitos de Conference                         DOLCE
                                                                                     Manual
                                            particular/spatio-temporal-particular/
                                            endurant/non-physical-endurant/
    Person/Conference participant/
                                            non-physical-object/social-object/         Y
    Active conference participant
                                            agentive-social-object/agentive-figure/
                                            socially-constructed-person
                                            particular/spatio-temporal-particular/
                                            endurant/non-physical-endurant/
    Person/Conference contributor/
                                            non-physical-object/social-object/         Y
    Invited speaker
                                            agentive-social-object/agentive-figure/
                                            socially-constructed-person
    Person/Conference contributor/
                                            null                                        -
    Regular author/Contribution co-author
                                            particular/spatio-temporal-particular/
    Conference document/Conference          endurant/non-physical-endurant/
    contribution/ Written contribution/     non-physical-object/social-object/         N
    Regular contribution/ Extended abstract non-agentive-social-object/
                                            collection/non-physical-collection
                                            particular/spatio-temporal-particular/
    Person/Track-workshop chair                                                        N
                                            endurant/physical-endurant


        Nossa abordagem apresenta resultados preliminares e a análise foi desenvolvida
utilizando apenas uma ontologia de domı́nio, além disso, a ontologia utilizada não contém
a descrição do conceito e isso pode ter gerado um contexto que não é rico o suficiente para
desambiguar os synsets selecionados. Ainda assim, podemos observar resultados promis-
sores com o uso do WordNet atuando como uma camada intermediária entre ontologias
de topo e de domı́nio na tarefa de alinhar ontologias com diferentes nı́veis de abstração
na representação dos conceitos.

5. Trabalhos Relacionados
Na literatura, diversas abordagens utilizam o WordNet na tarefa de alinhamento de ontolo-
gias de domı́nio para melhorar as métricas de similaridade. Em [Kwak and Yong 2010],
a similaridade léxica para matching de ontologias considera a taxa de inclusão de no-
mes de entidades ontologicas e palavras de synset do WordNet em um conjunto agre-
gado (incluindo relações de hypernyms, hyponyms, holonyms e meronyms). De ma-
neira similar a nossa abordagem, os autores sobrepõe conjuntos de termos construı́dos
a partir de informações disponı́veis sobre entidades de ontologias. No entanto, em
     Tabela 3. Fragmento das correspondências geradas entre a ontologia de domı́nio
     e a ontologia de topo SUMO
                                                                                 Avaliação
                Conceitos de Conference                     SUMO
                                                                                  Manual
        Person/Conference participant/          Entity/physical/object/
                                                                                    Y
        Active conference participant           agent/IT agent/Human
        Person/Conference contributor/          Entity/abstract/attribute/
                                                                                    Y
        Invited speaker                         relational attribute/SocialRole
        Person/Conference contributor/
                                                null                                 -
        Regular author/Contribution co-author
        Conference document/Conference
        contribution/ Written contribution/     Entity/Abstract                     N
        Regular contribution/ Extended abstract
                                                Entity/physical/object/artifact/
        Person/Track-workshop chair                                                 N
                                                furniture/seat/Chair



nosso trabalho, exploramos o contexto das entidades ontológicas, incluindo seus sub-
conceitos, super-conceitos e anotações, mas limitando-se a relação de hiperonı́mia. Em
[Yatskevich and Giunchiglia 2004], é proposto um conjunto de element-level matchers
que utilizam o WordNet. Os autores distinguem knowledge-based matchers (que explo-
ram as propriedades estruturais do WordNet, frequentemente combinados com estatı́sticas
de corpora em larga escala) e gloss-based matchers (que exploram a descrição dos syn-
sets em WordNet). Nós também exploramos as propriedades estruturais do WordNet,
mas com foco nas relações de hiperonı́mia e os glosses dos synsets. No entanto, em
[Yatskevich and Giunchiglia 2004], não é explorada a noção de contexto de entidades on-
tológicas. Para medidas de similaridade terminológica, o matcher automático YAM++
[Ngo and Bellahsene 2013] inclui métricas baseadas em WordNet. O matcher XMAP
[Djeddi and Khadir 2014] define uma medida de similaridade semântica usando o re-
curso UMLS (Unified Medical Language System) e WordNet. Em [Schmidt et al. 2016b],
WordNet é usado para validar automaticamente conjuntos de correspondências gerados
por matchers. Nos experimentos realizados, a validação envolve o alinhamento resultante
entre uma ontologia de domı́nio e três ontologias de topo.
        Em relação ao uso de ontologias de topo na tarefa de alinhamento de ontolo-
gias, [Lacasta et al. 2013] propõe um processo para converter automaticamente um mo-
delo de conhecimento em uma ontologia através do alinhamento com a ontologia de topo
DOLCE. Os autores têm o objetivo de transformar um tesauro e uma base de dados bibli-
ográficos em uma ontologia. De acordo com os autores, o alinhamento prévio entre a on-
tologia DOLCE e WordNet foi utilizado como um passo intermediário para a identificação
de correspondências entre as bases de dados e a ontologia de topo. As ontologias de topo
são também usadas como um recurso para obter ou melhorar o alinhamento entre on-
tologias de domı́nio, como apresentado em [Padilha et al. 2012, Silva et al. 2011]. Em
[Padilha et al. 2012], os autores alinham manualmente ontologias do domı́nio de confe-
rencia do OAEI utilizando a ontologia de topo UFO. O processo consiste em adotar um
conjunto de padrões definidos pelos autores e fundamentados pela UFO. Assim, para cada
conceito de domı́nio, é identificada uma correspondência em UFO, então, após as ontolo-
gias de domı́nio serem mapeadas para UFO, as mesmas são alinhadas entre si com base
nos padrões especificados. Já em [Silva et al. 2011], o objetivo é auxiliar na identificação
de termos equivalentes entre a GO (genome ontology) e outras ontologias biomédicas.
A abordagem consiste em uma fase de preparação que identifica a ontologia de origem,
destino e de topo que será utilizada no processo. A abordagem é semi-automática, onde
o alinhamento entre os conceitos de domı́nio e topo ocorre manualmente, após, o ali-
nhamento entre ontologias de mesmo domı́nio é realizada de forma automática por meio
de um algoritmo que implementa métricas de similaridade extensional, similaridade de
domı́nio e escopo e similaridade de conceitos. A ontologia de topo BFO é adotada nos
experimentos.
         O nosso trabalho também foca no alinhamento entre ontologias de topo e de
domı́nio, mas diferentemente de [Padilha et al. 2012, Silva et al. 2011], o alinhamento
entre as ontologias é realizado automaticamente e utiliza o WordNet como uma camada
intermediária, visto que existem alinhamentos prévios do WordNet com as ontologias de
topo utilizadas. Além do mais, a nossa abordagem adota a noção de contexto que é cons-
truı́da a partir de informações extraı́das das ontologias, e não é explorada nos trabalhos
mencionados.

6. Conclusão e Trabalhos Futuros
Alinhar ontologias de domı́nio e topo é um desafio, em particular dado os diferentes
nı́veis de abstração destas ontologias. Este trabalho apresenta uma abordagem inicial
para o alinhamento entre ontologias de topo e domı́nio, que utiliza o WordNet como uma
camada intermediária. Foi realizada uma avaliação preliminar, cujos resultados apontam
para as vantagens e limitações da nossa abordagem. Em particular, observamos que al-
guns contextos não são ricos o suficiente para realizar a desambiguação; e o problema
da recuperação de synsets nulos, quando não foram identificados os termos no WordNet.
Ainda assim, consideramos que o uso do WordNet atuando como uma camada inter-
mediária entre ontologias de topo e de domı́nio é uma abordagem promissora. Nos expe-
rimentos realizados, observamos que a maioria dos conceitos representados na ontologia
de domı́nio participaram de alinhamentos com a ontologia de topo, por meio do WordNet.
Além do mais, observamos um número razoável de correspondências consideradas corre-
tas na avaliação manual, fato que não ocorre quando utilizamos diretamente ferramentas
de matching de ontologias disponı́veis (como abordado em [Schmidt et al. 2016a]). No
entanto, estamos cientes de que, no caso de domı́nios mais especı́ficos, pode ocorrer a falta
de cobertura no WordNet. Dessa forma essa abordagem é restrita aos casos de domı́nios
mais gerais como o caso do domı́nio Conferência, estudado neste trabalho.
        Como trabalhos futuros, pretendemos explorar outras técnicas de alinhamento de
ontologias com o objetivo de apoiar a identificação de correspondências entre conceitos,
principalmente a relação de subsunção que é altamente desejável quando alinhamos on-
tologias de domı́nio e topo. Pretendemos também desenvolver experimentos utilizando
outras ontologias de domı́nio para que possamos obter uma avaliação mais abrangente da
nossa abordagem.

Referências
Djeddi, W. E. and Khadir, M. T. (2014). A novel approach using context-based measure
  for matching large scale ontologies. In Data Warehousing and Knowl. Discovery, pages
  320–331.
Euzenat, J. and Shvaiko, P. (2007). Ontology Matching. Springer-Verlag, 1st edition.
Gangemi, A., Guarino, N., Masolo, C., Oltramari, A., and Schneider, L. (2002). Sweete-
  ning Ontologies with DOLCE. In Knowl. Engin. and Knowl. Manag., pages 166–181.
Kwak, J. and Yong, H. (2010). Ontology matching based on hypernym, hyponym, ho-
  lonym and meronym sets in wordnet. Web and Semantic Technology, 1(2):1–14.
Lacasta, J., Nogueras-Iso, J., Falquet, G., Teller, J., and Zarazaga-Soria, F. J. (2013).
  Design and Evaluation of a Semantic Enrichment Process for Bibliographic Databases.
  Data Knowledge Engineering, 88:94–107.
Maedche, A. and Staab, S. (2002). Measuring similarity between ontologies. In Kno-
  wledge Engineering and Knowledge Management, pages 251–263.
Mascardi, V., Cordı̀, V., and Rosso, P. (2007). A Comparison of Upper Ontologies. In
  Joint Workshop on Agents and Industry, pages 55–64.
Miller, G. A. (1995). WordNet: A Lexical Database for English. Communications ACM,
  38(11):39–41.
Ngo, D. and Bellahsene, Z. (2013). YAM++ - Results for OAEI 2013. In Workshop on
  Ontology Matching, pages 211–218.
Niles, I. and Pease, A. (2001). Towards a Standard Upper Ontology. In Formal Ontology
   in Information Systems, pages 2–9.
Niles, I. and Pease, A. (2003). Mapping wordnet to the sumo ontology. In Knowledge
   Engineering Conference, pages 23–26.
Padilha, N. F., Baião, F., and Revoredo, K. (2012). Alignment Patterns based on Unified
  Foundational Ontology. In Brazilian Ontology Research Seminar, pages 48–59.
Schadd, F. C. and Roos, N. (2012). Coupling of wordnet entries for ontology mapping
  using virtual documents. In Workshop on Ontology Matching, pages 25–36.
Schmidt, D., Trojahn, C., and Vieira, R. (2016a). Analysing Top-level and Domain Onto-
  logy Alignments from Matching Systems. In Workshop on Ontology Matching, pages
  1–12.
Schmidt, D., Trojahn, C., Vieira, R., and Kamel, M. (2016b). Validating Top-level and
  Domain Ontology Alignments using WordNet. In Brazilian Ontology Research Semi-
  nar, pages 119–130.
Silva, V. S., Campos, M. L. M., Silva, J. C. P., and Cavalcanti, M. C. (2011). An ap-
   proach for the alignment of biomedical ontologies based on foundational ontologies.
   Information and Data Management, 2(3):557–572.
Wang, P. (2011). Lily Results on SEALS Platform for OAEI 2011. In Workshop on
  Ontology Matching, pages 156–162.
Yatskevich, M. and Giunchiglia, F. (2004). Element level semantic matching using Word-
  Net. In Meaning Coordination and Negotiation Workshop, pages 37–48.