Redução de ambiguidade em sistemas de informação
          clínicos: ontologias aplicadas à terminologias
          Livia Marangon Duffles Teixeira; Mauricio Barcellos Almeida1
              1
                  PPGGOC – ECI/UFMG – Belo Horizonte – MG – Brazil
                    liviamarangon@gmail.com; mba@eci.ufmg.br

    Abstract. This paper presents an ongoing PhD project, which will be
    submitted to the examination board in February 2020, whose research
    question is the inherent ambiguity of medical terminologies. The methodology
    consists basically in anchoring to ontological resources, terms representing
    medical entities that exhibit epistemological features. There will be a double
    binding process with the aim of reducing terms ambiguity, which we believe
    essential to enable semantic interoperability between medical systems, a very
    important kind of issue in the ontology research.

    Resumo. Este artigo apresenta um projeto de pesquisa em andamento, com
    previsão de defesa para fevereiro de 2020, cujo problema de pesquisa é a
    ambiguidade de terminologias clínicas. A metodologia consiste basicamente
    em ancorar termos representativos de entidades médicas, que exibam
    características epistemológicas, a recursos ontológicos. O duplo processo de
    ancoragem proposto objetiva reduzir a ambiguidade dos termos e expressões,
    de forma a mitigar a falta de interoperabilidade semântica entre sistemas
    médicos, uma questão amplamente pesquisada na área de ontologias.

1. Introdução
A proliferação de sistemas de informação na área de medicina e cuidados à saúde ocorre
simultaneamente à evolução das diversas terminologias clínicas. Um dos aspectos
responsáveis pela dificuldade na comunicação entre sistemas é a sobreposição de
aspectos epistêmicos aos termos das terminologias que representam entidades do mundo
real (Bodenreider, Smith, Burgun, 2004). Nesse contexto, a presente pesquisa consiste
em elaborar e validar uma metodologia capaz de eliminar a sobreposição epistemológica
presente em terminologias clínicas por meio da integração da SNOMED CT (enquanto
terminologia desenvolvida para conectar sistemas de informação médica) ao OpenEHR
(modelo de informação clínica para desenvolvimento de prontuários eletrônicos de
paciente) e utilizando-se das teorias e práticas das ontologias. Entende-se que as
ontologias, com suas capacidades de explicitar o conhecimento em linguagem de
representação lógica, podem suprir o hiato na conexão de uma terminologia padrão a um
modelo de informação clínico, provendo a interoperabilidade semântica entre sistemas de
prontuários. A contribuição da pesquisa consiste no avanço das técnicas de modelagem
baseadas em sistemas de classificação, amplamente pesquisadas na Ciência da
Informação. Os resultados obtidos serão aplicados aos sistemas de informação clínicos
na busca por mitigar problemas de interoperabilidade verificados em um hospital
universitário brasileiro. Em última instância, buscam-se melhorias no atendimento e no
cuidado continuado ao cidadão, objetivo último da Ciência da Informação enquanto
ciência social. Esse trabalho tem sido desenvolvido no contexto de pesquisa de
doutorado, com previsão de defesa para fevereiro de 2020.

2. SNOMED CT
A SNOMED-CT é uma terminologia clínica global que inclui todos os domínios da
saúde. Ela foi criada para representar, de forma consistente e processável, a informação
encontrada em prontuário eletrônicos do paciente (Barra e Sasso, 2011). A terminologia
pode ser implementada de diferentes formas, dentre elas, em aplicações de prontuários
médicos. Outro fator de destaque é que a terminologia tem sido traduzida para OWL, o
que possibilita a redução de ambiguidades. A SNOMED CT foi estabelecida como
terminologia médica oficial brasileira (Brasil, 2011) e em 2018 o Brasil passou a integrar
o grupo de países membros do SNOMED Internacional.

2.1. Sobreposição de Aspectos Epistêmicos
Uma característica de diversas terminologias clínicas, inclusive da SNOMED CT, é
sobreposição de aspectos epistemológicos a termos usados para representar o mundo
real. A sobreposição epistêmica pode ser definida como a presença de dados adicionais
aos termos da terminologia que, embora sejam cruciais para atendimento clínico, não
constituem uma representação fidedigna da realidade no domínio médico. Isso quer dizer
que é possível observar dados complementares na descrição das classes, que nada tem a
ver com a definição ou categorização daquela classe, como por exemplo (Bodenreider,
Smith, Burgun, 2004): i) “Convulsão afebril” - não captura a essência ou origem da
ocorrência da convulsão e o termo “afebril” não é adequado para representação; ii)
"Tuberculose das glândulas adrenais, bacilos tuberculosos não encontrados (no
escarro) por microscopia, mas encontrados por cultura bacteriana" - fornece dados
complementares sobre como o médico obtém conhecimento sobre a doença; iii)
“Fratura de crânio sem lesão intracraniana” - comunica que a possibilidade de lesão
intracraniana foi verificada e descartada, o que não é necessário para a definição; iv)
“Abscesso tubo-ovariano possível” - reflete uma convicção momentânea do médico,
dentre outros. De fato, “é importante por uma série de razões que as classes denotadas
por termos clínicos representem o mais próximo possível das classes naturais que
existem na realidade” (Bodenreider, Smith, Burgun, 2004)1

3. OpenEHR
O OpenEHR disponibiliza padrões para o desenvolvimento de Prontuários Eletrônicos
de Pacientes (PEPs), buscando a comunicação e o compartilhamento sem perda de
informações e significados. Os arquétipos são o principal diferencial entre o OpenEHR e
os demais modelos de informação (Beale e Heard, 2007). Arquétipos representam o
conhecimento clínico por meio de classes de informações que configuram a entrada de
dados em um sistema de informação. Para operacionalizar a interoperabilidade, é
essencial que outros sistemas baseados em OpenEHR sejam construídos a partir dos
mesmos arquétipos. Além disso, é fundamental a utilização de uma terminologia clínica

1
  It is important for a number of reasons that classes denoted by biomedical terms represent as closely as possible
the genuine classes which exist in reality.
para a representação das informações dos pacientes. A partir desses fatos, alguém
poderia dizer que o OpenEHR lembre mais a proposta de um sistema federado, onde há
acordos anteriores entre as partes, e apenas através desse tipo de acordo é obtida alguma
integração. Nesse contexto, é importante entender a conexão entre ontologias e
terminologias (seção 3.1) e do que trata a interoperabilidade semântica (seção 3.2).

3.1. Papel das Terminologias e Ontologias
Bacelar e Correia (2015) explicam que os reais benefícios dos PEPs dependem da
estruturação e codificação dos dados usualmente descritos em texto livre. Assim, cada
termo do arquétipo pode ser vinculado a uma terminologia de forma a melhorar a sua
compreensão, reduzir a ambiguidade e incrementar o uso de dados no processo
decisório. Para o compartilhamento de dados dos prontuários é essencial explicitar o
significado dos termos. A maioria dos sistemas terminológicos e classificatórios não foi
criada para o propósito de automação e sim, para uso manual, de forma que têm sido
colocados à prova nesse sentido (Andrade, 2013). A semântica bem definida de um
termo é caracterizada pelo seu significado construído por regras simples e por meio dos
seus componentes e conectivos (Touretzky, 1986). As ontologias são capazes de tornar
explícitos os compromissos ontológicos, determinando significado restrito para o termo
específico (Gómez-Pérez et al., 2004). Vincular ontologias aos modelos de informação
clínica não é uma tarefa trivial (Rector et al., 2009), uma vez que estes são
desenvolvidos e apoiados na prática clínica baseada em linguagem natural e as ontologias
em lógica descritiva.

3.2. Interoperabilidade Semântica
A interoperabilidade semântica é a capacidade dos sistemas se comunicarem, integrando
desde o registro clínico até normas e diretrizes, sem que haja perda de informações e
significado ou interferência humana. Ao assegurar sua viabilidade, garante-se que as
mesmas conclusões sejam obtidas quando diferentes partes interessadas interpretarem um
conjunto de dados (Marco-Ruiz et al., 2017). As terminologias nasceram para propósitos
de padronização, mas ainda assim carregam ambiguidades. Apenas ontologias, sem
interferência de aspectos epistemológicos, pode reduzir tais ambiguidades.

4. Metodologia
A busca pela interoperabilidade semântica está originalmente associada à aplicação das
terminologias clínicas aos PEPs. Porém, as terminologias sofrem de sobreposição
epistemológica, mesmo naquelas que têm sido traduzidas para OWL. Nesse caso, a
descrição de instâncias presentes nos PEPs não está relacionada às entidades (universais)
do domínio. Torna-se então necessário o uso de ontologias, com sua capacidade de
descrever partes da realidade com redução de ambiguidade, o que as torna mais estáveis
para representar o vínculo universal > instâncias particulares no registro de saúde. A
seguir, são apresentados os passos metodológicos para a condução empírica da pesquisa,
que em seu decorrer ou ao final, serão passíveis de adaptação e generalização.

4.1. Passo 1: Selecionar termos organizados de acordo com o OpenEHR
Nesse primeiro passo, por meio de um recorte de universo a ser realizado, serão
selecionados em conjunto com o especialista da área do conhecimento, campos reais dos
arquétipos os quais se apresentam com alguma ambiguidade, ou a não existência de
semântica bem definida. Um exemplo são as diversas declarações de um modelo que
encontram diversas possibilidades de mapeamento na terminologia.
a)                                       b)


     Figure 1 – (a) (b) Exemplos de descrição de entidades do Arquétipo Sympton

4.2. Passo 2: Ancorar entidades do OpenEHR à SNOMED CT
Ao realizar essa ancoragem (assinalada em vermelho na figura 2), será possível a duas
unidades de saúde intercambiar dados entre sistemas com a garantia de que, pelo menos,
os campos dos prontuários de pacientes têm o mesmo significado. Entretanto, o
conteúdo do campo continua conectado ao preenchimento em texto livre pelos médicos.


         Figure 2 – Fragmento OpenEHR ancorado em termos do SNOMED CT

4.3. Passo 3: Identificar a sobreposição de aspectos epistêmicos na SNOMED CT
Identificar a sobreposição dentre os termos utilizados na ancoragem do passo 2. Esse
passo é fundamental na metodologia e discute-se a possibilidade de automação, usando
recursos de processamento de linguagem natural para marcar partes do discurso no texto
das terminologias.

4.4. Passo 4: Ancorar termos da SNOMED CT à ontologias reais
Nesse passo, será feita uma nova ancoragem, dessa vez, da SNOMED CT a uma
ontologia de alto nível livre de aspectos epistêmicos, a saber, a BFO (Smith et al., 2007).
A ontologia de nível médio chamada de Ontology for General Medical Science (OGMS)
(Scheuermann, Ceusters e Smith, 2009), desenvolvida abaixo da BFO, pode ser incluída
para melhor clarificar o significado de termos. Ao realizar essa segunda ancoragem, será
possível avaliar as possibilidades de integração de sistemas, uma vez que serão obtidas
conexões com redução de ambiguidades.


        Figure 3 – Exemplo de análise ontológica com a BFO e OGMS de dados de
        prontuário

4.5. Passo 5: Analisar resultados da ancoragem
Os resultados serão analisados quanto à precisão e redução da ambiguidade de termos,
bem como quanto a possíveis impactos para os sistemas de informação médica.

4.6. Passo 6: Validação da metodologia de integração
Após análise da ancoragem, será estabelecida a validação da integração da SNOMED ao
OpenEHR por meio de consulta a profissionais da área de saúde, de forma a verificar se
as etapas realizadas para mostrar a possibilidade de integração, encontram respaldo e
concordância dentre os especialistas. Ainda não está definida a amostra de termos, nem
os profissionais que participarão dessa tarefa. Isso é o que se espera de resultado
empiríco para criar a metodologia, uma vez que integração real de sistemas médicos
específicos não seria passível de teste no ambiente do hospital universitário em
referência.

5. Considerações Finais
Os objetivos da ontologia ficam claros em uma explicação de Brachman, citado em
Rector et al. (2009), onde as ontologias são tipos de “cabides conceituais” para outros
registros, às vezes de natureza não ontológica. Guizzardi (2007) corrobora com essa
ideia e exemplifica o aporte teórico da metodologia apontando a divisão entre ontologia
e epistemologia: [...] uma ontologia é uma especificação conceitual que descreve o
conhecimento sobre um domínio de forma independente dos estados epistêmicos e
estado de coisas.2(Guizzardi, 2007, p.8 - grifo nosso). Essa afirmações de eminentes
pesquisadores da área respaldam a busca por uma metodologia, teste e validação da

2
  An ontology is a conceptual specification that describes knowledge about a domain in a manner that is
independent of epistemic states and state of affairs.
sobreposição epistemológica. A metodologia pretende estabelecer os passos para a
revisão e melhorias no vínculo entre a SNOMED CT (que não é isenta de estados
epistêmicos) e o OpenEHR, a partir de recursos baseados em ontologias. Diante do
exposto, espera-se com a identificação da sobreposição de aspectos epistemológicos,
ancorar os termos passíveis de ambiguidade em ontologias (ou recursos ontológicos), de
forma a mantê-los claros.

6. Referências
Andrade, A. Q. de. (2013). “A linguagem médica utilizada em prontuários e suas
  representações em Sistemas de Informação: as ontologias e os modelos de
  informação”. UFMG, Escola de Ciência da Informação.
Bacelar, G.; Correia, R. (2015). “As bases do openEHR: v.1.0”. Porto: Virtual Care.
Barra, D. C. C.; Sasso, G. T. M. D. (2011). “Padrões de dados, terminologias e sistemas
  de classificação para o cuidado em saúde e enfermagem”. Rev. bras. enferm., v. 64, n.
  6.
Beale, T.; Heard, S. (2007). “An ontology-based model of clinical information”. Stud
  Health Technol Inform, v. 129.
Bodenreider, O.; Smith, B.; Burgun, A. (2004). “The Ontology-Epistemology divide: a
  case study in medical terminology”. In: Proceedings… FOIS.
Brasil. (2011). “Ministério da Saúde. Portaria n. 2073, de 31 de agosto de 2011”.
Gómez-Pérez, A.; Fernández-López, M.; Corcho, O.(2004). “Ontological engineering:
  with examples from the areas of knowledge management, e-commerce and the
  semantic web”. London: Springer-Verlag.
Guizzardi, G. (2007). “On Ontology, ontologies, conceptualizations, modeling
  languages, and (Meta) models”. IOS Press, Amsterdam.
Marco-Ruiz, L et. al (2017). “Alignment of information models and domain ontologies.
  In: Ontology-based terminologies for healthcare: Impact assessment and transitional
  consequences for implementation - project report”. cap.8. Norwegian Centre for E-
  health Research.
Rector, A. L.; Qamar, R.; Marley, T. (2009). “Binding ontologies and coding systems to
  electronic health records and messages”. Applied Ontology, v. 4, n. 1.
Scheuermann, R. H.; Ceusters, W.; Smith, B. (2009). “Toward an Ontological Treatment
  of Disease and Diagnosis”. Proceedings… AMIA Summit on Translational
  Bioinformatics.
Smith, B. et al. (2007). “The OBO foundry: coordinated evolution of ontologies to
  support biomedical dataintegration”. Nature Biotechnology, v. 25, n. 11.
Touretzky, D.S. (1986). “The matematics of inherintace systems”. Morgan Kaufmman.