Modelando Ontologias a partir de Diretrizes Clínicas: Diagnóstico e Tratamento da Cefaléia Eduardo J. Zanatta1, Fabrício H. Rodrigues2, Silvio C. Cazella1, Cecília D. Flores1, Marta R. Bez2 1 Universidade Federal de Ciências da Saúde de Porto Alegre - UFCSPA 2 Univerisdade FEEVALE. eduzanatta@gmail.com, fabriciohr@feevale.br, silvioc@ufcspa.edu.br, dflores@ufcspa.edu.br, martabez@feevale.br Abstract. This paper presents a methodology used to develop ontologies based on clinical guidelines, which consists in adapting the method 101 for adapting it to obtain ontologies from medical knowledge structured in a textual form. To do so, it is applied some adjustments to the steps presented in the original methodology, based on some guiding principles for the process. In order to test the methodology adapted, an ontology is built for the domain of diagnosis and treatment of headache. Resumo. O presente artigo apresenta uma metodologia utilizada no desenvolvimento de ontologias tendo como base diretrizes clínicas, que consiste na adaptação da metodologia 101 para adequá-la à obtenção de ontologias a partir de conhecimento médico estruturado em formato textual. Para tanto, são aplicadas algumas adaptações aos passos apresentadas na metodologia original, tendo por base alguns princípios norteadores para o processo. Para experimentar a metodologia adaptada, foi construída uma ontologia para o domínio de diagnóstico e tratamento de cefaleia.. 1. Introdução O presente artigo consiste em apresentar a metodologia utilizada no desenvolvimento de ontologias tendo como base de informação o domínio de medicina de família e comunidade, mais especificamente uma diretriz clínica sobre cefaleia (Wagner H. et al, 2012). Diretrizes clínicas consistem em normativas estabelecidas por um grupo de especialistas colimados por notório saber de uma área, que se propõem a reunir e emitir um consenso sobre as melhores práticas do estado atual do conhecimento de alguma questão clínica. Essa revisão é geralmente embasada em literatura técnica atualizada, associada à opinião e experiência desse grupo de peritos. Essas diretrizes clínicas são então divulgadas geralmente por associações de especialistas, com periódicas revisões de atualização. O interesse neste processo está em buscar um meio de facilitar a geração de redes bayesianas, baseadas em diretrizes clínicas, a partir das ontologias criadas. Sendo assim, o trabalho aqui apresentado compreende a formalização em termos computacionais de conhecimento médico expresso em linguagem natural, de forma a 272 propiciar os benefícios que a utilização desta tecnologia poderá trazer ao projeto de simulações médicas baseadas em conhecimento incerto - SimDeCS (Flores et al, 2012). O artigo está estruturado de forma a apresentar o desenvolvimento da ontologia através de uma adaptação da metodologia 101, aspectos considerados importantes, seguido das considerações finais. O restante deste trabalho está estruturado da seguinte forma: na seção 2 traz o relato do desenvolvimento da ontologia, apresentando a metodologia empregada e na seção 3 são apresentadas algumas considerações finais.. 2. Desenvolvimento da Ontologia Representações ontológicas do conhecimento médico despertam interesse de diversos grupos de pesquisa. (Preços e Spackman, 2000), (NCBO, 2011), (Humphreys e Lindberg, 1993). Diversas ontologias estão disponíveis em repositórios na web, porém, comumente desenvolvidas para uso de alguma aplicação específica, o que pode afetar o desempenho desta quando usada por outra aplicação (Baader et al, 2003). Optou-se assim pelo desenvolvimento de uma nova ontologia que expresse o conhecimento contido na Diretriz Clínica escolhida, consenso pela Sociedade de Medicina de Família e Comunidade brasileira. Distintas metodologias para construção de ontologias, que focam sua construção desde o início, são encontradas na literatura, tais como Método Cyc (Reed e Lenat 2002), Método Sensus (Swartout et al, 1996), Methontology (Fernandez, Gomez Pereze e Juristo, 1997). Outro guia para desenvolvimento de ontologias é o método 101, (Noy e McGuinness, 2001). Este guia foi concebido utilizando o software Protégé-2000. Devido à falta de uma metodologia consensual para a criação de ontologias, muitos pesquisadores seguem seus próprios critérios de desenvolvimento. Entretanto, parece razoável considerar que, em metodologias cuja capacidade geral de guiar o processo de construção de ontologias já tenha sido atestada, a inserção de critérios adicionais e adaptação de etapas pode prover maior adequação à situações determinadas. Por outro lado, em domínios menores e cujas fontes de conhecimento são parcialmente estruturadas – como no caso de diretrizes clínicas – o impacto negativo desse tipo de abordagem pode ser mitigado, prevalecendo seus aspectos positivos. Sendo assim, e considerando os objetivos do trabalho, para construção de um modelo de ontologia que descreva o conhecimento contido na diretriz clínica, uma adaptação da metodologia 101 para construção de ontologias (NOY; MCGUINNESS, 2011) foi utilizada. Essa foi eleita como modelo a ser adaptado devido, principalmente, à sua simplicidade, estando acessível de imediato pelos membros da equipe e implicando em facilidade de aplicação. Além disso, por seu carácter menos estruturado e, consequentemente, mais flexível que as outras metodologias estudadas, a modelagem de uma diretriz clínica na forma de uma ontologia torna-se mais natural, não suscitando conflito com etapas da metodologia. O método 101 é fundamentalmente baseado em quatro etapas: i) definição das classes; ii) organização das classes em taxonomia; iii) definição de relações, atributos e os valores que cada um poderá receber; iv) criação de instâncias pela inserção de valores correspondentes a cada atributo. A metodologia aponta, de forma mais específica, 7 passos imprescindíveis para a construção de ontologias. Na aplicação 273 desses passos foram observados 3 princípios para adequação ao uso sobre diretrizes clínicas: (a) determina que os termos utilizados na ontologia tenham origem exclusivamente no texto da diretriz clínica, a exceção de conhecimento tácito inerente ao domínio médico. (b) que todo o conhecimento presente no texto da diretriz deve ser modelado na ontologia, a fim de que se tenha uma representação fiel do domínio descrito em seu texto. (c) indica a utilização de algumas superclasses que representem estereótipos médicos recorrentes (i.e Diagnóstico, Indício, Sintoma, Sinal, Tratamento, Combate, Profilaxia e Contexto). A aplicação à diretriz clínica dos 7 passos referidos no modelo 101 ocorreu como segue: I) Determinar o domínio e escopo da ontologia: Definição dos princípios para a construção da ontologia. Também foram formuladas as chamadas “questões de competência”, que representam perguntas às quais a ontologia deve ser capaz de responder. Essas questões, além de guiar o projeto, servem para a validação da ontologia, permitindo verificar se ela atende aos objetivos para que foi construída. Entre elas estão perguntas tais como “Quais são os tipos de tratamento recomendados para enxaqueca?”, “Que sintomas caracterizam cefaleia em salvas?” e “Dados esses sintomas, que exame complementar deve ser solicitado?”. A participação de um especialista do domínio médico foi necessária dada a especificidade e complexidade do domínio em questão. II) Considerar o reuso de ontologias existentes: verificação da existência de termos e/ou porções do conhecimento em outras ontologias que possam ser reutilizadas na ontologia em desenvolvimento. Obedecendo ao princípio (a), não foram buscadas ontologias referentes a cefaleia, sendo todos os termos modelados a partir da interpretação da diretriz clínica e da interação com o especialista de domínio. III) Enumerar os termos importantes da ontologia: relação dos termos que representam conceitos do domínio, bem como os úteis para descrever tais conceitos. Dado o princípio (a), o processo de enumeração de termos ficou constrito ao vocabulário utilizado no texto da diretriz clínica, com acréscimo apenas do conhecimento médico implícito identificado pelo especialista. Nesse processo, diferentemente do recomendado na metodologia 101, foram classificados os termos, conforme o tipo de elemento da ontologia a que correspondiam. Essa estratégia foi adotada tendo em vista a estrutura semântica do vocabulário imposta pelo texto da diretriz, que evidencia o papel de cada termo dentro do domínio. IV) Definir a hierarquia de classes: organização dos termos listado definindo-se classes e subclasses. Por questões de engenharia da ontologia, decidiu-se por criar algumas classes-raiz para agrupar conceitos da forma como tradicionalmente são interpretados no domínio médico. Assim, foram criadas as seguintes classes: Diagnóstico, Indício, Sintoma, Sinal, Sinal/Sintoma de alerta, Exame complementar, Tratamento, Contexto, Perfil, Histórico, Fator externo. A partir destas, os conceitos identificados foram classificados, adicionando subclasses necessárias para representar a hierarquia inferida. 274 V) Definir propriedades e relações: os termos não utilizados na etapa anterior foram, em sua maioria, definidos como propriedades e relações das classes, aprofundando a representação do domínio e permitindo responder às questões de competência mais satisfatoriamente. Com o objetivo de criar um dicionário de sinônimos e disponibiliza-lo para uso em outras ontologias, termos similares foram agrupados. Cabe ressaltar a importância do especialista de domínio nessa fase. VI) Definir as características das propriedades e relações: criação de definições relativas a cardinalidade, tipo, domínio e contradomínio de cada propriedade e relação. Com isso foram formadas diversas expressões representando as relações entre classes e a sua caracterização por propriedade (“náusea evidencia enxaqueca”, que traz a relação “evidencia” entre os conceitos “náusea” e “enxaqueca”). VII) Criar instâncias: representação dos objetos pelo preenchimento das propriedades e relações das classes. Identificou-se na diretriz termos ou expressões que representassem exemplos dos conceitos modelados. Esse processo teve por base a granularidade evidenciada pela diretriz (os conceitos que não poderiam ser divididos em subclasses e dos quais não faria sentido ou não seria útil a criação de instâncias) e, em geral, identificou como instâncias expressões formadas por conceitos, propriedade e valores de propriedades (“dor de intensidade moderada”). Tratando-se de um processo iterativo, a identificação dos termos da ontologia deste trabalho teve duas iterações. Na primeira, descrito acima, foram identificados os termos expressos diretamente em algum termo do texto (e.g. dor, cefaleia, secreção nasal). Na segunda, adotou-se uma visão mais abrangente, objetivando identificar termos inferíeis do contexto expresso por fragmentos maiores do texto (e.g. o fragmento "O diagnóstico de enxaqueca e cefaleia tensional em idosos é, muitas vezes, um desafio, tendo em vista que o início dos sintomas depois dos 50 anos é infrequente e pode representar uma cefaleia de origem secundária como, por exemplo, massas expansivas intracranianas e acidente vascular cerebral. Existe a necessidade de uma atenção maior nesta faixa etária, já que as causas secundárias de cefaleia são mais prováveis" permitiu identificar relações como “idade maior que 50 anos evidencia cefaleia secundária” e “acidente vascular cerebral causa cefaleia secundária”). A Figura 1 trata de um fragmento da ontologia, apresentando apenas a hierarquia de suas classes principais. Pode ser visualizada a classe “Thing”, representando a superclasse de todas as coisas. Um nível abaixo encontram-se as 4 classes definidas no quarto passo da metodologia (“Diagnostico”, “Evidencia”, “Contexto” e “Tratamento”). O nível seguinte mostra as subdivisões das classes “Evidencia” e “Contexto” (“Sintoma”, “Sinal”, “SinalSintomaAlerta”, “ExameComplementar”, “Perfil”, “Historico” e “FatorExterno”). Também podem ser visualizadas as classes “Cefaleia” e suas subdivisões, “CefaleiaPrimaria” e “CefaleiaSecundaria”, bem como alguns tipos de cefaleia primaria (i.e. “Enxaqueca”, “CefaleiaEmSalvas” e “CefaleiaTensional”), que representam o cerne do domínio da ontologia. Há ainda uma classe para representar conhecimento de mais alto nível – “TipoDor” – que, formando uma partição de valor, especifica, em uma possível instância da classe “Dor”, o tipo da dor representada pela instância – seja “Pulsatil” ou “Pressao”. 275 Figura 1. Fragmento da Ontologia de Cefaleia 3. Considerações Finais A construção de ontologias a partir de diretrizes clínicas parece ser uma boa abordagem. Apesar da relativa complexidade do modelo criado em comparação ao tamanho da diretriz que serviu como base (i.e. mais de 180 classes extraídas de uma diretriz de 13 páginas) a forma esquemática como o conhecimento é organizado na ontologia torna sua consulta mais objetiva tanto com uso de métodos físicos tradicionais (i.e. análise de diagramas representativos da ontologia) quanto daqueles intermediados por software. Além disso, nesse último caso, torna-se possível a aplicação de recursos para potencialização do conhecimento armazenado (e.g. interface de comunicação entre sistemas, sistemas de apoio a diagnóstico), os quais não estariam completamente 276 disponíveis para aplicação sobre a informação em linguagem natural. Dessa forma, a conversão de diretrizes clínicas em ontologias torna o conhecimento mais disponível, com uso mais efetivo e, dada sua formalização, mais facilmente padronizável – e sendo essas características-chave tanto da natureza quanto dos objetivos de uma diretriz clínica, fortalece-se o argumento em favor dessa prática. Alinhado a isso, como trabalho futuro, tem-se uma validação formal e de domínio mais refinada, com a comparação objetiva entre a ontologia e a diretriz original a fim de determinar em que medida elas são representações correspondentes. Ainda, esse trabalho está conectado a outro cujo objetivo é a extração, a partir de ontologias médicas, de redes bayesianas para diagnóstico, estando ambos ligados ao projeto do SimDeCS [12]. 4. Referências Baader, F., Calvanese, D., McGuinness, D., Nardi, D., Patel-Schneider, P. (2003) “ The Description Logic Handbook”. Fernandez, M. Gomez-Perez, A. Juristo, H. (1997) “ Methontology: from ontological art twards ontological engineering”. Flores, C., D. Bez, M.,R. Respicio, A. Fonseca, J., M. (2012) “Training Clinical Decision-Making through Simulation”. Humphreys, B., L. Lindberg, D., A., B. (1993) “The UMLS project: making the conceptual connection between users and the information they need”. Bulletin of the Medical Library Association. NCBO. BioPortal. (2011) “The National Center for Biomedical Ontology”. http://bioportal.bioontology.org/, Agosto. Noy, F., N. Guinness, D., L, (2001) “Ontology development 101: a guide to create your first ontology”. Swartout, B. Patil, R. Knight, K. e Russ, T. (1996) “Toward Distributed Use of Large- Scale Ontologies”. Price, C. Spackman, K. SNOMAD. (2000) BJHC&IM-British Journal of Healthcare Computing & Information Management. Reed S., L. Lenat B., D. (2002) “Mapping Ontologies into Cyc”. Wagner, H., L. Pinto, M., E., B. Klafke, A. Ramos, A. Stein, A., T. Castro Filho, E., D. (2012) “Diagnóstico e tratamento das cefaleias em adultos na atenção primária à saúde”. http://www.sbmfc.org.br/media/file/diretrizes/cefaleia.pdf, Janeiro. 277