Proposta de uma ontologia para o sistema eleitoral brasileiro Jefferson de Oliveira Chaves1 , José Leomar Todesco1 1 Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento Universidade Federal de Santa Catarina (UFSC) Florianópolis, SC – Brasil jefferson.chaves@ifc.edu.br, tite@egc.ufsc.br Abstract. The present work was a construction of an ontology for the represen- tation of the Brazilian electoral structure, in order to allow the sharing of com- mon knowledge about it. Furthermore, the Ontology Development 101 metho- dology, OntoKEM and Protégé applications was used as tools to support the development process. The results of the tests allowed a holistic understanding of the designated domain, as well as providing potential use by different areas, as a tool for creating new knowledge. Resumo. O presente trabalho apresenta uma proposta de ontologia para o sis- tema eleitoral brasileiro, de forma a possibilitar o compartilhamento de um entendimento comum acerca da mesma.. Para tal, foram utilizadas a metodo- logia Ontology Development 101 e as aplicações OntoKEM e Protégé, como ferramentas de apoio ao processo de desenvolvimento. Os resultados obtidos possibilitaram a compreensão, de forma holı́stica, do domı́nio proposto, além de indicar potencial para sua utilização por distintas áreas, como instrumento para criação de novos conhecimentos. 1. Organização e estrutura do processo eleitoral brasileiro A eleição é um processo de escolha coletiva em que são eleitos os representantes da população para os Poderes Executivo e Legislativo, de acordo com o sistema eleitoral. Este, por sua vez, consiste num conjunto “estruturado e funcional de regras, instrumentos e mecanismos para conferir, de forma legı́tima, mandato polı́tico aos representantes do povo (...)” (AZEVEDO, 2014, p. 187). A escolha dessa representação é definida pelo voto secreto e direto, no qual o cidadão manifesta sua escolha, de forma individual, no ato de votação. No Brasil, as eleições são realizadas empregando-se dois sistemas eleitorais distin- tos: o majoritário, utilizado nas eleições para o Executivo e o Senado Federal, e o propor- cional, utilizado para as eleições do Legislativo 1 (TORRES, 2014). A estrutura eleitoral ainda é composta por uma série de componentes e variáveis, tais como a existência de partidos e coligações; a própria adoção de dois sistemas eleitorais, que por sua vez pode ser dividido em subsistemas; a presença do cálculo de quociente eleitoral para as eleições de Legislativo e as configurações de seções e zonas eleitorais. Além disso, dados relacionados às eleições, tais como o quociente eleitoral par- tidário, o número de comparecimentos, votação por candidato e o próprio resultado da 1 Informações adicionais podem ser encontradas na plataforma de produção de análises e de dados sobre o pleito eleitoral, do Instituto de Estudos Sociais e Polı́ticos, da UERJ: Copyright © 2019 for this paper by its authors. Use permitted under Creative Commons License Attribution 4.0 International (CC BY 4.0). eleição, embora encontrados com relativa facilidade, muitas vezes são apresentados em formatos não estruturados, não computacionalmente interpretáveis, ou não ontológicos2 . Assim, este trabalho propõe-se a construir uma ontologia para representar o sis- tema eleitoral brasileira, com o intuito de promover o compartilhamento de um enten- dimento comum acerca da organização e dos componentes envolvidos em uma eleição, além da relação entre estes componentes. Para tal, após esta introdução, a segunda seção tratará, de forma pormenorizada, do problema em questão. Na terceira seção será apresentada a ontologia da eleição. Por sua vez, na quarta seção apresentaremos a metodologia utilizada para o desenvolvimento da ontologia. Já a quinta seção apresentará os resultados e, por fim, serão apresentadas as considerações finais. 2. Estrutura eleitoral brasileira A complexidade inerente ao processo eleitoral, associado ao desafio gerado pelo fato de que os dados relacionados às eleições, muitas vezes, não estão adequados ao pro- cessamento computacional, acaba por gerar inconvenientes em sua coleta, modelagem, padronização, consumo e combinação com outros conjuntos de dados, impactando o uso dos mesmos e, consequentemente, a produção de conhecimento acerca deles. De acordo com Isotani e Bittencourt (2015), isso demonstra a importância que, tanto a representação e a estruturação, quanto a conexão entre conjuntos de dados distintos possuem no pro- cesso de recuperação e produção de novos conhecimentos. Esse problema, poderia ser mitigado, por meio da utilização de representações mais robustas, tais como o uso de ontologias. Dessa forma, este trabalho tem o objetivo de propor uma ontologia cujo domı́nio de interesse é a eleição. Para tal, sua construção baseou-se, principalmente, nos dados de resultados das eleições disponı́veis no portal de dados do governo federal3 . Foram combinados os dados dos arquivos contendo a votação nominal por municı́pio e zona, votação do partido por municı́pio e zona, votação por seção eleitoral, detalhe da apuração por municı́pio e zona e, detalhe da apuração por seção eleitoral. Pretende-se que esta ontologia possa ser utilizada para comunicação e comparti- lhamento do conhecimento, uma vez que possibilitará práticas referentes à compreensão dos conceitos da estrutura eleitoral brasileira. Além disso, será possı́vel utilizá-la para integração de conhecimento, isto é, viabilizar a integração com outros conjuntos de da- dos, além de permitir que sejam executadas tarefas que visam a produção de novos co- nhecimentos (MIKA; AKKERMANS, 2004). 3. Metodologia e processo de desenvolvimento O desenvolvimento desta ontologia, baseou-se nos processos estabelecidos na Ontology Development 101 e nos métodos empregados em ontologias já consolidadas, tais como Linked Data Workflow Project Ontology. Como ferramentas de apoio ao desenvolvi- mento, foram as utilizadas a plataforma online OntoKEM e a aplicação Protégé em sua versão 5.2.0. 2 Leia-se como não estruturado e não interpretáveis, notı́cias em sites, infográficos, mapas e etc. (ISOTANI; BITTENCOURT, 2015). 3 Portal: . A Ontology Development 101 estabelece os seguintes processos para desenvolvi- mento de uma ontologia: determinar escopo; considerar reuso; enumerar termos; definir classes; definir propriedades; definir restrições e, criar instâncias. Esses processos, foram agrupados em três atividades principais: i) especificação da ontologia; ii) aquisição do conhecimento, e iii) implementação. Cabe ressaltar que este não foi um processo sequen- cial, mas sim iterativo. A atividade de especificação buscou responder as seguintes perguntas: a. Qual o propósito da ontologia? Esta ontologia tem como propósito modelar a estrutura eleitoral brasileira, com o intuito de prover o compartilhamento de um entendimento comum acerca da organização e dos componentes envolvidos em uma eleição. b. Qual o escopo da ontologia? Domı́nio Eleitoral Brasileiro, exceto as eleições municipais. c. Quais fontes de conhecimento e reuso podem ser aplicadas a esta ontologia? Foram identificas como fonte de conhecimento a ontologia Friend of a Friend (FOAF) por já possuir definição de conceitos utilizados pela ontologia, tais como Agent, Person e Organization, e o Repositório de dados eleitorais, disponibilizado pelo Tribunal Superior Eleitoral (TSE). A atividade de aquisição do conhecimento envolveu processos para conceitualização e formalização da ontologia. Como suporte à realização desta ta- refa, a ferramenta OntoKEM apresentou-se como sendo de grande valia, uma vez que permitiu o cadastro de perguntas de competência, a identificação dos termos e relações e, sua posterior classificação. Esta etapa teve como primeira atividade a realização de perguntas de competência, quais sejam: i. Como está configurada a estrutura das eleições majoritárias brasileiras? ii. Quais são os cargos polı́ticos de uma eleição federal/estadual? iii. Como são definidas as zonas eleitorais e as seções eleitorais? iv. Quais são os candidatos de uma determinada eleição? v. O que são os partidos e coligações? vi. Quais os candidatos mais votados em uma determinada localidade? Como resultado desta etapa, foram obtidos os seguintes termos, separados entre verbos e substantivos: bypass frame =] Substantivos: Eleição; Presidente; Governador; Senador; Deputado Federal; De- putado Estadual; Partido; Sigla; Legenda; Posicionamento polı́tico; Candidatos; nome; nome de candidato; número; âmbito (municı́pio, estado, pais); poder (exe- cutivo, legislativo, judiciário); Eleitor; Zona Eleitoral; Municı́pio; Seção; eleito- rado; abstenção; Turno; ano; coligação; localização Estado; Endereço; logradouro; número; bairro; Votação; Voto por seção; votos brancos; nulos; anulados; voto por candidato; votos válidos; Local de votação. Verbos: votar; está em; faz parte de; concorrer; vota para; justifica. Alguns termos encontrados, puderam ser reutilizados da ontologia FOAF: Agent, Group, Organization, Person e name. Posteriormente, foram conceitualizadas as principais classes, bem como foram identificadas as propriedades de dados e objetos utilizando-se a OntoKEM. Após essa etapa, o projeto foi exportado do OntoKEM para o Protégé, um editor ontológico consoli- dado, gratuito e de código aberto. Isso se deu ao fato de o Protégé apresentar ferramentas mais robustas para se lidar com a ontologia. Com a ontologia carregada no Protégé, definiu-se a hierarquia de classes e suas relações, mapeou-se as propriedades de dados e as propriedades de objetos das classes. As propriedades, tanto de dados, quanto de objetos foram refinadas. A terceira atividade, de implementação da ontologia, concentrou-se na criação das instâncias e na valoração das propriedades das classes. Para tal, foi utilizado o plugin Cellfie, disponı́vel para o Protégé. O plugin permite que dados no formato .csv sejam importados, automatizando-se assim, o processo de criação das instâncias, por meio de scripts escritos usando a Manchester OWL Syntax. Uma quarta etapa, de verificação da ontologia foi realizada e é descrita na seção de resultados. 3.1. Definição das classes e seus relacionamentos A ontologia construı́da é composta por 28 classes: Âmbito, Poder, Cargo, Eleição, Turno, Voto, Seção, Zona Eleitoral, Municı́pio, Estado, Local de Votação. Ainda foram criadas as subclasses Deputado Estadual, Deputado Federal, Governador, Presidente e Senador como subclasse de Cargo, Coligação, como subclasse de foaf:Group, Partido como sub- classe de foaf:Organization, Candidato e Eleitor, como subclasse foaf:Person, Executivo e Legislativo como subclasse de Poder e as classes Voto Candidato e Voto Seção, como subclasse da classe Voto. As classes foram modeladas de forma que pudessem ser representados os resulta- dos das eleições para qualquer âmbito, para qualquer cargo, em qualquer sistema eleitoral. Essa representação genérica, foi realizada apoiando-se nos conjuntos de dados de eleições do Governo Federal. As classes Municı́pio e Estado embora não sejam pilares da onto- logia, tem fundamental importância, pois irão permitir a relação com outras ontologias. Uma visão geral da ontologia pode ser vista na Figura 1. Propriedades de dados e algumas propriedade de objetos (relações) foram ocultadas em face a legibilidade. Figura 1. Uma visão geral da ontologia modelada A ontologia aqui desenvolvida, pode ser classificada: i) quanto a sua hierarquia, como uma ontologia de domı́nio - definindo e caracterizando o domı́nio, mas o suficiente- mente flexı́vel para que possam ser aplicados em outros domı́nios (GUARINO, 1998); ii) quanto a sua expressividade, pode ser classificada como uma ontologia de maior expres- sividade (GÓMEZ-PÉREZ; CORCHO, 2002) e, iii) quanto ao conteúdo representado, como sendo para modelagem de conhecimento (HEIJST; SCHREIBER; WIELINGA, 1997). A ontologia completa, um mapa mental usado para uma representação gráfica, bem como o roteiro e os scripts usados para se criar as instâncias da ontologia, podem ser encontrados no repositório4 online criado para este trabalho. 4. Resultados Neste trabalho construiu-se uma ontologia do sistema eleitoral brasileiro. Sua modela- gem, realizada a partir da combinação de conjuntos dados isolados em uma ontologia, permitiram o compartilhamento de um entendimento comum acerca da organização e dos componentes envolvidos. A utilização do mecanismo de inferência Pellet, componente do Protégé, permitiu que inconsistência fossem verificadas, além de computar automati- camente outras classes e axiomas. As questões de competência, bem como outras questões puderam ser respondidas pelas próprias instâncias da ontologia, como por exemplo o número de votantes por seção, a quantidade de votos brancos e nulos por seção, ou o número de eleitores que votaram em determinado candidato. Além disso, conforme um dos objetivos estabelecidos, modelar a ontologia em uma linguagem formal, neste caso OWL-DL, permitiu a identificação dos conceitos da estrutura eleitoral, bem como suas propriedades e relações, inserindo semântica a essa representação. Assim, esta ontologia apresenta um total de 28 classes, 30 propriedades de objetos, mais de 30 propriedades de dados e mais de 17 mil instâncias de classes. Isso, resultou em mais de 124 mil axiomas. Por fim, com o intuito de confrontar a aplicabilidade da ontologia, foram formu- ladas duas questões, quais sejam: a) qual a quantidade de eleitores de um determinado municı́pio? b) qual o candidato a Governador mais votado em Santa Catarina? As Figuras 2 e 3 trazem, respectivamente, as consultas SPARQL que respondem a essas perguntas. Figura 2. consulta em resposta a questão a 4 Repositório online para o projeto: . Figura 3. consulta em resposta a questão b 5. Considerações Finais Este trabalho buscou construir uma ontologia para representação do sistema eleitoral bra- sileiro. Embora, tenham sido encontrados alguns problemas de ordem técnica, foi possı́vel obter respostas para distintas perguntas no que diz respeito à estrutura eleitoral brasileira. Percebeu-se potencial para a utilização desta ontologia, por diversas áreas de conheci- mento, de forma a possibilitar a construção de análises consoantes com a realidade. As- sim, a partir disso, novos conhecimentos poderão ser construı́dos. Como trabalhos futuros poderão ser construı́das ontologias que possibilitem a importação dos dados para além do estado de Santa Catarina. Ainda, espera-se adici- onar dados com perfil do eleitor a esta ontologia, compreendendo que esta faz parte deste domı́nio. Referências AZEVEDO, R. F. de B. C. Um modelo ontológico do sistema eleitoral brasileiro. Facul- dade de Ciência da Informação, Universidade de Brası́lia, 2014. 208 p. Dissertação (Mestrado em Ciência da Informação). Disponı́vel em: hhttp://repositorio.unb.br/ bitstream/10482/17303/1/2014 RafaelFernandesdeBarrosCostaAzevedo.pdfi. Acesso em: 29 out. 2018. GÓMEZ-PÉREZ, A.; CORCHO, O. Ontology languages for the semantic web. IEEE Intelligent systems, IEEE, v. 17, n. 1, p. 54–60, 2002. GUARINO, N. Formal ontology in information systems: Proceedings of the first interna- tional conference (FOIS’98), June 6-8, Trento, Italy. [S.l.]: IOS press, 1998. v. 46. HEIJST, G. V.; SCHREIBER, A. T.; WIELINGA, B. J. Using explicit ontologies in kbs development. International journal of human-computer studies, Elsevier, v. 46, n. 2-3, p. 183–292, 1997. ISOTANI, S.; BITTENCOURT, I. I. Dados Abertos Conectados: Em busca da Web do Conhecimento. [S.l.]: Novatec Editora, 2015. MIKA, P.; AKKERMANS, H. Towards a new synthesis of ontology technology and knowledge management. The Knowledge Engineering Review, Cambridge University Press, v. 19, n. 4, p. 317–345, 2004. TORRES, D. Sistemas eleitorais brasileiros. Revista Eletrônica da EJE: ano 4, n. 4 (jun./jul. 2014), Tribunal Superior Eleitoral, 2014. Acesso em: 29 out. 2018.