<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Mineração de Dados Educacionais Aplicada à Identificação de Variáveis Associadas à Evasão e Retenção</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Diego da Costa do Couto</string-name>
          <email>diegocouto@ufpa.br</email>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Ádamo Lima de Santana</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Laboratório de Inteligência Computacional e Pesquisa Operacional (LINC) - Universidade Federal do Pará (UFPA) Caixa Postal 479 - 66.</institution>
          <addr-line>075-110 - Belém - PA -</addr-line>
          <country country="BR">Brasil</country>
        </aff>
      </contrib-group>
      <pub-date>
        <year>2017</year>
      </pub-date>
      <fpage>333</fpage>
      <lpage>344</lpage>
      <abstract>
        <p>This paper applies classification algorithms in a large database with the purpose of diagnosing the causes of two problems faced in Brazilian universities, college dropout and retention. The accuracies of many algorithms were measured with a focus on verifying the ability to correctly classify available instances. Results showed that the Bayesian Network method reached an overall precision approximately 86% and it is considered a very satisfactory solution for the discovery and representation of knowledge about academic performance of undergraduate students, especially those who are willing to give up or extrapolate the deadline for completing to the course. Resumo. Este artigo aplica algoritmos de classificação em uma grande base de dados com finalidade de diagnosticar as causas de dois problemas enfrentados em universidades brasileiras, a evasão e a retenção. Foram mensuradas acurácias de diversos algoritmos com foco em verificar a capacidade de classificar corretamente as instâncias disponíveis. Os resultados apontaram que o método Rede Bayesiana atingiu precisão geral de aproximadamente 86% sendo considerada uma solução bastante satisfatória para descoberta e representação do conhecimento acerca do desempenho acadêmico dos alunos da graduação, especialmente aqueles propensos a desistir ou extrapolar o prazo para conclusão do curso.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>1. Introdução</title>
      <sec id="sec-1-1">
        <title>Os levantamentos realizados pelo Instituto Nacional de Estudos e Pesquisas</title>
      </sec>
      <sec id="sec-1-2">
        <title>Educacionais Anísio Teixeira (INEP), formatados no Censo da Educação Superior, também apontam descompasso entre os números de matrícula, ingressantes, cursos e 333</title>
        <p>
          concluintes. Constata-se que houve queda no número de concluintes em todas as
organizações acadêmicas, representando redução de 6,4% para as faculdades, 6,8% em
relação aos centros universitários, 4,4% tendo em conta as universidades e 26,0%
considerando Institutos Federais (IFs) e Cefets [
          <xref ref-type="bibr" rid="ref10 ref9">INEP 2014</xref>
          b]. Essas informações
denotam um importante diagnóstico: o aumento na quantidade de vagas não está
impactando diretamente na permanência do aluno até a sua formatura. Esta
problemática, conhecida como evasão resulta em vagas ociosas ou remanescentes, as
quais se destinam a outros processos de seleção.
        </p>
      </sec>
      <sec id="sec-1-3">
        <title>O Programa de Apoio a Planos de Reestruturação e Expansão das Universidades</title>
      </sec>
      <sec id="sec-1-4">
        <title>Federais (REUNI), instituído pelo Decreto no 6.096, de 24 de abril de 2007 [Governo</title>
      </sec>
      <sec id="sec-1-5">
        <title>Federal 2007], torna explícita em suas diretrizes gerais [MEC 2007] a preocupação do</title>
        <p>
          Governo Federal acerca do problema da evasão, sob a asserção “os índices de evasão de
estudantes nos cursos de graduação atingem, em alguns casos, níveis alarmantes”. Outra
medida adotada pelo Governo Federal brasileiro foi a Lei Nº 12.089 de novembro de
2009 [
          <xref ref-type="bibr" rid="ref7">Governo Federal 2009</xref>
          ], a qual proíbe a ocupação de duas vagas,
simultaneamente, pela mesma pessoa em cursos de graduação de instituições públicas
do ensino superior. Infere-se que a lei visa minimizar os casos nos quais discentes, por
desinteresse ou vários outros motivos, abandonem um dos cursos ou demorem mais que
o tempo normal para concluírem os estudos, sendo este último fenômeno chamado de
retenção.
        </p>
        <p>
          Segundo [
          <xref ref-type="bibr" rid="ref20">Silva Filho et al. 2007</xref>
          ] a evasão estudantil no ensino superior, de modo
geral, causa desperdícios de ordem social, acadêmica e econômica. Os reflexos deste
entrave no setor público de ensino se manifestam quando os recursos são aplicados sem
o devido retorno à sociedade. Enquanto que no ramo privado, os empresários perdem
receitas e aumentam os gastos com manutenção de infraestrutura de ensino. Em ambos
os casos, a evasão implica em ociosidade de professores, funcionários, equipamentos e
espaços físicos. A desistência tem consequências diretas no cotidiano do estudante,
visto que este não consegue a qualificação necessária para atuar na área pretendida e,
em outros casos, não retorna à IES em busca de novas oportunidades. Segundo os
pontos de vista dos autores [
          <xref ref-type="bibr" rid="ref21">Tinto 1975</xref>
          ], [
          <xref ref-type="bibr" rid="ref22">Tinto 1987</xref>
          ] e [Andriola 2009], as causas da
evasão emanam da falta de integração com ambiente acadêmico e social da instituição.
        </p>
        <p>Considerando que os problemas da evasão e retenção possuem inúmeras causas e
consequências negativas para estudantes, instituições de ensino e comunidades nas
quais esses indivíduos estão inseridos, este trabalho tem como objetivo a criação de
subsídios que auxiliem gestores da instituição de ensino superior a identificar alunos,
dos cursos de graduação, em situação de vulnerabilidade à evasão ou à retenção dentro
dos seus ambientes de aprendizagem. Dentre os subsídios importantes à gestão,
destacam-se: previsão de quais alunos são propensos a desistir ou permanecer além do
tempo estipulado pelo currículo; representação desta informação; e identificar quais
atributos, dentre os disponíveis, são mais relevantes durante a classificação desse aluno.</p>
      </sec>
      <sec id="sec-1-6">
        <title>Pretende-se alcançar estes objetivos pela utilização da Descoberta de</title>
      </sec>
      <sec id="sec-1-7">
        <title>Conhecimento em Base de Dados (Knowledge Discovery in Database – KDD) que</title>
        <p>
          representa um “processo não-trivial de extração de informações implícitas, previamente
desconhecidas e potencialmente úteis a partir de dados” [
          <xref ref-type="bibr" rid="ref4">Frawley et al. 1992</xref>
          ]. Uma das
suas etapas, denominada de Mineração de Dados (Data Mining) [
          <xref ref-type="bibr" rid="ref3">Fayyad et al. 1996</xref>
          ],
onde ocorre a extração de padrões dos dados através do uso de algoritmos específicos,
foi empregada para verificar a relação entre as variáveis e a problemática explicitada. A
etapa de Data Mining pode ser aplicada em diversas áreas [
          <xref ref-type="bibr" rid="ref8">Han et al. 2012</xref>
          ]
[
          <xref ref-type="bibr" rid="ref5">Goldschmidt e Passos 2005</xref>
          ] [
          <xref ref-type="bibr" rid="ref12">Luo 2008</xref>
          ] [
          <xref ref-type="bibr" rid="ref3">Fayyad et al. 1996</xref>
          ] desde que estas possuam
razoáveis volumes de dados históricos.
        </p>
        <p>
          Foram testados algoritmos, durante a etapa de Data Mining, a partir da tarefa de
classificação, que define-se como “o processo de atribuir, a uma determinada
informação recebida, o nome de uma classe à qual ela pertence” [Rich e Knight 1993]
ou ainda constrói um modelo ou classificador [
          <xref ref-type="bibr" rid="ref8">Han et al. 2012</xref>
          ]. Dentro do contexto
aplicado, a classificação permite presumir a situação (classe) do estudante na
universidade, dado um conjunto de atributos a respeito desse aluno. Avaliaram-se
métricas relativas ao desempenho dos classificadores, cujas características possam
atender aos requisitos associados ao objetivo deste trabalho, com o intuito de testá-los e,
posteriormente, selecioná-los à resolução do problema pesquisado.
        </p>
      </sec>
      <sec id="sec-1-8">
        <title>Este trabalho está organizado da seguinte forma: A Seção 2 apresenta os trabalhos correlatos. Por sua vez, na Seção 3 é apresentada a base de dados utilizada neste trabalho. Na Seção 4 será apresentada proposta de aplicação. Em seguida, Seção 5 serão discutidos os resultados. Na Seção 6 apresentação das considerações finais.</title>
      </sec>
    </sec>
    <sec id="sec-2">
      <title>2. Trabalhos Correlatos</title>
      <sec id="sec-2-1">
        <title>O sítio [JEDM 2016] define Mineração de Dados Educacionais (Educational Data</title>
      </sec>
      <sec id="sec-2-2">
        <title>Mining – EDM) como uma disciplina emergente cujo objetivo está no desenvolvimento</title>
        <p>
          de métodos para explorar os dados provenientes de cenários educacionais e como essas
metodologias são empregadas para compreender os alunos nos seus ambientes de
aprendizagem. Argumenta-se a existência de um aumento considerável no interesse por
pesquisas valendo-se de EDM [
          <xref ref-type="bibr" rid="ref19">Sachin e Vijay 2012</xref>
          ], nesta perspectiva, [Romero e
        </p>
      </sec>
      <sec id="sec-2-3">
        <title>Ventura 2010] elaboraram um trabalho relativo ao estado da arte da Mineração de</title>
      </sec>
      <sec id="sec-2-4">
        <title>Dados Educacionais, no qual são discutidas 235 publicações mais relevantes até o ano de 2009. Os autores verificaram crescimento exponencial no número de publicações ao longo dos últimos anos, destacando o aparecimento de jornais e edições de livros especializados no assunto.</title>
        <p>[Baker et al. 2011] ratificam os argumentos supramencionados, afirmando, em
adição, que a área de EDM vem crescendo rapidamente em países da Europa e nos
EUA, salientando ainda o fortalecimento das pesquisas no Brasil durante a última
década. Destas constatações, deduz-se que a comunidade científica está cada vez mais
interessada nesse campo emergente de investigação, o que o torna tendência promissora
de investimentos e pesquisas em âmbito científico e acadêmico [Baker 2009].</p>
        <p>
          [
          <xref ref-type="bibr" rid="ref2">Cortez e Silva 2008</xref>
          ] obtiveram dados no período letivo de 2005 e 2006 de
escolas públicas de Portugal. Os atributos constituíram-se de registros coletados de
relatórios emitidos pelo sistema escolar e questionários com perguntas sobre aspectos
sociais, demográficos e emocionais dos estudantes. A finalidade dos autores era
predizer o desempenho escolar nas disciplinas básicas de Matemática e Português. Os
autores trabalharam com três metodologias: classificação binária, multi-classe e
regressão. Os algoritmos testados foram Árvore de Decisão (Decision Tree – DT),
        </p>
      </sec>
      <sec id="sec-2-5">
        <title>Random Forest, Redes Neurais Artificiais (RNA) e Support Vector Machine (SVM). Os resultados atingidos foram satisfatórios, a exemplo, para o teste com classes binárias a 335</title>
        <p>
          árvore de decisão conseguiu a melhor taxa de acerto (93, 0%). [
          <xref ref-type="bibr" rid="ref2">Cortez e Silva 2008</xref>
          ]
priorizaram a geração de conhecimento especialista, os autores descobriram importantes
regras das árvores de decisão.
        </p>
        <p>
          No Brasil, as investigações em Mineração de Dados Educacionais se consolidaram
em 2012, na ocasião, [
          <xref ref-type="bibr" rid="ref13">Manhães et al. 2012</xref>
          ] elaboraram um estudo de caso para avaliar a
evasão em 155 cursos de graduação ofertados por 28 unidades da UFRJ. Para a pesquisa
em discussão, foram selecionados dados acadêmicos dos discentes que ingressaram nos
dois semestres letivos dos anos de 2003 e 2004. Além da acurácia, a interpretabilidade
dos resultados foi um dos requisitos considerados à escolha do método apropriado para
solucionar a problemática. Neste contexto, o classificador Naive Bayes foi escolhido,
pois conseguiu atingir precisão global superior a 80%. As contribuições da pesquisa
citada também foram publicadas com outros resultados e métodos de avaliações em
[
          <xref ref-type="bibr" rid="ref13 ref14">Manhães et al. 2014</xref>
          b] [
          <xref ref-type="bibr" rid="ref13 ref14">Manhães et al. 2014</xref>
          a,
          <xref ref-type="bibr" rid="ref15">Manhães et al. 2015</xref>
          ].
        </p>
        <p>O nosso trabalho, proposto neste artigo, possui similaridades com aqueles
discutidos anteriormente, visto que, por exemplo, vale-se de algoritmos classificadores
para detecção de um padrão que classifique às instâncias corretamente quanto à evasão
e retenção em âmbito acadêmico. Contudo diferencia-se dos demais nos seguintes
aspectos: i) aplicação em uma grande base de dados, composta por quase 100 mil
amostras, pois a maioria dos trabalhos usam data sets com algumas centenas de
registros; ii) análise sobre todos os cursos de graduação, enquanto muitos trabalhos
avaliam cursos ou disciplinas de maneira isolada. Além disso, este trabalho visa
fortalecer o campo de EDM, uma vez que esta área é nova, há poucos estudos nacionais
e exerce grande influência na resolução de problemas atrelados ao desempenho escolar.</p>
      </sec>
    </sec>
    <sec id="sec-3">
      <title>3. Base de Dados</title>
      <sec id="sec-3-1">
        <title>O Sistema Integrado de Gestão de Atividades Acadêmicas (SIGAA) é parte dos</title>
      </sec>
      <sec id="sec-3-2">
        <title>Sistemas Institucionais Integrados de Gestão (SIG) e informatiza os procedimentos da</title>
        <p>área acadêmica através de módulos como: graduação, pós-graduação (stricto e lato
sensu), ensino técnico, entre outros. O SIGAA foi adquirido pela Universidade Federal
do Pará (UFPA), por meio de um contrato firmado com a Universidade Federal do Rio</p>
      </sec>
      <sec id="sec-3-3">
        <title>Grande do Norte (UFRN), além disso, outras Instituições Federais de Ensino Superior (IFES) e Institutos Federais (IF) também adquiriram o produto a fim de promover integração entre sistemas, processar dados e oferecer serviços da área fim através de interface web.</title>
        <p>Os dados selecionados à pesquisa são registros acadêmicos, oriundos do SIGAA,
referentes a 157.298 discentes dos cursos de graduação, ingressantes até o ano de 2016,
da Universidade Federal do Pará, totalizando 175.779 amostras. Desta quantidade, as
tuplas inconsistentes ou que continham valores nulos foram removidas, permanecendo
98.698 linhas. A Tabela 1 mostra os 31 atributos selecionados e os seus respectivos
significados.</p>
        <sec id="sec-3-3-1">
          <title>3.1. Pré-processamento e transformação de dados</title>
        </sec>
      </sec>
      <sec id="sec-3-4">
        <title>Os significados dos atributos de 1 a 12, considerados intuitivos, podem ser consultados nas descrições dispostas na Tabela 1. As variáveis de 13 a 19 representam os indicadores de rendimento acadêmico acumulado, a saber: Média de Conclusão (MC), 336</title>
      </sec>
      <sec id="sec-3-5">
        <title>Média de Conclusão Normalizada (MCN), Índice de Rendimento Acadêmico (IRA) ou</title>
      </sec>
      <sec id="sec-3-6">
        <title>Coeficiente de Rendimento Geral (CRG), Índice de Eficiência em Carga Horária</title>
        <p>(IECH), Índice de Eficiência em Períodos Letivos (IEPL), Índice de Eficiência</p>
      </sec>
      <sec id="sec-3-7">
        <title>Acadêmica (IEA) e Índice de Eficiência Acadêmica Normalizado (IEAN). Essas</title>
        <p>métricas quantificam o desempenho dos alunos da graduação e nos cálculos
consideram-se dados do histórico acadêmico, tais como: quantidades de reprovações,
aprovações, trancamentos, cargas horárias acumuladas e esperadas para integralização
do curso, entre outros. As fórmulas para cálculo desses indicadores e os seus respectivos
significados estão dispostos no Regimento da Graduação da Universidade Federal do</p>
      </sec>
      <sec id="sec-3-8">
        <title>Rio Grande do Norte [UFRN 2013].</title>
        <p>Tabela 1. Atributos selecionados à pesquisa
Nº Variável
1 sexo
idade
interior
turno
2
3
4
5
6
7
forma_ingresso
numero_trancamento
numero_vinculos
8-10perc_ch_{tipo}
11 sem_ordem
12 primeiro_semestre_ocorr
1139- indices_academicos
2202- prob_indices
2330- perc_{conceito}_{avaliacao}
31 status
Descrição
Sexo que o discente pertence
Idade que o aluno ingressou no curso
Informa se o discente estuda no campus capital ou em um
dos campi do interior do estado
Turno no qual o discente estuda
Forma de seleção pela qual o discente ingressou na
universidade
Número de vezes que o discente trancou a matrícula
Número de vezes que o discente fez outras graduações
(vínculos) até o ingresso no curso atual
Percentual das cargas horárias prática, teórica e de estágio
O percentual das disciplinas cursadas fora da ordem
proposta pelo currículo do discente
Informa qual o semestre que o discente cursou pela
primeira vez uma disciplina fora de ordem
Representam os indicadores de desempenho acadêmico
Refere-se a probabilidade de um discente formado nos
últimos 5 anos possuir índice acadêmico maior ou igual ao
aluno avaliado
Refere-se ao percentual de um conceito conseguido pelo
discente dentro do período avaliado</p>
        <p>Denota a situação (classe) a qual o estudante pertence</p>
      </sec>
      <sec id="sec-3-9">
        <title>Os atributos de 20 a 22 denotam a probabilidade de um discente formado nos</title>
        <p>últimos cinco anos possuir um dos índices acadêmicos igual ou superior aos demais
alunos pertencentes ao mesmo curso e matriz curricular. Foram usados os indicadores</p>
      </sec>
      <sec id="sec-3-10">
        <title>MC, IRA e IEA, uma vez que estes, em suas definições matemáticas e conceituais, aferem a eficiência do aluno durante o seu percurso acadêmico.</title>
      </sec>
      <sec id="sec-3-11">
        <title>A média das notas obtidas pelo estudante em cada disciplina, em um período</title>
        <p>letivo, é convertida em conceito, definido segundo a escala apresentada na Tabela 2. As
variáveis indexadas de 23 a 30 referem-se ao percentual de um determinado conceito de
acordo com o período de avaliação, seja este geral (acumulado por todo o curso) ou para
o primeiro ano cursado. Por exemplo, a variável perc_ins_primeiro_ano denota o
percentual de conceitos do tipo INS referente ao primeiro ano de graduação.</p>
      </sec>
      <sec id="sec-3-12">
        <title>Finalmente, o atributo 31 representa a classe à qual o discente pertence, cujos</title>
        <p>possíveis valores são: “Formado”, “Evadido” e “Retido”. Os alunos considerados na
classe “Formado” são aqueles que conseguiram integralizar a carga horária prevista pelo
curso. Por sua vez, o rótulo “Evadido” remete-se aos alunos que, por decisão própria ou
processo de prescrição previsto em regimento da instituição, abandonaram a graduação.</p>
      </sec>
      <sec id="sec-3-13">
        <title>Os estudantes com matrículas ativas no SIGAA, porém que ultrapassaram um ano do</title>
        <p>prazo de conclusão estabelecido no currículo do curso foram classificados como
“Retido”. Existem na base de dados 65.758 (66,63%) amostras referentes a classe dos
alunos formados; 25.581 (25,92%) dos registros, pertencem aqueles que desistiram dos
estudos; e por fim, os alunos em retenção são menos representativos, 7.359 (7,46%).</p>
        <p>Tabela 2. Correspondência entre a média das notas e o conceito</p>
        <p>Conceito</p>
      </sec>
      <sec id="sec-3-14">
        <title>Insuficiente (INS)</title>
      </sec>
      <sec id="sec-3-15">
        <title>Regular (REG)</title>
        <p>Bom (BOM)</p>
      </sec>
      <sec id="sec-3-16">
        <title>Excelente (EXC)</title>
        <sec id="sec-3-16-1">
          <title>Intervalo da média</title>
          <p>[0-4,99]
[5-6,99]
[7-8,99]
[9-10]</p>
        </sec>
        <sec id="sec-3-16-2">
          <title>4. Aplicação Proposta</title>
          <p>Durante a etapa de Data Mining, foram testados algoritmos classificadores, a partir
disso analisou-se a precisão global (acurácia) de cada um deles, para finalmente
selecionar aquele que obteve uma taxa de acerto aceitável. Considerou-se ainda à
seleção do algoritmo dois critérios: a representação dos resultados e o quanto esta
informação pode ser interpretada por especialistas e usuários inseridos no domínio. Para
estas finalidades, a Rede Bayesiana se mostra uma importante ferramenta, pelos
seguintes aspectos: representação gráfica da relação entre estados; a rede expressa o
conhecimento especialista acerca do domínio; e os resultados numéricos
(probabilidades) podem ser visualizados através de gráficos.</p>
        </sec>
      </sec>
      <sec id="sec-3-17">
        <title>A estratégia utilizada para segmentar a base de dados em conjuntos de treinamento</title>
        <p>
          e testes, destinados a estimar precisão e confiabilidade do modelo construído pelo
classificador, foi a validação cruzada com k conjuntos estratificada (stratified k-fold
cross-validation), por ser uma das mais empregadas em mineração de dados [
          <xref ref-type="bibr" rid="ref8">Han et al.
2012</xref>
          ].
        </p>
        <p>
          Os algoritmos de aprendizado supervisionado [
          <xref ref-type="bibr" rid="ref17">Rezende 2005</xref>
          ] empregados nesta
pesquisa estão disponíveis na ferramenta de código aberto (open source)
          <xref ref-type="bibr" rid="ref25">Weka [Weka
2017</xref>
          ]. Os classificadores estão divididos de acordo com as seguintes abordagens:
árvores de decisão, probabilísticos, baseados em instâncias, baseados em funções e
redes neurais artificiais. A Tabela 3 apresenta todos os métodos experimentados, as
respectivas abordagens de construção do modelo e a configuração dos parâmetros de
execução.
        </p>
      </sec>
    </sec>
    <sec id="sec-4">
      <title>5. Resultados</title>
      <sec id="sec-4-1">
        <title>5.1. Análise de desempenho dos algoritmos</title>
        <p>
          A Tabela 4 apresenta os 9 algoritmos e as métricas usadas: tempos para treinar e testar
modelo, acurácia e coeficiente Kappa. Os resultados mostram que a melhor solução foi
conseguida através do indutor Random Forest cuja acurácia superou 87%, não obstante
o algoritmo Bayesian Network revelou precisão global próxima de 86% e tempos
aceitáveis para construção e testes do modelo, além disso este algoritmo obteve valor de
estatística Kappa igual a 0,6961, considerado um nível substancial de concordância
interobservador [
          <xref ref-type="bibr" rid="ref24">Viera e Garrett 2005</xref>
          ]. Destaca-se que aplicações nas quais o tempo de
processamento é considerado requisito crucial ao domínio, soluções como Multilayer
        </p>
        <sec id="sec-4-1-1">
          <title>Perceptron e SVM são consideradas inviáveis, embora apresentem boas taxas de acerto.</title>
          <p>Tabela 3. Abordagens para construção
classificadores e parâmetros de execução
dos
modelos,
algoritmos
Abordagens
Probabilístico
Probabilístico
Baseado em funções</p>
          <p>Algoritmos
Naive Bayes
Redes Bayesianas
(Bayesian Network)
Support Vector</p>
          <p>Machine (SVM)
Baseado em instâncias K-Nearest Neighbor
l(eInasrtnainncge)d-based (KNN)
K=1
Parâmetros
Não se aplica
Algoritmo de construção da rede: K2;
Máximo número de pais em cada nós 5
Função kernel gaussiana: exp(−γ ∗ |u-v|2);
C = 1;
γ = 1/k, seja k o número de instâncias.</p>
          <p>Redes Neurais
Artificiais
Árvores de Decisão
Tipo Backpropagation;</p>
          <p>Função de ativação sigmóide;
Multilayer Perceptron Número de épocas = 500;
Taxa de aprendizado = 0.3;
Momentum Rate = 0.2</p>
          <p>Mínimo de instâncias por folha = 2;
C4.5</p>
          <p>Limite de confiança para prunning = 25%
Árvores de Decisão</p>
          <p>Random Tree
Árvores de Decisão</p>
          <p>Random Forest
Árvores de Decisão</p>
          <p>Classification And
Regression Trees
(CART)</p>
          <p>Número de iterações = 100;
Profundidade máxima da árvore ilimitada;
Mínimo de instâncias por folha = 1
Número de iterações = 100;
Profundidade máxima da árvore ilimitada;
Mínimo de instâncias por folha = 1
Número máximo de instâncias em nós terminais
= 2</p>
        </sec>
        <sec id="sec-4-1-2">
          <title>Diferentemente do método Naive Bayes, por exemplo, que serve como um classificador natural, a rede Bayesiana necessita ter uma boa precisão para ser aplicado ao domínio, e os testes comprovaram a sua eficiência quando comparada às técnicas 339</title>
          <p>clássicas. A escolha pela rede Bayesiana é satisfatória aos objetivos desta pesquisa,
porquanto, neste experimento: não penalizou tempo de construção e testes do modelo;
demonstrou taxa de acerto adequada se confrontada as demais; e agrega conhecimento
especialista sobre o domínio em representação gráfica. Diante do exposto,
apresentamse, na Subseção 5.2, a geração da RB e o conhecimento extraído da própria topologia da
rede, por intermédio da inferência probabilística.</p>
          <p>Tabela 4. Métricas de desempenho geral dos classificadores</p>
          <p>Tempo para treino
(segundos)</p>
          <p>Tempo para teste
(segundos)</p>
          <p>Acurácia (%)</p>
          <p>Algoritmos
Naive Bayes
Bayesian Network
KNN
SVM
C4.5
Multilayer Perceptron
Random Tree
Random Forest
CART
0.31
6.77
0.29
1418.69
5.2. Análise da evasão e retenção via Redes Bayesianas</p>
        </sec>
        <sec id="sec-4-1-3">
          <title>Foram selecionados os 14 atributos mais relevantes, dispostos na Figura 1, além da</title>
          <p>
            classe (status), de acordo com ganho de informação [
            <xref ref-type="bibr" rid="ref8">Han et al. 2012</xref>
            ]. Após a redução
no número de variáveis, aferiu-se novamente a acurácia do algoritmo Bayesian
          </p>
        </sec>
        <sec id="sec-4-1-4">
          <title>Network, apresentando precisão de 83,5%, ratificando a sua robustez. O algoritmo de busca gulosa (greedy search) K2 [Cooper e Herskovits 1992] foi empregado para construção da topologia da rede, atingindo-se maior precisão global com o parâmetro de número esperado de pais por nó definido a 5.</title>
        </sec>
        <sec id="sec-4-1-5">
          <title>A Figura 1 mostra a rede Bayesiana resultante, as cores de fundo dos nodos</title>
          <p>estão diferentes com propósito de agrupar os tipos das variáveis conforme seus
significados no domínio de aplicação. Os elementos em laranja, verdes e azuis são
respectivamente, índices acadêmicos, probabilidades de o discente possuir o valor
índice acadêmico menor ou igual aos formados, e os percentuais avaliados para
determinado conceito (notas).</p>
        </sec>
        <sec id="sec-4-1-6">
          <title>A partir da rede apresentada na Figura 1, percebe-se que o desempenho</title>
          <p>estudante depende diretamente do número de trancamentos, do Índice de Eficiência
Acadêmico (IEA), da probabilidade em relação a este índice, e do percentual de
reprovações durante todo o curso. Com efeito, essas relações fazem sentido, uma vez
que o aumento do número de trancamentos e baixo IEA implica, consequentemente, em
uma elevação na probabilidade do índice (probabilidade_iea); isto é, o discente fica
abaixo da expectativa de conclusão dos estudos em tempo hábil, ou ainda de concluir do
curso. Vale destacar que, a partir da topologia apresentada, outras interpretações são
possíveis e válidas no contexto pesquisado.</p>
          <p>Kappa
0.5688
0.6961
0.6483
0.6999
0.7048
0.6984
0.5924
0.7118
Figura 1. Rede Bayesiana construída para analisar a evasão e retenção no
âmbito educacional</p>
        </sec>
        <sec id="sec-4-1-7">
          <title>Para a inferência Bayesiana, escolheram-se os atributos IEA (iea) e número de</title>
          <p>trancamentos (numero_trancamento). A Tabela 5 evidencia as probabilidades, em cada
categoria de estudantes, dadas evidências por classe (estado) dos atributos apresentados.</p>
        </sec>
        <sec id="sec-4-1-8">
          <title>Os estados, de todas as variáveis, foram conseguidos por intermédio da discretização com distribuição uniforme de frequência. Os atributos numero_trancamento e iea tiveram, respectivamente, três e quatro intervalos para conversão de dados contínuos em discretos, estas quantidades foram determinadas após análise dos dados.</title>
          <p>Tabela 5. Probabilidades das três classes de estudantes segundo a inferência
probabilística para os atributos IEA (iea) e número de trancamentos
(numero_trancamentos)
Classes de</p>
          <p>alunos
Formado
Retido
Evadido</p>
        </sec>
        <sec id="sec-4-1-9">
          <title>Os resultados na Tabela 5 mostram que o aumento do IEA e a redução do</title>
          <p>número de trancamentos são determinantes para o aluno concluir os estudos com êxito.</p>
        </sec>
        <sec id="sec-4-1-10">
          <title>Constata-se que o estudante que possui IEA superior a 7,975 e nenhum trancamento de</title>
          <p>matrícula possui aproximadamente 95% (0,946) de possibilidades para formar-se.
Notase que a ocorrência de 1 trancamento e índice de eficiência acadêmica de regular a bom
(6,435 a 7,975), constitui uma faixa limítrofe, pois estudantes nesta situação têm 67,5%
de serem diplomados. Após 1 trancamento os discentes, com desempenhos de bom a
excelente, possuem 44% (0,436) de chances para concluírem os estudos sem entrar em
situação de retenção.</p>
          <p>Os graduandos que não trancaram a matrícula e possuem índice de eficiência
acadêmica inferior a 3,95 apresentam 15,3% de chances à retenção. Dos resultados,
observa-se que um estudante tende a extrapolar o prazo de conclusão proposto em
currículo quando realiza 1 trancamento e possui um IEA entre 3,905 e 6,335. Estas
situações são, empiricamente, observáveis em ambientes universitários, geralmente os
alunos com baixo rendimento acadêmico (insuficiente ou regular) e que trancaram a
matrícula, extrapolam o tempo de permanência na graduação em decorrência do
acumulo de disciplinas o qual dificulta ainda mais a conclusão dos estudos.</p>
          <p>Inversamente ao fato notado aos estudantes formados, a redução do IEA e o
aumento do número de trancamentos são fortes indícios da evasão. Os resultados
obtidos evidenciam que há uma alta probabilidade (90,5%) de o aluno abandonar o
curso, caso realize mais de um trancamento da matrícula e tenha desenvolvido um IEA
insuficiente (3,95). Evidencia-se com um IEA maior que 3,95 e no máximo 1
trancamento, o discente possuirá probabilidade menor a 38% de abandonar a graduação,
uma situação tida segura para o discente concluir os estudos, ademais do risco da
retenção.</p>
        </sec>
      </sec>
    </sec>
    <sec id="sec-5">
      <title>6. Considerações Finais</title>
      <p>Esta pesquisa utilizou mineração de dados sobre uma base de dados com quase cem mil
registros acadêmicos dos discentes de graduação para entender as causas associadas ao
abandono dos estudos e a permanência além do prazo estipulado para conclusão do
curso. Neste trabalho foram testados nove algoritmos classificadores, sendo que o
método Random Forest, apresentou a melhor acurácia, superior a 87%. Contudo,
priorizou-se a escolha de um classificador capaz de possuir fácil representação de
resultados e que esta possa expressar o conhecimento do especialista sobre o domínio
estudado. Nessa perspectiva, o classificador Bayesian Network foi escolhido e, ratificou
sua escolha por também obter desempenho satisfatório, visto que sua precisão global
ultrapassou 85%.</p>
      <p>A Rede Bayesiana construída mediante o uso do método de buscas K2
viabilizou a extração de importantes conhecimentos a respeito dos problemas
analisados, permitindo a sua vinculação ao índice de eficiência acadêmica e a
interrupção da matrícula em período letivo. Os resultados alcançados não são
exaustivos, dessa forma outras pesquisas são necessárias para consolidar as respostas
acerca dos principais fatores ligados à evasão e retenção em âmbito universitário. Como
trabalhos futuros, serão realizadas novas investigações com atributos adicionais de
caráter socioeconômicos, fato que permitirá relacionar o desempenho acadêmico a
situações de vulnerabilidades sociais e, principalmente, quantificar o impacto dessa
dependência, o que propiciará aos gestores a criação de mecanismos eficazes de
combate à evasão e retenção.</p>
    </sec>
    <sec id="sec-6">
      <title>Referências</title>
      <sec id="sec-6-1">
        <title>Andriola, W. (2009). “Fatores associados à evasão discente na Universidade Federal do</title>
      </sec>
      <sec id="sec-6-2">
        <title>Ceará (UFC) de acordo com as opiniões de docentes e de coordenadores de cursos”. 342</title>
      </sec>
      <sec id="sec-6-3">
        <title>Revista Iberoamericana sobre Calidad, Eficacia y Cambio en Educación, 7(4):343356.</title>
      </sec>
      <sec id="sec-6-4">
        <title>Baker, R., Isotani, S., e Carvalho, A. (2011). “Mineração de Dados Educacionais:</title>
      </sec>
      <sec id="sec-6-5">
        <title>Oportunidades para o Brasil”. Revista Brasileira de Informática na Educação, 19(2):3-13.</title>
      </sec>
      <sec id="sec-6-6">
        <title>Baker, R. S. (2009). “Data Mining for Education”. International Encyclopedia of</title>
      </sec>
      <sec id="sec-6-7">
        <title>Education, 3.</title>
      </sec>
      <sec id="sec-6-8">
        <title>Através de Sistemas Baseados em Mineração de Dados: Uma Abordagem</title>
        <p>Quantitativa. In Simpósio Brasileiro de Sistemas de Informação, pages 468-479.</p>
      </sec>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          <string-name>
            <surname>Cooper</surname>
            ,
            <given-names>G. F.</given-names>
          </string-name>
          e
          <string-name>
            <surname>Herskovits</surname>
            ,
            <given-names>E.</given-names>
          </string-name>
          (
          <year>1992</year>
          ).
          <article-title>“A Bayesian Method for the Induction of Probabilistic Networks from Data”</article-title>
          . Mach. Learn.,
          <volume>9</volume>
          (
          <issue>4</issue>
          ):
          <fpage>309</fpage>
          -
          <lpage>347</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          <string-name>
            <surname>Cortez</surname>
          </string-name>
          , P. e
          <string-name>
            <surname>Silva</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          (
          <year>2008</year>
          ).
          <article-title>Using data mining to predict secondary school student performance</article-title>
          .
          <source>In Proceedings of 5th Annual Future Business Technology Conference</source>
          , pages
          <fpage>5</fpage>
          -
          <lpage>12</lpage>
          , Porto, Portugal.
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          <string-name>
            <surname>Fayyad</surname>
            ,
            <given-names>U. M.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>PiatetskyShapiro</surname>
          </string-name>
          , G.,
          <string-name>
            <surname>Smyth</surname>
            ,
            <given-names>P.</given-names>
          </string-name>
          , e Uthurusamy, R., editors (
          <year>1996</year>
          ).
          <source>Advances In Knowledge Discovery and Data Mining. American Association for Artificial Intelligence</source>
          , Menlo Park, CA, USA.
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          <string-name>
            <surname>Frawley</surname>
            ,
            <given-names>W.</given-names>
          </string-name>
          , PiatetskyShapiro, G., e Matheus,
          <string-name>
            <surname>C.</surname>
          </string-name>
          (
          <year>1992</year>
          ).
          <article-title>“Knowledge Discovery in Databases: An Overview”</article-title>
          .
          <source>AI Magazine</source>
          , pages
          <fpage>57</fpage>
          -
          <lpage>70</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          <string-name>
            <surname>Goldschmidt</surname>
            , R. e Passos,
            <given-names>E.</given-names>
          </string-name>
          (
          <year>2005</year>
          ).
          <article-title>Data Mining: Um Guia Prático</article-title>
          . Editora Campus.
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          <string-name>
            <given-names>Governo</given-names>
            <surname>Federal</surname>
          </string-name>
          (
          <year>2007</year>
          ).
          <source>“DECRETO Nº 6</source>
          .096,
          <string-name>
            <surname>DE 24 DE ABRIL DE 2007</surname>
          </string-name>
          <article-title>”</article-title>
          . https://www.planalto.gov.br/ccivil_03/_ato2007-
          <fpage>2010</fpage>
          /2007/decreto/d6096.htm .[Online; Acessado em 06/02/2017].
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          <string-name>
            <given-names>Governo</given-names>
            <surname>Federal</surname>
          </string-name>
          (
          <year>2009</year>
          ).
          <source>“Lei nº 12</source>
          .089 de 11 de novembro de
          <year>2009</year>
          ”. http://www.planalto.gov.br/ccivil_03/_Ato2007-
          <fpage>2010</fpage>
          /2009/Lei/L12089.htm. [Online; Acessado em 15/04/2016].
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          <string-name>
            <surname>Han</surname>
            ,
            <given-names>J</given-names>
          </string-name>
          .,
          <string-name>
            <surname>Kamber</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          , e Pei,
          <string-name>
            <surname>J.</surname>
          </string-name>
          (
          <year>2012</year>
          ).
          <article-title>Data Mining: Concepts and Techniques</article-title>
          . Morgan Kaufmann,
          <volume>3</volume>
          <fpage>edition</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          <string-name>
            <surname>INEP</surname>
          </string-name>
          (
          <year>2014a</year>
          ).
          <article-title>“Censo da Educação Superior 2014 Notas Estatísticas”</article-title>
          . http://download.inep.gov.br/educacao_superior/censo_superior/documentos/2015/not as_
          <article-title>sobre_o_censo_da_educacao_superior_2014.pdf</article-title>
          . [Online; Acessado em 16/04/2016].
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          <string-name>
            <surname>INEP</surname>
          </string-name>
          (
          <year>2014b</year>
          ).
          <source>“Resumo Técnico Censo da Educação Superior</source>
          <year>2013</year>
          ”. http://download.inep.gov.br/download/superior/censo/2013/resumo_tecnico_censo_e ducacao_superior_
          <year>2013</year>
          .pdf. [Online; Acessado em 16/04/2016].
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          <string-name>
            <surname>JEDM</surname>
          </string-name>
          (
          <year>2016</year>
          ).
          <article-title>“Journal of Educational Data Mining”</article-title>
          . http://www.educationaldatamining.org/JEDM. [Online; Acessado em 26/01/2016].
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          <string-name>
            <surname>Luo</surname>
            ,
            <given-names>Q.</given-names>
          </string-name>
          (
          <year>2008</year>
          ).
          <article-title>Advancing Knowledge Discovery and Data Mining</article-title>
          .
          <source>In Knowledge Discovery and Data Mining</source>
          ,
          <year>2008</year>
          .
          <article-title>WKDD 2008</article-title>
          . First International Workshop on, pages
          <fpage>3</fpage>
          -
          <lpage>5</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          <string-name>
            <surname>Manhães</surname>
            ,
            <given-names>L. M. B.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>da Cruz</surname>
            ,
            <given-names>S. M. S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Costa</surname>
            ,
            <given-names>R. J. M.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Zavaleta</surname>
            , J., e Zimbrão,
            <given-names>G</given-names>
          </string-name>
          (
          <year>2012</year>
          ).
          <article-title>Identificação dos Fatores que Influenciam a Evasão em Cursos de Graduação Manhães</article-title>
          ,
          <string-name>
            <given-names>L. M. B.</given-names>
            ,
            <surname>da Cruz</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S. M. S.</given-names>
            ,
            <surname>Zavaleta</surname>
          </string-name>
          , J., e Zimbrão,
          <string-name>
            <surname>G.</surname>
          </string-name>
          (
          <year>2014a</year>
          ).
          <article-title>“Investigating Withdraw of STEM Courses in a Brazilian University with EDM”</article-title>
          .
          <source>Symposium on Knowledge Discovery, Mining and Learning (KDMILE)</source>
          , pages
          <fpage>1</fpage>
          -
          <lpage>8</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          <string-name>
            <surname>Manhães</surname>
            ,
            <given-names>L. M. B.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>da Cruz</surname>
            ,
            <given-names>S. M. S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Zavaleta</surname>
            , J., e Zimbrão,
            <given-names>G.</given-names>
          </string-name>
          (
          <article-title>2014b). “The Impact of High Dropout Rates in a Large Public Brazilian University”</article-title>
          . CSEDU - 6th
          <source>International Conference on Computer Supported Education</source>
          , pages
          <fpage>126</fpage>
          -
          <lpage>129</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          <string-name>
            <surname>Manhães</surname>
            ,
            <given-names>L. M. B.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>da Cruz</surname>
            ,
            <given-names>S. M. S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Zavaleta</surname>
            , J., e Zimbrão,
            <given-names>G.</given-names>
          </string-name>
          (
          <year>2015</year>
          ).
          <article-title>“Towards Automatic Prediction of Student Performance in STEM Undergraduate Degree Programs”</article-title>
          . pages
          <fpage>247</fpage>
          -
          <lpage>253</lpage>
          . Symposium of Applied Computing (SAC
          <year>2015</year>
          ), SAC.
        </mixed-citation>
      </ref>
      <ref id="ref16">
        <mixed-citation>
          <string-name>
            <surname>MEC</surname>
          </string-name>
          (
          <year>2007</year>
          ).
          <article-title>“Reestruturação e Expansão das Universidades Federais: Diretrizes Gerais”</article-title>
          . http://portal.mec.gov.br/sesu/arquivos/pdf/diretrizesreuni.pdf. [Online; Acessado em 15/04/2016].
        </mixed-citation>
      </ref>
      <ref id="ref17">
        <mixed-citation>
          <string-name>
            <surname>Rezende</surname>
            ,
            <given-names>S. O.</given-names>
          </string-name>
          (
          <year>2005</year>
          ). Sistemas Inteligentes: Fundamentos e Aplicações. Manole. Rich, E. e
          <string-name>
            <surname>Knight</surname>
            ,
            <given-names>K.</given-names>
          </string-name>
          (
          <year>1993</year>
          ).
          <source>Inteligência Artificial. Makron Books.</source>
        </mixed-citation>
      </ref>
      <ref id="ref18">
        <mixed-citation>
          <string-name>
            <surname>Romero</surname>
          </string-name>
          , C. e
          <string-name>
            <surname>Ventura</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          (
          <year>2010</year>
          ).
          <article-title>“Educational Data Mining: A Review of the State of the Art”</article-title>
          .
          <source>Systems, Man, and Cybernetics</source>
          , Part C:
          <article-title>Applications</article-title>
          and Reviews, IEEE Transactions on,
          <volume>40</volume>
          (
          <issue>6</issue>
          ):
          <fpage>601</fpage>
          -
          <lpage>618</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref19">
        <mixed-citation>
          <string-name>
            <surname>Sachin</surname>
            , R. e Vijay,
            <given-names>M.</given-names>
          </string-name>
          (
          <year>2012</year>
          ).
          <article-title>A Survey and Future Vision of Data Mining in Educational Field</article-title>
          .
          <source>In Advanced Computing Communication Technologies (ACCT)</source>
          , 2012 Second International Conference on, pages
          <fpage>96</fpage>
          -
          <lpage>100</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref20">
        <mixed-citation>
          <string-name>
            <given-names>Silva</given-names>
            <surname>Filho</surname>
          </string-name>
          ,
          <string-name>
            <given-names>R. L. L.</given-names>
            ,
            <surname>Motejunas</surname>
          </string-name>
          ,
          <string-name>
            <given-names>P. R.</given-names>
            ,
            <surname>Hipólito</surname>
          </string-name>
          ,
          <string-name>
            <surname>O.</surname>
          </string-name>
          , e de Carvalho Melo Lobo,
          <string-name>
            <surname>M. B.</surname>
          </string-name>
          (
          <year>2007</year>
          ).
          <article-title>A Evasão no Ensino Superior Brasileiro</article-title>
          . In Cadernos de Pesquisa, volume
          <volume>37</volume>
          , pages
          <fpage>641</fpage>
          -
          <lpage>659</lpage>
          . Fundação Carlos Chagas.
        </mixed-citation>
      </ref>
      <ref id="ref21">
        <mixed-citation>
          <string-name>
            <surname>Tinto</surname>
            ,
            <given-names>V.</given-names>
          </string-name>
          (
          <year>1975</year>
          ).
          <article-title>“Dropout from higher education: a theoretical synthesis of recent research”</article-title>
          .
          <source>Review of Educational Research</source>
          , pages
          <fpage>89</fpage>
          -
          <lpage>125</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref22">
        <mixed-citation>
          <string-name>
            <surname>Tinto</surname>
            ,
            <given-names>V.</given-names>
          </string-name>
          (
          <year>1987</year>
          ).
          <article-title>Leaving college: rethinking the causes of student attrition</article-title>
          . University of Chigago Press.
        </mixed-citation>
      </ref>
      <ref id="ref23">
        <mixed-citation>
          <string-name>
            <surname>UFRN</surname>
          </string-name>
          (
          <year>2013</year>
          ). “Resolução Nº 171/2013 CONSEPE -
          <article-title>Regulamento dos Cursos Regulares de Graduação da Universidade Federal do Rio Grande do Norte”</article-title>
          .
        </mixed-citation>
      </ref>
      <ref id="ref24">
        <mixed-citation>
          <string-name>
            <surname>Viera</surname>
          </string-name>
          , A. e
          <string-name>
            <surname>Garrett</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          (
          <year>2005</year>
          ).
          <article-title>“Understanding interobserver agreement: The kappa statistic”</article-title>
          .
          <source>Family Medicine</source>
          ,
          <volume>37</volume>
          (
          <issue>5</issue>
          ):
          <fpage>360</fpage>
          -
          <lpage>363</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref25">
        <mixed-citation>
          <string-name>
            <surname>Weka</surname>
          </string-name>
          (
          <year>2017</year>
          ).
          <source>“Weka</source>
          <volume>3</volume>
          : Data Mining Software in http://www.cs.waikato.ac.nz/ml/weka/ [Online; Acessado em 06/02/2017].
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>