<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Obtenc¸ a˜o do Arcabouc¸o Legal por meio da Adic¸ a˜o das Remiss o˜es Externas aos Documentos Legais</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Francisco de Oliveira</string-name>
          <email>ffrancisco.sismicro@gmail.com</email>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Jose´ M. Parente de Oliveira</string-name>
          <email>parente@ita.brg</email>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Palavras-Chave: RDF</institution>
          ,
          <addr-line>Ontologia, Dados Ligados Abertos, Lei</addr-line>
        </aff>
      </contrib-group>
      <abstract>
        <p>Legal documents have internal and external relationships. The hypothesis of this research is that the addition of external references between legal documents allows recovering the legal framework about a certain subject matter. To achieve this, legal documents were converted into RDF triples associated with a legal ontology. The resultant dataset was stored into a repository that allows SPARQL queries to be issued. The relevance of the data returned was classified by legal experts. The positive correlation of the measures assures the high similarity of the classification made by the specialists. F-Measure metric was applied and showed values, on average, twice the values obtained in the Google search engine, that has been adjusted to focus on the legal domain. Resumo. Documentos legais possuem relacionamentos internos e externos. A hip o´tese desta pesquisa e´ que a adic¸ a˜o de refereˆncias externas entre documentos legais permite recuperar o arcabouc¸o legal sobre um determinado assunto. Para conseguir isso, documentos legais foram convertidos em triplas RDF associadas a uma ontologia legal. O conjunto de dados resultante foi armazenado em um reposit o´rio que permite efetuar consultas SPARQL. A relev aˆncia dos dados retornados foi classificada por especialistas legais. A correlac¸ a˜o positiva das medidas assegura a alta similaridade da classificac¸ a˜o feita pelos especialistas. A aplicac¸ a˜o da Medida-F mostrou valores, em me´dia, o dobro dos valores obtidos no buscador do Google, que foi ajustado para focar no dom´ınio legal.</p>
      </abstract>
      <kwd-group>
        <kwd>RDF</kwd>
        <kwd>Ontology</kwd>
        <kwd>Linked Open Data</kwd>
        <kwd>Law</kwd>
      </kwd-group>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>1. Introduc¸a˜ o</title>
      <p>Desde o lanc¸amento da web comercial em 1991 ate´ os dias de hoje, o que se viu foi a
explosa˜o do volume de dados dispon´ıveis [Baeza-Yates 2013], distribu´ıdos em diversos
dom´ınios. Entre os va´rios campos de informac¸a˜o dispon´ıveis na web esta´ o dom´ınio legal
cujos principais provedores sa˜o os o´rga˜os governamentais. A importaˆncia do dom´ınio
legal se faz presente no cotidiano de empresas, governos e, tambe´m, dos cidada˜os. As
normas, em sua maioria, sa˜o desconhecidas dos cidada˜os comuns. Isso tem va´rias causas,
entre elas a quantidade e a complexidade inerente ao dom´ınio legal.</p>
      <p>Ale´m do grande nu´mero de textos legais publicados, ha´ o alto grau de dependeˆncia
entre as normas [Machado 2013], na forma de interligac¸ o˜es, que constituem uma rica rede
de informac¸ o˜es [Lima 2008]. Por outro lado, em muitas situac¸ o˜es do dia a dia e´ necessa´rio
recuperar o conjunto de dispositivos legais relacionados a um assunto de interesse com o
propo´sito de encontrar soluc¸o˜es para problemas particulares.</p>
      <p>No presente trabalho, um dispositivo legal e´ considerado como sendo uma unidade
ou fragmento de informac¸a˜o legal. Dessa forma, um dispositivo legal podera´ ser um
artigo, um para´grafo, um inciso, uma al´ınea, um item e assim por diante. As interligac¸ o˜es
entre os va´rios dispositivos legais sa˜o efetuadas por meio de remisso˜es internas ou
externas, [Machado 2013], [Machado 2014]. As remisso˜es internas interligam dispositivos
contidos em um mesmo documento legal. As remisso˜es externas referenciam dispositivos
legais que esta˜o em documentos distintos. No exemplo a seguir, o Decreto 2.556 que
regulamenta o artigo 3o. da Lei 9.609, Lei do Software. A Lei 9.609, por sua vez, revoga
a Lei 7.646. Esta lei, tambe´m, remete ao Artigo 16 da Lei 5.869. Na Figura 1 foram
destacados apenas os elementos necessa´rios para mostrar os relacionamentos do Decreto
2.556.</p>
      <p>Figura 1. Interliga c¸o˜ es entre dispositivos legais.</p>
      <p>O presente artigo tem como objetivo apresentar um me´todo para recuperar o
conjunto de dispositivos legais relevantes sobre um determinado assunto ou tema de
interesse. Para tanto, adicionamos as remisso˜es existentes aos documentos legais e assim
acionamos a rede de informac¸o˜es relacionadas. O artigo esta´ organizado da forma que
segue. Na Sec¸ a˜o 2 sa˜o apresentados alguns trabalhos relacionados. Na Sec¸a˜o 3,
apresentamos o me´todo proposto para recuperac¸a˜o do arcabouc¸o legal de interesse. Na Sec¸a˜o 4,
apresentamos os experimentos realizados e os resultados obtidos. Por fim, na Sec¸a˜o 5,
apresentamos concluso˜es sobre o trabalho, as limitac¸ o˜es encontradas e poss´ıveis trabalhos
futuros.</p>
      <sec id="sec-1-1">
        <title>2. Trabalhos Relacionados</title>
        <p>Em [Machado 2013] foi realizada uma extensa pesquisa com o objetivo de se criar
um Modelo Conceitual Formal de Relacionamentos do Ordenamento Jur´ıdico Positivo
(MROJ). O resultado do esforc¸o de pesquisa e´ um conjunto de ontologias composto por
Ontologia do Sistema L o´gico Jur´ıdico, Ontologia da Teoria da Norma Jur´ıdica,
Ontologia do Ordenamento Jur´ıdico, Ontologia da Sistem a´tica Legal Externa e Ontologia da
Divis a˜o Tricot oˆmica das Pe´treas. Como benef´ıcios do trabalho o autor cita a
expressividade do modelo conceitual, a possibilidade de implementac¸a˜o do modelo em diversas
linguagens ontolo´ gicas com diferentes n´ıveis de expressividade de acordo com os
requisitos computacionais, a interoperabilidade e a possibilidade de publicac¸a˜o do conhecimento
legal e sua respectiva semaˆntica. Tal trabalho serviu aos objetivos da pesquisa em curso
por fornecer a Ontologia da Sistem a´tica Legal Externa, base para a criac¸a˜o das triplas e a
associac¸a˜o da ontologia ao reposit o´rio das triplas geradas.</p>
        <p>Outro trabalho de conceitualizac¸a˜o e modelagem ontolo´ gica vem de [Lima 2008]
que desenvolveu na sua tese de doutorado um modelo conceitual que chamou de Modelo
Gene´rico de Relacionamentos (MGR). O autor aplicou o seu modelo no projeto Colet aˆnea
Brasileira de Normas e Julgados de Telecomunicac¸ o˜es por meio de uma pesquisa ac¸a˜o.
O MGR e´, segundo seu autor, formado por treˆs entidades principais que sa˜o o Conceito,
a Unidade de Informac¸a˜o e o Relacionamento. A partir delas sa˜o criadas subclasses para
atender a`s necessidades do modelo. Como resultado final do modelo, sa˜o geradas uma
ontologia para a organizac¸a˜o da informac¸a˜o e uma tipologia.</p>
        <p>No trabalho de mestrado de [Machado 2010], o autor aproveita o cara´ter
hiera´rquico dos textos legais para melhorar o processo de busca de informac¸a˜o do
ordenamento jur´ıdico em relac¸a˜o aos me´todos convencionais. O autor aplica te´cnicas
amplamente utilizadas em recuperac¸ a˜o de informac¸a˜o como a extrac¸a˜o de radicais, indexac¸ a˜o,
lista de termos, entre outros. Diferentemente da pesquisa aqui relatada, no trabalho do
autor a premissa e´ a busca do documento legal que conte´m certa informac¸ a˜o, tal como
fazem os mecanismos de buscas.</p>
        <p>Na esfera governamental existe o projeto LexML-BR [PRODASEN 2016] que e´
baseado numa iniciativa multinacional. Pelo lado brasileiro, esse projeto visa organizar a
informac¸a˜o jur´ıdica disponibilizada pelos va´rios o´rga˜os do governo brasileiro, conforme
[Machado 2013]. Para a realizac¸a˜o do objetivo, foi criado um portal de acesso p u´blico,
no enderec¸o www.lexml.gov.br, contendo mais de um milha˜o de documentos entre
os quais aqueles referentes a` legislac¸ a˜o brasileira. Esse acervo pode ser pesquisado por
meio de termos de busca que podem ser informados no portal. Por meio de algoritmos de
recuperac¸a˜o de informac¸ a˜o, e´ retornada uma lista dos documentos cujos termos de busca
esta˜o na respectiva ementa.</p>
        <p>Na Finlaˆndia, ha´ o projeto FinLex [Frosterus 2013]. O projeto tem por finalidade
publicar os dados legais finlandeses como dados ligados abertos mediante a aplicac¸a˜o das
tecnologias de web semaˆntica. A similaridade desse trabalho com o da atual pesquisa e´ a
disponibilizac¸a˜o da informac¸a˜o na forma de dados abertos.</p>
        <p>Na Ita´lia, ale´m do projeto LexML-IT, similar ao LexML-BR, ha´ va´rios esforc¸os
de pesquisa, como, por exemplo, [Soria 2007] que, por meio de anotac¸a˜o semaˆntica em
textos legais italianos, procurou melhorar a recuperac¸a˜o de informac¸a˜o jur´ıdica.</p>
        <p>Na a´rea de conformidade legal encontra-se o trabalho alema˜o de
[Thatmann 2014], cuja finalidade foi prover uma ontologia lightweight para
representar o Ato Federal Alema˜o para Protec¸a˜o de Dados (BDSG). Utiliza ontologia legal
para tratar documentos jur´ıdicos alema˜es relacionados a` conformidade de SaS (Software</p>
      </sec>
    </sec>
    <sec id="sec-2">
      <title>3. Me´todo para Recuperac¸ a˜o do Arcabouc¸o Legal</title>
      <p>O me´todo consiste em explicitar as remisso˜es internas e externas existentes nos
documentos legais de forma a percorrer a rede de interligac¸ o˜es dos documentos. A Figura 2
apresenta um esquema do me´todo, contendo as etapas e produtos intermedia´rios e final.
Na sequeˆncia, o me´todo e´ apresentado em detalhes.</p>
      <p>Figura 2. Abordagem utilizada para solucionar o problema</p>
      <sec id="sec-2-1">
        <title>3.1. Etapa 1 - Capturar os arquivos contendo os textos legais</title>
        <p>Os documentos legais esta˜o contidos em arquivos de computador de variados formatos,
sendo os mais comuns o HTML, o DOC, o RTF e o PDF. Neste trabalho optou-se por
trabalhar apenas com os documentos no formato HTML, que e´ o formato padra˜o atual para
a publicac¸ a˜o da legislac¸a˜o. A Tabela 1 apresenta um resumo dos formatos de documentos
coletados em 06 de Agosto de 2017.</p>
        <sec id="sec-2-1-1">
          <title>Formato do documento HTML PDF DOC/RTF</title>
          <p>Total</p>
        </sec>
        <sec id="sec-2-1-2">
          <title>Nu´mero de arquivos</title>
          <p>70.016
8.302
1.737
80.055</p>
          <p>Tabela 1. Formatos de documentos legais</p>
          <p>Ap o´s o download dos arquivos HTMLs, foi necessa´ria uma reorganizac¸a˜o dos
arquivos legais, eliminac¸ a˜o de redundaˆncias e separac¸a˜o dos arquivos que sera˜o convertidos
para RDF (leis, decretos e decretos-lei). Depois desta reorganizac¸a˜o, o total de arquivos
HTML a serem convertidos reduziu de 70.016 para 35.314 arquivos.</p>
        </sec>
      </sec>
      <sec id="sec-2-2">
        <title>3.2. Etapa 2 - Converter o documento legal para a forma de triplas RDF</title>
        <p>RDF - Resource Description Framework e´ uma linguagem formal com especificac¸a˜o
definida por The World Wide Web Consortium (W3C) (https://www.w3.org/
RDF/). Fornece uma maneira de descrever os recursos atrave´s de metadados na forma
de triplas. Uma tripla e´ um conjunto ordenado formado por treˆs elementos: um sujeito,
um predicado e um objeto, nesta ordem. Como as triplas referenciam sujeitos e objetos,
elas podem ser interligadas com outras triplas que se refiram ao mesmo recurso ou objeto.
Assim, RDF forma um grafo rotulado e dirigido para representac¸a˜o de informac¸ o˜es na
Web.</p>
        <p>A conversa˜o dos documentos do formato HTML para o formato RDF e´ feita por
meio de um programa de computador, aqui chamado de File Parser, criado
especificamente para essa finalidade, que escaneia o diret o´rio contendo os arquivos HTML. Cada
arquivo HTML e´ passado para o File Parser que faz a conversa˜o por meio de rotinas de
tratamento de texto. A conversa˜o e´ mediada pela ontologia Ontologia Sistem a´tica Externa
Legal de [Machado 2013], que foi modificada e estendida, ver Figura 3. A conversa˜o
utilizou a parte da articulac¸a˜o da ontologia, em destaque no retaˆngulo na parte superior da
figura.</p>
        <p>Figura 3. Ontologia Legal modificada e estendida</p>
      </sec>
      <sec id="sec-2-3">
        <title>3.3. Etapa 3 - Armazenar as triplas em um reposit o´rio de triplas (triplestore)</title>
        <p>Para efeito deste trabalho de pesquisa, o triplestore escolhido foi o TDB que faz parte
do projeto de software Apache Jena, dispon´ıvel em https://jena.apache.org/.
E´ um reposito´ rio de triplas que pode ser acessado diretamente por meio da API Jena ou
como um enpoint SPARQL. O File Parser gera um arquivo RDF serializado no formato
Turtle. Depois envia-o para o triplestore por meio da API do Jena.</p>
      </sec>
      <sec id="sec-2-4">
        <title>3.4. Etapa 4 - Disponibilizar o acesso a`s triplas por meio de um endpoint SPARQL</title>
        <p>O acesso a`s triplas e´ disponibilizado por meio de um endpoint SPARQL. Neste trabalho
optou-se pelo servidor Fuseki, que tambe´m faz parte do Apache Jena. Para os
experimentos espec´ıficos deste trabalho, as queries (consultas) SPARQL foram enviadas diretamente
de um programa em Java que utiliza a API do Jena.</p>
      </sec>
      <sec id="sec-2-5">
        <title>3.5. Etapa 5 - Disponibilizar os arquivos legais como datasets RDF</title>
        <p>Todas as triplas armazenadas no reposito´rio tambe´m esta˜o dispon´ıveis em arquivos RDF
serializados em Turtle. Os conjuntos de dados (datasets) RDF podem ser publicados na
forma e sob os princ´ıpios de dados ligados abertos.</p>
      </sec>
      <sec id="sec-2-6">
        <title>4. Experimentos e Resultados</title>
        <p>Nesta sec¸ a˜o sa˜o apresentados os experimentos realizados e os resultados obtidos nestes
ensaios.</p>
      </sec>
      <sec id="sec-2-7">
        <title>4.1. Experimentos</title>
        <p>A conversa˜o dos 35.314 documentos legais (em HTML) gerou 1.930.236 triplas no
reposito´rio. No quadro da Figura 4 tem-se os quantitativos de predicados pertencentes
a`s triplas convertidas. Neste quadro, o nome do predicado esta´ na coluna Predicado e a
quantidade correspondente de ocorreˆncias, geradas na conversa˜o, esta´ na coluna
Quantitativo. Os predicados sa˜o oriundos da ontologia legal adotada. Sa˜o responsa´veis pela
interligac¸a˜o das triplas de itens legais geradas. Dessa maneira, explicitam as remisso˜es.
Por exemplo, o predicado lex:regulamentadoPor liga um item legal A, sujeito da tripla,
relacionado a um item legal B, objeto da tripla, de forma que B e´ a regulamentac¸a˜o legal
de A. Nas colunas da esquerda na primeira linha do quadro da Figura 4, ha´ o registro de
1.284 ocorreˆncias para esse predicado.</p>
        <p>Figura 4. Quantitativo de Predicados</p>
        <p>Os experimentos consistiram de consultas por meio de termos relativos a certos
temas. Os temas testados foram definidos aleatoriamente. Sa˜o eles:
(ACP) acumulac¸a˜o cargo pu´blico
(DCO) direito consumidor
(DHE) direitos humanos escola
(FFI) fraude financeira
(AIN) acesso informac¸a˜o
(MIL) meios il´ıcitos
(PRV) prevaricac¸a˜o
(PCR) programa computador registrado
(VDO) violeˆncia dome´stica
(TRD) tratamento desumano.</p>
        <p>As consultas foram regidas por um conjunto de algoritmos. O principal deles e´ o
Algoritmo sparqlQuery, que e´ mostrado a seguir em Algoritmo 1. Este recebe os termos de
busca e ativa as subconsultas que fazem as buscas e retornam as triplas que casam com os
termos informados. Para cada tripla retornada, o algoritmo faz a busca das triplas vizinhas
ate´ a distaˆncia de dois no´s.</p>
        <sec id="sec-2-7-1">
          <title>Data: Lista de termos</title>
          <p>Result: Lista de triplas de dispositivos legais
triples = getQueryResults(Lista de termos);
while exists triple in triples do
read current triple;
add triple to Result;
neighbours = getNeighbours(triple(subject));
while exists neighbour in neighbours do
read current neighbour;
add neighbour to Result;
nextNeighbours = getNextNeighbours(neighbour(object));
while exists nextNeighbour in nextNeighbours do
read current nextNeighbour;
add nextNeighbour to Result;
end
end
end</p>
        </sec>
        <sec id="sec-2-7-2">
          <title>Algorithm 1: sparqlQuery</title>
          <p>A ana´lise da relevaˆncia dos resultados das consultas se deu em duas etapas. Em
primeiro lugar, os dispositivos legais retornados na forma de triplas RDF foram
submetidos a` apreciac¸a˜o de dois advogados. Cada um deles, pre´-classificou cada tripla retornada
como relevante ou na˜o relevante em relac¸a˜o ao respectivo tema de busca.</p>
          <p>Apo´s a pre´-classificac¸a˜o feita pelos advogados, a relevaˆncia dos resultados foi
calculada com base nas me´tricas de Precisa˜o, Cobertura e Medida-F, comumente utilizadas
na a´rea de Recuperac¸a˜o de Informac¸a˜o [Manning et al. 2008], que sa˜o definidas a seguir.</p>
          <p>Precisa˜o (Precision): E´ uma medida que indica qual e´ a frac¸a˜o dos resultados
retornados que sa˜o relevantes para as necessidades de informac¸a˜o.</p>
          <p>Cobertura (Recall): Indica qual frac¸ a˜o de documentos relevantes na colec¸a˜o
foram retornados pelo sistema.</p>
          <p>Medida-F (F-measure): E´ utilizada para balancear eventuais distorc¸ o˜es
oriundas do ca´lculo da precisa˜o ou cobertura. A Medida-F (F-measure) e´ a me´dia
harm oˆnica entre as duas medidas anteriores.</p>
        </sec>
      </sec>
      <sec id="sec-2-8">
        <title>4.2. Resultados</title>
        <p>A classificac¸a˜o de relevaˆncia das triplas retornadas foi compilada, juntamente com os
ca´lculos das me´tricas, e esta˜o representados na Figura 5.</p>
        <p>Figura 5. Resultados: Precisa˜ o, Cobertura e Medida-F</p>
        <p>Os dados da figura foram utilizados para o ca´lculo da correlac¸a˜o da classificac¸a˜o
feita pelos especialistas. Este ca´lculo objetiva verificar se os dados permitem uma
classificac¸a˜o consistente. Eventuais divergeˆncias na classificac¸a˜o, observa´veis na tabela,
podem ter diversas causas, entre elas a pr o´pria subjetividade do classificador. O resultado
da correlac¸a˜o e´ apresentado no final desta sec¸a˜o.</p>
        <p>Com o propo´ sito de obter mais evideˆncias a respeito dos benef´ıcios do me´todo
apresentado, as consultas anteriormente realizadas foram replicadas no buscador do Google
(www.google.com/search). Para fazer as buscas no mecanismo do Google, os
seguintes crite´rios foram adotados:</p>
        <p>Indicac¸ a˜o do site de busca - para restringir a pesquisa a`s pa´ginas contendo
preferencialmente documentos legais, o site de busca foi restrito ao site
oficial www.planalto.gov.br. Com isso, tentou-se eliminar o aspecto
multidom´ınio do buscador. Isso foi feito por meio do uso de site:www.planalto.gov.br
junto aos termos de busca no campo de pesquisa do buscador.</p>
        <p>Crite´rio de relev aˆncia - a classificac¸a˜o feita pelo especialista 1 foi adotada,
aleatoriamente, como crite´rio de relevaˆncia.</p>
      </sec>
      <sec id="sec-2-9">
        <title>Limitac¸ a˜o da classificac¸a˜ o de relevaˆ ncia a um subconjunto das pa´ginas retor</title>
        <p>nadas em cada busca - foram consideradas as primeiras dez pa´ginas retornadas.
Para o ca´lculo da precisa˜o, o quociente utilizado foi o menor valor entre 10 e o
n u´mero de triplas retornadas conforme a Figura 5. Para o ca´lculo da cobertura, o
quociente utilizado foi o menor valor entre 10 e o n u´mero de resultados relevantes
classificados pelo especialista 1. Por exemplo, a busca por Direitos humanos
escola retornou 13 triplas na consulta SPARQL, sendo que 6 delas foram
classificadas como relevantes pelo especialista 1. Enta˜o foi utilizado o valor 10
como denominador para o ca´lculo de precisa˜o, min(10; 13). E o denominador 6
foi destacado para o ca´lculo de cobertura, min(6; 10).</p>
        <p>A Figura 6 mostra um trecho do retorno de busca no Google. De acordo com
especificac¸a˜o anterior, apenas os primeiros dez itens retornados foram
considerados para a aplicac¸ a˜o das me´tricas. Aqueles documentos resultantes da busca que,
segundo o especialista no dom´ınio legal, foram classificados como relevantes,
receberam uma marcac¸a˜o ao lado esquerdo do item correspondente. Esta marcac¸a˜o
foi feita por meio do s´ımbolo X como se observa na figura.</p>
        <p>Figura 6. Retorno parcial de busca no Google.</p>
        <p>As me´tricas aplicadas aos resultados das buscas efetuadas no Google,
considerando-se os crite´rios e restric¸ o˜es acima, sa˜o apresentadas na Figura 7. Ale´m
dos resultados espec´ıficos para o Google, a figura tambe´m mostra a Medida-F obtida
na classificac¸a˜o do especialista 1 para efeito de comparac¸a˜o.</p>
        <p>Os mecanismos de buscas em geral, devido a`s suas caracter´ısticas multidom´ınio,
na˜o sa˜o bons paraˆmetros para comparac¸ o˜es. Por esse motivo, no presente experimento,
houve a necessidade de restringir as buscas ao dom´ınio legal conforme destacado acima
em Indicac¸a˜o do site de busca.</p>
        <p>A Figura 8 apresenta graficamente o resultado do ca´lculo da correlac¸a˜o das
classificac¸o˜es feitas pelos especialistas. O propo´sito e´ verificar se os dados obtidos nos
retornos das consultas a`s triplas legais permitem uma classificac¸ a˜o consistente. O resultado
da medida estat´ıstica foi uma correlac¸a˜o positiva, no valor de 0,98. Esse resultado
corrobora a intenc¸a˜o de que os itens legais retornados na consulta, pela aplicac¸a˜o do me´todo
proposto, fornecem subs´ıdios para a classificac¸a˜o da relevaˆncia.</p>
        <p>Figura 7. Resultados das buscas no Google.</p>
        <p>Figura 8. Correla c¸a˜ o das classifica c¸o˜ es dos especialistas</p>
        <p>Os resultados da me´trica de Medida-F calculada comparativamente para o
Especialista 1 e para o Google sa˜o apresentados na Figura 9. As linhas de tendeˆncia das duas
medidas evidenciam a vantagem do me´todo adotado nesta pesquisa sobre os resultados
do buscador mais usado na atualidade.</p>
      </sec>
    </sec>
    <sec id="sec-3">
      <title>5. Conclus a˜o</title>
      <p>Essa pesquisa abordou o problema de recuperar o arcabouc¸o legal por meio da adic¸a˜o das
remisso˜es externas aos textos legais. O caminho para viabilizar este objetivo passou pela
utilizac¸a˜o de uma ontologia legal e conceitos e tecnologias da web semaˆntica. O
projeto e implementac¸ a˜o de um me´todo para coletar os textos legais, converteˆ-los em triplas
RDF e armazena´-las num triplestore, tambe´m fez parte da trilha. A complementac¸a˜o do
caminho se deu pelas consultas ao reposito´rio em linguagem SPARQL que possibilitam
a recuperac¸a˜o do arcabouc¸o legal. Os resultados foram avaliados por meio do uso de
me´tricas do campo da Recuperac¸a˜o de Informac¸a˜o. Os resultados da pesquisa
apresen</p>
      <p>Figura 9. Gra´ fico de Resultados: Google
taram Medida-F, em me´dia, igual ao dobro daquelas obtidas no buscador do Google, que
foi ajustado para focar no dom´ınio legal.</p>
      <p>A conversa˜o dos documentos legais para o formato RDF precisa de
aperfeic¸oamentos. Os problemas concentram-se nos conteu´dos dos arquivos em HTML.
A l´ıngua portuguesa e sua acentuac¸ a˜o caracter´ıstica trouxe dificuldades a` execuc¸a˜o do
projeto. Outro problema encontrado foi a ocorreˆncia de documentos legais mal formados,
com marcac¸a˜o incompleta, com erros de digitac¸a˜o ou com nomenclatura na˜o padronizada.
O software constru´ıdo para efetuar as consultas tem va´rios pontos a melhorar ou evoluir.
Por isso tudo, vislumbra-se uma se´rie de possibilidades de melhoria, complementac¸a˜o ou
evoluc¸ a˜o do presente trabalho.</p>
      <p>A automatizac¸a˜o da coleta dos arquivos com os textos legais e´ importante para
a manutenc¸a˜o e atualizac¸ a˜o da base de triplas RDF, assim como a melhoria do
conversor ( File Parser) e´ outra necessidade. Tanto a interpretac¸ a˜o sinta´tica dos
documentos legais originais quanto sua representac¸a˜o por meio de triplas devem ser melhoradas.
Tambe´m, requer-se o aprimoramento da ontologia legal, mediante novas extenso˜es. Outro
aspecto a considerar em relac¸a˜o ao presente trabalho, seria complementa´-lo com os
resultados de pesquisas nos campos da recuperac¸a˜o de informac¸a˜o e do processamento de
linguagem natural. O campo da semaˆntica dos conteu´dos revela-se promissor. Recuperar
o arcabouc¸o legal de maneira que os dispositivos de semaˆntica similar aos argumentos de
busca sejam retornados e´ tarefa em aberto.</p>
      <sec id="sec-3-1">
        <title>6. Agradecimentos</title>
        <p>E´ importante destacar e agradecer a contribuic¸a˜o dos advogados, Dr. Joaquim Carlos
Paixa˜o Ju´nior e Dr. Danilo Bueno Berber, que participaram ativamente efetuando a
classificac¸a˜o da relevaˆncia dos resultados das buscas por dispositivos legais.</p>
      </sec>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          <string-name>
            <surname>[</surname>
          </string-name>
          Baeza-Yates 2013]
          <article-title>Baeza-</article-title>
          <string-name>
            <surname>Yates</surname>
            ,
            <given-names>R.</given-names>
          </string-name>
          ;
          <string-name>
            <surname>Ribeiro-Neto</surname>
            ,
            <given-names>B.</given-names>
          </string-name>
          (
          <year>2013</year>
          ).
          <article-title>Recuperac¸a˜o de Informac¸a˜o: conceitos e tecnologia das ma´quinas de busca. Bookman, Porto Alegre, 2a edition</article-title>
          .
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          [Frosterus 2013] Frosterus, Matias; Tuominen,
          <string-name>
            <surname>J. H. E.</surname>
          </string-name>
          (
          <year>2013</year>
          ).
          <article-title>Facilitating re-use of legal data in applications - finnish law as a linked open data service</article-title>
          .
          <source>page 10. Extended Semantic Web Conference</source>
          , Springer Berlin Heidelberg.
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          [Lima 2008] Lima,
          <string-name>
            <surname>J. A. O.</surname>
          </string-name>
          (
          <year>2008</year>
          ).
          <article-title>Modelo Gene´rico de Relacionamentos na Organizac¸a˜o da Informac¸a˜o Legislativa e Jur´ıdica. Doutorado em cieˆncia da informac¸a˜o</article-title>
          , Universidade de Bras´ılia - UnB, Bras´ılia.
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          [Machado 2013]
          <string-name>
            <surname>Machado</surname>
            ,
            <given-names>A. L.</given-names>
          </string-name>
          (
          <year>2013</year>
          ).
          <article-title>Modelo Conceitual Formal de Relacionamentos do Ordenamento Jur´ıdico Positivo. Doutorado em cieˆncia da computac¸a˜o, Instituto Tecnolo´gico de Aerona´utica -</article-title>
          <string-name>
            <surname>ITA</surname>
          </string-name>
          , Sa˜o Jose´ dos Campos.
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          [Machado 2014]
          <string-name>
            <surname>Machado</surname>
            ,
            <given-names>A. L.</given-names>
          </string-name>
          ;
          <string-name>
            <surname>Parente de Oliveira</surname>
            ,
            <given-names>J. M.</given-names>
          </string-name>
          (
          <year>2014</year>
          ).
          <article-title>A legal ontology of relationships for civil law system</article-title>
          .
          <source>In Proceedings of 1st Joint Workshop ONTO.COM / ODISE on Ontologies in Conceptual Modeling and Information Systems EngineeringCo-located with 8th International Conference on Formal Ontology in Information Systems (FOIS</source>
          <year>2014</year>
          ), Rio de Janeiro, Brasil.
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          [Machado 2010] Machado,
          <string-name>
            <surname>R. A. C.</surname>
          </string-name>
          (
          <year>2010</year>
          ).
          <article-title>Seeklex - recuperac¸ a˜o de informac¸ a˜o em subdocumentos hierarquizados. Mestrado em engenharia de sistemas e computac¸ a˜o, Universidade Federal</article-title>
          do Rio de Janeiro - UFRJ, Rio de Janeiro.
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          [Manning et al. 2008]
          <string-name>
            <surname>Manning</surname>
            ,
            <given-names>C. D.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Raghavan</surname>
            ,
            <given-names>P.</given-names>
          </string-name>
          , and
          <string-name>
            <surname>Schutze</surname>
            ,
            <given-names>H.</given-names>
          </string-name>
          (
          <year>2008</year>
          ). Introduction to Information Retrieval. Cambridge University Press, New York, 1st edition.
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          <source>[PRODASEN</source>
          <year>2016</year>
          ]
          <article-title>PRODASEN (2013 (accessado em</article-title>
          01 de Setembro de
          <year>2016</year>
          )
          <article-title>)</article-title>
          . Lexml - rede de informac¸
          <article-title>a˜o legislativa e jur´ıdica - portal especializado em informac¸a˜o jur´ıdica e legislativa</article-title>
          . http://www.lexml.gov.br/.
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          [Soria 2007] Soria,
          <string-name>
            <surname>C</surname>
          </string-name>
          ; Bartolini,
          <string-name>
            <surname>R. L. A. M. S. P. V.</surname>
          </string-name>
          (
          <year>2007</year>
          ).
          <article-title>Automatic extraction of semantics in law documents</article-title>
          .
          <source>In Proceedings of the V Legislative XML Workshop</source>
          , pages
          <fpage>253</fpage>
          -
          <lpage>266</lpage>
          , Florence, Italy.
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          [Thatmann 2014]
          <string-name>
            <surname>Thatmann</surname>
            ,
            <given-names>D.</given-names>
          </string-name>
          ;
          <string-name>
            <surname>Schuster</surname>
            ,
            <given-names>E. C. G.</given-names>
          </string-name>
          (
          <year>2014</year>
          ).
          <article-title>Mapping legal requirements to slas: an ontology based approach for cloud-based service consumption</article-title>
          .
          <source>In SW4LAW 2014</source>
          and
          <article-title>JURIX 2014-DC Semantic Web for the Law</article-title>
          and Second Jurix Doctoral Consortium, pages
          <fpage>5</fpage>
          -
          <lpage>16</lpage>
          . Technische Universitat, Technische Universitat.
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>