<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Ontologias Aplicadas ao Problema de Correlac¸ a˜o Litol o´gica no Dom´ınio da Geologia do Petr o´leo</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Luan Fonseca Garcia</string-name>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Joel Luis Carbonera</string-name>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Mara Abel</string-name>
        </contrib>
      </contrib-group>
      <fpage>203</fpage>
      <lpage>208</lpage>
      <abstract>
        <p>In this work we apply a domain ontology for developing a computational approach for the task of lithologic correlation, within the Petroleum Geology domain. In this context, a domain ontology is applied for imposing a rich and homogeneous structure to the visual descriptions of the domain objects that are the targets of this task. In our approach, we combine the use of ontologies with clustering techniques and sequence alignment algorithms, which are typically applied in DNA sequencing. A domain ontology with a vocabulary sufficiently expressive for allowing rich visual descriptions of the domain objects is a key aspect of our proposal. Resumo. Neste trabalho, exploramos o uso de uma ontologia de dom´ınio para o desenvolvimento de uma abordagem computacional para a tarefa de correlac¸ a˜o litolo´gica, no dom´ınio da Geologia do Petro´leo. Neste contexto, uma ontologia de dom´ınio e´ utilizada para impor uma estrutura rica e homogeˆnea a`s descric¸o˜es visuais dos objetos de dom´ınio que sa˜o o foco desta tarefa. Ale´m da ontologia de dom´ınio, a abordagem tambe´m combina te´cnicas de clusterizac¸a˜o e algoritmos de alinhamento de sequeˆncias, tipicamente utilizados para realizar o sequenciamento de DNA. A disponibilidade de uma ontologia, com um vocabula´rio expressivo o suficiente para proporcionar uma descric¸ a˜o visual rica dos objetos do dom´ınio e´ um aspecto chave desta proposta.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>1. Introduc¸a˜ o</title>
      <p>
        Dom´ınios visuais sa˜o aqueles em que a resoluc¸a˜o de problemas e´ fortemente baseada
na aplicac¸a˜o de conhecimento visual dos especialistas. Consideramos conhecimento
visual como sendo o conjunto de modelos mentais que suportam o processo de racioc´ınio
sobre informac¸a˜o relacionada ao arranjo espacial e outros aspectos visuais das
entidades de dom´ınio [
        <xref ref-type="bibr" rid="ref6 ref7">Lorenzatti et al. 2009</xref>
        ,
        <xref ref-type="bibr" rid="ref3">Carbonera et al. 2011</xref>
        ]. Este trabalho insere-se no
contexto do projeto Obaita´, desenvolvido pelo grupo BDI (grupo de bancos de dados
inteligentes da UFRGS). Neste projeto, investigamos abordagens integradas para aquisic¸a˜o,
modelagem, representac¸a˜o e racioc´ınio sobre conhecimento visual. Um dos resultados
esperados e´ uma ontologia para o dom´ınio (visual) da Estratigrafia Sedimentar, que
viabilize o desenvolvimento de diversos sistemas baseados em conhecimento, que operem
sobre uma mesma conceitualizac¸a˜o deste dom´ınio. Em [
        <xref ref-type="bibr" rid="ref6 ref7">Lorenzatti et al. 2009</xref>
        ] sa˜o
apresentados os passos iniciais em direc¸a˜o a este resultado, enquanto em [
        <xref ref-type="bibr" rid="ref1 ref2">Carbonera 2012</xref>
        ] esta
ontologia e´ expandida, utilizando-se a abordagem descrita em [
        <xref ref-type="bibr" rid="ref1 ref2">Carbonera et al. 2012</xref>
        ].
      </p>
      <p>Atualmente, investigamos abordagens para a tarefa de correlac¸a˜o litolo´gica, no
dom´ınio da Estratigrafia Sedimentar, que se beneficiem da ontologia desenvolvida. A
Estratigrafia Sedimentar e´ uma sub-a´rea da Geologia que estuda as camadas que compo˜em
a Terra e busca determinar como ocorreu a formac¸a˜o dessas camadas. Neste dom´ınio,
na tarefa de correlaca˜o litolo´gica o geo´logo busca reconhecer a mesma fa´cies sedimentar
(Figura 1) em duas ou mais sec¸o˜es estratigra´ficas diferentes, mesmo que espacialmente
distantes entre si. Ou seja, nesta tarefa o geo´logo investiga a continuidade lateral de fa´cies
sedimentares em subsuperf´ıcie, onde na˜o e´ poss´ıvel realizar observac¸a˜o direta destas
unidades. A correlac¸a˜o permite determinar a distribuic¸a˜o espacial e o volume das rochas que
subsidiam a avaliac¸a˜o de economicidade dos reservato´rios de petro´leo.</p>
      <p>Para alcanc¸ar este objetivo, o geo´logo inicia descrevendo visualmente corpos de
rocha, tal como o testemunho de sondagem apresentado na Figura 1. A descric¸ a˜o destes
corpos envolve discretiza´-los em fa´cies sedimentares e descrever todos os atributos
visuais que caracterizam cada uma delas. Neste contexto, a fa´cies sedimentar e´ uma dada
porc¸ a˜o de um corpo de rocha, visualmente distingu´ıvel das porc¸ o˜es adjacentes. Ale´m dos
atributos que as caracterizam, as fa´cies sedimentares possuem uma ou mais estruturas
sedimentares, que correspondem a padro˜es geome´tricos externamente vis´ıveis, que indicam
padro˜es de arranjos espaciais internos dos gra˜os que constituem uma fa´cies.</p>
      <p>
        Figura 1. Trecho de testemunho de sondagem, com duas fa´ cies distintas.
Adaptado de [
        <xref ref-type="bibr" rid="ref6 ref7">Lorenzatti 2009</xref>
        ].
      </p>
      <p>A continuidade das unidades de rochas e´ julgada pela similaridade entre fa´cies,
visto que elas sa˜o as porc¸o˜es discretizadas de rocha pass´ıveis de observac¸a˜o direta e
visualmente distingu´ıveis das demais. A correspondeˆncia entre corpos de rocha pode ser
parcial, assim como a similaridade entre as unidades relacionadas; como exemplificado na
Figura 2, onde a fa´cies 4 esta´ presente nas sec¸o˜es A e B, mas na˜o esta´ presente na sec¸ a˜o C.
E´ importante notar que, a correlac¸ a˜o e´ estabelecida na˜o apenas com base na identificac¸a˜o
do mesmo tipo de rocha nos diferentes poc¸os, mas principalmente pelo sequenciamento
semelhante de diferentes tipos de rochas em cada um dos poc¸os.</p>
      <p>
        Atualmente, a correlac¸a˜o e´ realizada a partir de mu´ltiplos registros textuais
distintos, sem uma estrutura padra˜o, capturados por geo´logos diferentes, sem apoio de um
vocabula´rio padra˜o. Essas condic¸o˜es fazem com que, no atual estado da arte, a tarefa de
correlac¸a˜o litolo´gica carec¸a de me´todos automa´ticos para processamento em larga escala.
Neste trabalho, no´s propomos que a correlac¸a˜o pode ser realizada com me´todos
computacionais de correlac¸a˜o automa´ticos, desde que as descric¸o˜es de rochas sejam orientadas
Figura 2. Representac¸ a˜ o de uma correlac¸ a˜ o litolo´ gica entre treˆ s sec¸ o˜ es
estratigra´ ficas distintas (A, B e C), envolvendo seis fa´ cies. Adaptada de
[
        <xref ref-type="bibr" rid="ref8">Parsons 2013</xref>
        ].
por uma ontologia de dom´ınio bem fundamentada, tal como a incorporada no software
Strataledge R 1 e que e´ apresentada em detalhes em [
        <xref ref-type="bibr" rid="ref1 ref2">Carbonera 2012</xref>
        ]. A utilizac¸a˜o de
uma ontologia de dom´ınio expressiva, permite impor uma estrutura formal homogeˆnea
a`s descric¸ o˜es dos objetos de dom´ınio, viabilizando a descric¸a˜o de um conjunto rico de
informac¸o˜es, atrave´s de um vocabula´rio formal bem definido. Essas informac¸ o˜es,
capturadas de forma uniforme e na˜o amb´ıgua, permitem a comparac¸a˜o entre porc¸ o˜es descritas
das unidades de rocha espacialmente distintas, que na˜o sa˜o influenciadas pelo uso de
diferentes vocabula´rios e estilos descritivos, suportando a correlac¸ a˜o entre elas. Ale´m disso,
considerando que a ontologia especifica a conceitualizac¸ a˜o compartilhada no dom´ınio,
o seu uso para descric¸a˜o dos objetos do dom´ınio permite que os sistemas processem
as informac¸o˜es acerca desses objetos de um modo que se aproxime da forma como os
geo´logos os concebem. Assim, partimos da hipo´tese de que abordagens automa´ticas para
correlac¸a˜o podem se beneficiar do uso de ontologias, oferecendo resultados
geologicamente mais significativos.
      </p>
    </sec>
    <sec id="sec-2">
      <title>2. Abordagem proposta</title>
      <p>
        Diversas abordagens teˆm sido propostas para lidar computacionalmente com o problema
da correlac¸a˜o litolo´gica. Uma abordagem que tem se revelado promissora neste sentido,
tal como a adotada em [
        <xref ref-type="bibr" rid="ref9">Waterman and Raymond Jr 1987</xref>
        ], envolve a aplicac¸a˜o de
algoritmos de alinhamento de sequeˆncias. Estes algoritmos veˆm sendo utilizados com sucesso
na tarefa de alinhamento de sequeˆncias de DNA no dom´ınio da bioinforma´tica. Entre
estes algoritmos, destaca-se o algoritmo de programac¸ a˜o dinaˆmica Smith-Waterman, que
possui resultado o´timo para o alinhamento de sequ¨eˆncias locais.
      </p>
      <p>
        Segundo [
        <xref ref-type="bibr" rid="ref4">Chao and Zhang 2009</xref>
        ], o algoritmo de Smith-Waterman parte de uma
sequeˆncia A = a1 a2 :::am e uma sequeˆncia B = b1 b2 :::bn , que podem ter tamanhos
diferentes. De modo geral, o alinhamento entre estas sequeˆncias e´ obtido pela inserc¸a˜o de
lacunas (representadas pelo caractere “-”) em ambas, representando deslocamentos entre
os segmentos similares, de tal modo que o tamanho final de ambas seja ideˆntico, sendo
1http://www.endeeper.com/products/software/strataledge
que na˜o pode haver alinhamentos entre lacunas. A Figura 3 apresenta dois exemplos de
alinhamentos de sequeˆncias de DNA resultantes da aplicac¸ a˜o deste algoritmo. O
funcionamento detalhado deste algoritmo foge ao escopo deste artigo, mas pode ser encontrado
em [
        <xref ref-type="bibr" rid="ref4">Chao and Zhang 2009</xref>
        ].
      </p>
      <p>-ATACATGTC--T
G-TAC--GTCGG(a)
-----AATGCCATTGAC----GG
CAGCC--T--C---G-CTTAG-(b)
Figura 3. Dois exemplos (a e b) de alinhamentos de pares de sequ eˆncias de DNA
realizados pelo algoritmo de Smith-Waterman.</p>
      <p>
        Para aplicar o algoritmo de Smith-Waterman sobre duas sequeˆncias, deve haver
uma maneira de comparar elementos de ambas, determinando quando eles sa˜o
equivalentes. Quando aplicado no alinhamento de sequeˆncias de DNA, este algoritmo opera sobre
strings constru´ıdas a partir de um alfabeto finito – as quatro letras que representam as
bases nitrogenadas ba´sicas do DNA. Neste caso a comparac¸a˜o entre elementos de duas
sequeˆncias e´ trivial, bastando verificar se os dois elementos sa˜o a mesma letra
(representando o mesmo tipo de base nitrogenada). Por outro lado, quando aplicado ao problema
de correlac¸ a˜o litolo´gica, o algoritmo deve ser capaz de operar sobre sequeˆncias de fa´cies
sedimentares. Em relac¸ a˜o a este ponto, [
        <xref ref-type="bibr" rid="ref5">Griffiths and Bakke 1990</xref>
        ] afirma que aplicac¸ o˜es
convencionais deste algoritmo para o problema em foco devem determinar uma forma
de codificar a informac¸a˜o das fa´cies sedimentares de um modo ana´logo ao que ocorre
no caso do sequenciamento de DNA, utilizando um conjunto finito de s´ımbolos bem
definidos, que podem ser comparados pelo algoritmo. Em nossa abordagem, adaptamos o
algoritmo para que sejam comparados os clusters aos quais as duas fa´cies comparadas
pertencem. Para isso, antes de aplicar o algoritmo de alinhamento, utilizamos um algoritmo
de clusterizac¸a˜o2 sobre um dataset formado pelo conjunto de descric¸o˜es das fa´cies que
se pretende correlacionar. Lembrando que estas descric¸ o˜es sa˜o realizadas com suporte
da ontologia de dom´ınio. A partir desde passo, e´ obtido um modelo clusterizador que e´
capaz de classificar instaˆncias de fa´cies (incluindo instaˆncias na˜o consideradas durante o
treinamento do clusterizador). Este clusterizador, por sua vez, e´ utilizado pelo algoritmo
de alinhamento para comparar se duas fa´cies pertencem a` um mesmo cluster. Se as duas
fa´cies, em corpos de rocha distintos, esta˜o no mesmo cluster, consideramos que elas sa˜o
equivalentes e que podem ser alinhadas. Atualmente, o treinamento do clusterizador e´
realizado atrave´s da API Weka3, aplicando o algoritmo EM (expectation–maximization)
[
        <xref ref-type="bibr" rid="ref10">Witten et al. 2011</xref>
        ]. A Figura 4 representa esquematicamente a abordagem proposta.
      </p>
      <p>
        A ontologia de dom´ınio utilizada [
        <xref ref-type="bibr" rid="ref1 ref2">Carbonera 2012</xref>
        ] descreve o conceito de fa´cies
atrave´s de 23 atributos. Na fase de conversa˜o das descric¸ o˜es de corpos de rocha para o
dataset de treinamento do clusterizador (Figura 5), cada instaˆncia f do conceito fa´cies na
ontologia e´ convertida em um vetor de caracter´ısticas v. Cada posic¸a˜o p neste vetor
representa um atributo descritivo a que caracteriza o conceito de fa´cies na ontologia, de modo
que cada valor vp do vetor v representa o valor espec´ıfico que f possui para o respectivo
2De acordo com [
        <xref ref-type="bibr" rid="ref10">Witten et al. 2011</xref>
        ], clusterizac¸a˜o e´ uma te´cnica de minerac¸a˜o de dados utilizada para
determinar um conjunto de categorias ou agrupamentos (clusters) a partir de um conjunto de dados sem
classificac¸a˜o pre´via.
      </p>
      <p>3http://www.cs.waikato.ac.nz/ml/weka/
Figura 4. Representa c¸a˜ o dos procedimentos realizados na abordagem proposta.</p>
      <p>Cada Fij representa uma fa´ cies j no corpo de rocha i.
atributo. Ale´m disso, em nosso caso, o vetor v tambe´m possui uma posic¸a˜o especial que
representa a relac¸a˜o temEstrutura entre a instaˆncia de fa´cies e uma instaˆncia de
estrutura sedimentar. Esta posic¸ a˜o especial recebe como valor o tipo espec´ıfico da instaˆncia
e de estrutura sedimentar relacionada a` fa´cies f . Assim, o dataset de treinamento e´ um
conjunto V de vetores de caracter´ısticas v, cada qual representando uma instaˆncia f do
conceito de fa´cies, descrita pela ontologia.</p>
      <p>Figura 5. Representa c¸a˜ o do processo de conversa˜ o de instaˆ ncias de fa´ cies
sedimentares em vetores de caracter´ısticas, considerando um conjunto reduzido de
atributos.</p>
    </sec>
    <sec id="sec-3">
      <title>3. Considerac¸o˜ es finais</title>
      <p>Neste trabalho, apresentamos uma abordagem computacional para correlac¸a˜o litol o´gica
automa´tica no dom´ınio da Estratigrafia Sedimentar. Esta abordagem esta´ alinhada a`s
abordagens mais promissoras oferecidas pela literatura. A nossa principal contribuic¸a˜o
reside no uso de uma ontologia de dom´ınio para conferir uma estrutura formal homogeˆnea
a`s descric¸ o˜es dos objetos do dom´ınio. Assim, considerando que a ontologia captura de
modo formal e expl´ıcito a conceitualizac¸ a˜o compartilhada pela comunidade, ela permite
que os usua´rios descrevam os objetos do dom´ınio de um modo padra˜o, formal e com uma
estrutura rica de informac¸ o˜es. Isto viabiliza o tratamento computacional destas descric¸ o˜es
e permite que nossa abordagem processe informac¸o˜es sobre os objetos do dom´ınio de um
modo que se aproxime da forma como os geo´logos os conceitualizam.</p>
      <p>Na fase atual deste trabalho, com o aux´ılio de especialistas do dom´ınio, estamos
coletando um conjunto de descric¸ o˜es de corpos de rocha reais. Nos pro´ximos passos
deste projeto sera´ investigado como considerar a importaˆncia relativa dos atributos da
fa´cies durante a clusterizac¸ a˜o, de um modo que seja poss´ıvel determinar similaridades
geologicamente mais significativas entre fa´cies sedimentares.</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          <string-name>
            <surname>Carbonera</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Abel</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          , dos Santos Scherer,
          <string-name>
            <given-names>C. M.</given-names>
            , and
            <surname>Bernardes</surname>
          </string-name>
          ,
          <string-name>
            <surname>A.</surname>
          </string-name>
          (
          <year>2012</year>
          ).
          <article-title>Abordagem para aquisic¸ a˜o de conhecimento visual e refinamento de ontologias para dom´ınios visuais</article-title>
          . In Vieira, R.,
          <string-name>
            <surname>Guizzardi</surname>
            ,
            <given-names>G.</given-names>
          </string-name>
          , and
          <string-name>
            <surname>Fiorini</surname>
          </string-name>
          , S. R., editors,
          <source>Proceedings of Joint V Seminar on Ontology Research in Brazil and VII International Workshop on Metamodels, Ontologies and Semantic Technologies</source>
          , volume
          <volume>776</volume>
          .
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          <string-name>
            <surname>Carbonera</surname>
            ,
            <given-names>J. L.</given-names>
          </string-name>
          (
          <year>2012</year>
          ).
          <article-title>Racioc´ınio sobre conhecimento visual: Um estudo em estratigrafia sedimentar. Master's thesis, Universidade Federal do Rio Grande do Sul (UFRGS).</article-title>
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          <string-name>
            <surname>Carbonera</surname>
            ,
            <given-names>J. L.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Abel</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Scherer</surname>
            ,
            <given-names>C. M. S.</given-names>
          </string-name>
          , and
          <string-name>
            <surname>Bernardes</surname>
            ,
            <given-names>A. K.</given-names>
          </string-name>
          (
          <year>2011</year>
          ).
          <article-title>Reasoning over visual knowledge</article-title>
          . In Vieira, R.,
          <string-name>
            <surname>Guizzardi</surname>
            ,
            <given-names>G.</given-names>
          </string-name>
          , and
          <string-name>
            <surname>Fiorini</surname>
          </string-name>
          , S. R., editors,
          <source>Proceedings of Joint IV Seminar on Ontology Research in Brazil and VI International Workshop on Metamodels, Ontologies and Semantic Technologies</source>
          , volume
          <volume>776</volume>
          .
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          <string-name>
            <surname>Chao</surname>
            ,
            <given-names>K.-M.</given-names>
          </string-name>
          and
          <string-name>
            <surname>Zhang</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          (
          <year>2009</year>
          ).
          <article-title>Sequence comparison: theory and methods</article-title>
          , volume
          <volume>7</volume>
          . Springer.
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          <string-name>
            <surname>Griffiths</surname>
            ,
            <given-names>C.</given-names>
          </string-name>
          and
          <string-name>
            <surname>Bakke</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          (
          <year>1990</year>
          ).
          <article-title>Interwell matching using a combination of petrophysically derived numerical lithologies and gene-typing techniques</article-title>
          .
          <source>Geological Society</source>
          , London, Special Publications,
          <volume>48</volume>
          (
          <issue>1</issue>
          ):
          <fpage>133</fpage>
          -
          <lpage>151</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          <string-name>
            <surname>Lorenzatti</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          (
          <year>2009</year>
          ).
          <article-title>Ontologia para dom´ınios imag´ısticos: Combinando primitivas textuais e picto´ricas. Master's thesis, UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL</article-title>
          .
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          <string-name>
            <surname>Lorenzatti</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Abel</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Nunes</surname>
            ,
            <given-names>B. R.</given-names>
          </string-name>
          , and
          <string-name>
            <surname>Scherer</surname>
            ,
            <given-names>C. M. S.</given-names>
          </string-name>
          (
          <year>2009</year>
          ).
          <article-title>Ontology for imagistic domains: Combining textual and pictorial primitives</article-title>
          . In Heuser,
          <string-name>
            <given-names>C. A.</given-names>
            and
            <surname>Pernul</surname>
          </string-name>
          , G., editors,
          <source>ER Workshops</source>
          , volume
          <volume>5833</volume>
          of Lecture Notes in Computer Science, pages
          <fpage>169</fpage>
          -
          <lpage>178</lpage>
          . Springer.
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          <string-name>
            <surname>Parsons</surname>
            ,
            <given-names>S. B.</given-names>
          </string-name>
          (
          <year>2013</year>
          ).
          <article-title>Historical geology</article-title>
          . Dispon´ıvel em: &lt;http: //www.ocean.odu.edu/˜spars001/geology_112/laboratory/ session_04/handout.html&gt;. Acesso em: 14 de Julho de
          <year>2013</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          <string-name>
            <surname>Waterman</surname>
            ,
            <given-names>M. S.</given-names>
          </string-name>
          and
          <string-name>
            <surname>Raymond</surname>
            <given-names>Jr</given-names>
          </string-name>
          ,
          <string-name>
            <surname>R.</surname>
          </string-name>
          (
          <year>1987</year>
          ).
          <article-title>The match game: new stratigraphic correlation algorithms</article-title>
          .
          <source>Mathematical geology</source>
          ,
          <volume>19</volume>
          (
          <issue>2</issue>
          ):
          <fpage>109</fpage>
          -
          <lpage>127</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          <string-name>
            <surname>Witten</surname>
            ,
            <given-names>I. H.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Frank</surname>
            ,
            <given-names>E.</given-names>
          </string-name>
          , and
          <string-name>
            <surname>Hall</surname>
            ,
            <given-names>M. A.</given-names>
          </string-name>
          (
          <year>2011</year>
          ).
          <article-title>Data Mining: Practical Machine Learning Tools and Techniques</article-title>
          . Elsevier.
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>