<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Generacion Semiautomatica de una Ontolog a Geogra ca a partir de Fuentes Heterogeneas</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Manuel E. Puebla-Mart nez</string-name>
          <xref ref-type="aff" rid="aff2">2</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Jose M. Perea-Ortega</string-name>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Alfredo Simon-Cuevas</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Instituto Superior Politecnico Jose Antonio Echeverr a</institution>
          ,
          <addr-line>CUJAE, La Habana</addr-line>
          ,
          <country country="CU">Cuba</country>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>Universidad de Extremadura</institution>
          ,
          <addr-line>Badajoz</addr-line>
          ,
          <country country="ES">Spain</country>
        </aff>
        <aff id="aff2">
          <label>2</label>
          <institution>Universidad de las Ciencias Informaticas</institution>
          ,
          <addr-line>La Habana</addr-line>
          ,
          <country country="CU">Cuba</country>
        </aff>
      </contrib-group>
      <fpage>67</fpage>
      <lpage>79</lpage>
      <abstract>
        <p>In contexts where knowledge should be semantically well-de ned for computational processing, the development and use of ontologies has been increasing. An example are the Geographical Information Systems. This work presents a semi-automatic method to generate a geographic ontology from heterogeneous geographical information sources such as Geonames, OpenStreetMap and spatial databases. The proposed approach begins with a preliminary ontology, which is enhanced and extended from the prior sources along with the automatic generation of spatial relationships. The main contribution of this work is the integration of several geographic information sources into an OWL2-ontology, together with di erent mechanisms developed for its management. Several experiments were performed on the speci c region of Cuba, as well as functional testing through di erent queries; some of them are shown as examples.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>Introduccion</title>
      <p>
        Segun se ha reportado, aproximadamente el 80 % de la informacion en
formato electronico actualmente almacenada, se corresponde con informacion
georreferenciada o susceptible de serlo [
        <xref ref-type="bibr" rid="ref7">7</xref>
        ]. En este escenario, la Recuperacion de
Informacion Geogra ca (RIG) resulta un tema de especial interes, el cual se
centra en el desarrollo de metodos y sistemas que permitan el acceso oportuno y
preciso a dicha informacion. Teniendo en cuenta la gran cantidad de informacion
que manejan estos sistemas, en muchos casos provenientes de fuentes diversas
y en lenguaje natural, as como los mecanismos de consultas actualmente
empleados, el tratamiento de la semantica asociada a la informacion constituye una
necesidad para incrementar la precision de los resultados y la satisfaccion de los
usuarios. En la solucion de esta problematica, el uso de ontolog as [
        <xref ref-type="bibr" rid="ref5">5</xref>
        ] ha sido una
de las alternativas mas comunmente consideradas. El uso de ontolog as en RIG,
espec camente las ontolog as geogra cas [
        <xref ref-type="bibr" rid="ref17">17</xref>
        ], permiten recuperar informacion
teniendo en cuenta la semantica con la que han sido descritos los datos y el
conocimiento representado, dando la posibilidad de explicitar informacion adicional:
tipo, estructura, jerarqu a, relaciones y reglas [
        <xref ref-type="bibr" rid="ref9">9</xref>
        ]. Sin embargo, la construccion
manual de ontolog as geogra cas representa un trabajo agotador y propenso a
errores humanos, debido a la rapidez con que crecen los volumenes de
informacion y el tiempo a dedicar por un especialista en la captura de la informacion a
ser representada en dicha ontolog a.
      </p>
      <p>
        Por otra parte, el desarrollo de Internet y la interconectividad global ha
propiciado el surgimiento de grandes fuentes de informacion generadas por los
usuarios, conocidas en el ambito espacial como Informacion Geogra ca
Voluntaria (VGI). Dos de las mas abarcadoras en este contexto son Geonames4 y
OpenStreetMap5 (OSM). Geonames es una base de datos geogra ca que cubre
todos los pa ses y contiene mas de ocho millones de nombres de lugares. La
informacion esta organizada en nueve clases, conocidas como featureClass, donde
cada una cuenta con un grupo de codigos para clasi car la informacion
contenida. OSM es un proyecto de colaboracion para crear un mapa del mundo que
sea editable por los usuarios, inspirado en Wikipedia, pero en lugar de art culos
los usuarios editan entidades geogra cas (Nodes, Ways y Relations ). Por otra
parte, tambien se encuentran las Bases de Datos Espaciales (BDE), las cuales
constituyen un tipo de base de datos donde se describen objetos espaciales a
traves de tres caracter sticas basicas: atributos, localizacion y topolog a [
        <xref ref-type="bibr" rid="ref13">13</xref>
        ].
Estas fuentes de informacion han sido utilizadas como recursos en sistemas de RIG,
en su mayor a usando solo una de ellas, y se han desarrollado proyectos con el
objetivo de describir la informacion que almacenan en formato RDF6, por tanto
con bajo nivel de descripcion semantica, quedando mucho por hacer cuando se
trata de la representacion y el razonamiento de las caracter sticas espaciales [
        <xref ref-type="bibr" rid="ref11">11</xref>
        ].
      </p>
      <sec id="sec-1-1">
        <title>4 http://www.geonames.org</title>
      </sec>
      <sec id="sec-1-2">
        <title>5 http://www.openstreetmap.org</title>
      </sec>
      <sec id="sec-1-3">
        <title>6 http://www.w3.org/RDF</title>
        <p>En este trabajo se propone un metodo para la construccion
semi-automatica de una ontolog a geogra ca en la que se integrara informacion proveniente
de Geonames, OSM y BDE. El metodo parte de la construccion manual de
una ontolog a preliminar del dominio geogra co usando Protege, en la que se
representan conceptos, propiedades y relaciones espaciales comunes, e incluye
mecanismos de extension de esta ontolog a a partir de cada una de las fuentes
de informacion, dividido en tres fases, as como un proceso nal de generacion
automatica de relaciones espaciales. Como resultado se obtiene una ontolog a
geogra ca codi cada en OWL2. Este disen~o se ha concebido como un proceso
de desarrollo de la ontolog a de manera iterativa e incremental, y no
partiendo de cero, sino tomando de referencia informacion existente en otras ontolog as
geogra cas, as como de los propios recursos mencionados. La ontolog a geogra
ca resultante sera utilizada en un sistema de RIG, con el objetivo de mejorar la
precision de sus resultados e incrementar la satisfaccion de los usuarios.
2.</p>
      </sec>
    </sec>
    <sec id="sec-2">
      <title>Trabajo relacionado</title>
      <p>
        En la literatura revisada existen varios trabajos que abordan el problema de
la generacion semiautomatica de ontolog as a partir de bases de datos [
        <xref ref-type="bibr" rid="ref1 ref16 ref8">1,16,8</xref>
        ],
sin embargo, no se pudo encontrar y adaptar sus resultados de software. De ellos
solo en [
        <xref ref-type="bibr" rid="ref1">1</xref>
        ] se aborda el ambito espacial.
      </p>
      <p>La vinculacion de datos geoespaciales desde sistemas de informacion
heterogeneos ha sido abordado previamente en el proyecto GeoKnow7, siendo uno
de los resultados mas relevantes la obtencion del LinkedGeoData (representacion
en RDF de OpenStreetMap). En este proyecto los procesos de extraccion y
administracion de informacion geoespacial se llevan a cabo a partir del tratamiento de
tripletas RDF y no a traves de la construccion de ontolog as geogra cas codi
cadas en lenguaje OWL2, lo cual limita las posibilidades de descripcion semantica
de esta informacion y con ello la generacion de nuevo conocimiento. Sin
embargo, al ser un proyecto generico, que no se centra en ninguna fuente de datos
espec ca, se ha considerado que existe un margen de mejora si se profundiza en
las caracter sticas particulares de cada conjunto de datos en el momento de la
integracion.</p>
      <p>
        En [
        <xref ref-type="bibr" rid="ref4">4</xref>
        ] se reporta una propuesta de integracion entre LinkedGeoData y
Geonames, donde cada par de toponimos, es analizado mediante la combinacion de
informacion referente a distancia espacial y similitud sintactica de las etiquetas
que los identi ca. Sin embargo, el metodo de integracion propuesto solo enlaza
una pequen~a parte de la informacion contenida en ambas fuentes de datos,
espec camente, la referente a las zonas residenciales. Al igual que en GeoKnow,
el resultado de la integracion de los datos se describe y almacena como tripletas
RDF. Por otra parte, en [
        <xref ref-type="bibr" rid="ref4">4</xref>
        ] tambien se asume que todas las zonas residenciales
en Geonames tienen asociada un rectangulo de delimitacion (boundingBox, en
ingles), lo cual no ocurre en todos los casos.
      </p>
      <sec id="sec-2-1">
        <title>7 http://geoknow.eu</title>
        <p>
          En [
          <xref ref-type="bibr" rid="ref6">6</xref>
          ] se presenta la ontolog a geogra ca GeoNW, construida a partir del
analisis de tres fuentes de datos: Geonames, WordNet8 y Wikipedia. Los autores
sen~alan que la comparacion de nombres hubiera sido mas e caz si se hubiera
hecho a traves de una funcion de distancia entre cadenas, para tener en
consideracion errores tipogra cos. Ademas, teniendo en cuenta que WordNet constituye
una base de datos lexica de ambito general, por lo que aporta muy poco en
cuanto a sinonimos de lugares geogra cos de regiones espec cas. Por ejemplo, de los
812 toponimos almacenados en Geonames de Cuba, solo en dos de ellos se
identi can sinonimos en WordNet: 'Cuba' y 'Havana'. En esta propuesta Wikipedia
es utilizada para an~adir nacionalidades a los lugares administrativos. En este
sentido, Wikipedia brinda mayores bene cios como fuente de datos geogra ca,
debido al crecimiento de proyectos asociados a las coordenadas geogra cas de
los art culos publicados en este recurso, tales como WikiProject Geographical
Coordinates9. Finalmente, GeoNW elimina un gran numero de inconsistencias
encontradas en Geonames, sin especi car la cantidad, ni referencia a la zona en
la que se encontraron.
3.
        </p>
      </sec>
    </sec>
    <sec id="sec-3">
      <title>Descripcion del metodo propuesto</title>
      <p>El metodo propuesto se inicia con la construccion manual de una ontolog a
preliminar del dominio geogra co en que se representan conceptos, propiedades y
relaciones espaciales comunes en este dominio. Luego se ejecutan secuencialmente
en tres fases mecanismos de extension de esta ontolog a usando Geonames, OSM
y BDE. Estos procesos incluyen tareas de extraccion de conceptos, relaciones e
individuos desde cada fuente. Al nal, se lleva a cabo un proceso de generacion
automatica de relaciones espaciales, obteniendose como resultado la ontolog a
geogra ca codi cada en OWL2 en la cual se integra informacion proveniente de
las tres fuentes mencionadas. La Figura 1 esquematiza el ujo de trabajo del
metodo.</p>
      <p>Teniendo en cuenta el volumen de informacion a ser integrada en la ontolog a
resultante, y para reducir el consumo de memoria RAM a la hora de procesar
esta ontolog a se disen~o una clase espec ca llamada Ontology, capaz de
administrar ontolog as con un gran numero de individuos y propiedades, y de obtener
informacion de ella sin la necesidad de utilizar razonadores. En esta clase se
implementaron funcionalidades que sustituyen a los razonadores en la generacion
de conocimiento, por ejemplo, para recuperar las subclases e instancias de una
clase espec ca, as como las clases equivalentes, dando la posibilidad de
almacenar los valores de las propiedades en una base de datos disen~ada para esa tarea
y no en el chero ontologico, y con ello reducir el consumo de memoria en el
procesamiento de la ontolog a. La gestion de la ontolog a en las diferentes fases se
hizo con la version 4.1.4 del framework OWLAPI, un framework Java disen~ado</p>
      <sec id="sec-3-1">
        <title>8 https://wordnet.princeton.edu</title>
      </sec>
      <sec id="sec-3-2">
        <title>9 http://en.wikipedia.org/wiki/Wikipedia:WikiProject_Geographical_</title>
        <p>coordinates</p>
        <p>Figura 1. Etapas fundamentales del proceso de generacion de la ontolog a
para gestionar ontolog as en OWL2. Protege 4, el editor de ontolog a de codigo
abierto mas popular, por ejemplo, esta construido alrededor de OWLAPI.
3.1.</p>
        <sec id="sec-3-2-1">
          <title>Construccion de la ontolog a preliminar</title>
          <p>
            En este proceso se lleva a cabo la construccion manual de una ontolog a
preliminar del dominio geogra co en la cual se representan conceptos, propiedades
y relaciones espaciales comunes dentro de este dominio. En la construccion de la
conceptualizacion de esta ontolog a se utilizo como referencia fundamental
Geonames, la cual posee un elevado nivel de aplicabilidad y constituye una fuente de
datos geogra cos bien documentada y extensa, cuyo vocabulario basico
constituye un buen punto de partida para de nir una ontolog a del dominio geogra co.
Espec camente, se utilizo la ontolog a GeonamesOntology10, desde donde
fueron seleccionados conceptos basicos y propiedades de tipos de datos. Tambien
fueron representados en la ontolog a preliminar conceptos y propiedades
identi cadas en OSM, as como las propiedades de objetos (ej. 'esta al norte de',
'contiene', 'se superpone', 'intersecta con') que son comunes en el estado del arte
[
            <xref ref-type="bibr" rid="ref12 ref15 ref2">2,12,15</xref>
            ]. En la Figura 2 se muestra la taxonom a de conceptos representada en
esta ontolog a.
          </p>
          <p>
            Las relaciones espaciales fueron modeladas de la misma forma que
normalmente se hace en la literatura especializada [
            <xref ref-type="bibr" rid="ref2 ref3">3,2</xref>
            ]. Este aspecto representa una
ventaja con respecto a las variantes de integracion de datos espaciales basadas
en tripletas RDF. Se modelan en la ontolog a, como propiedades de datos, todas
las caracter sticas de las fuentes da datos propuestas. Se de ne una nueva
propiedad de dato que es la base del futuro proceso de RIG y el mecanismo utilizado
en esta investigacion para almacenar en una ontolog a espacial las geometr as
de los objetos espaciales recuperados: la cadena WKT11 (Well Known Text ),
la cual es almacenada como un tipo cadena en la ontolog a. La construccion de
10 http://www.geonames.org/ontology/ontology_v3.1.rdf
11 http://www.opengeospatial.org/standards/wkt-crs
          </p>
          <p>
            Figura 2. Taxonom a de conceptos de la ontolog a preliminar
esta ontolog a preliminar se llevo a cabo usando Protege, siguiendo la propuesta
metodologica reportada en [
            <xref ref-type="bibr" rid="ref10">10</xref>
            ] y codi cada en OWL2.
          </p>
          <p>Como resultado, se obtuvo una ontolog a formada por 15 clases, 14 relaciones
taxonomicas, 15 propiedades de objeto (owl:ObjectProperty ) organizadas en una
taxonom a y que representan relaciones semanticas entre las clases, as como 32
propiedades de tipo de dato (owl:DataTypeProperty ) tambien organizadas en una
taxonom a, y se han incorporado 25 anotaciones. Tanto en las propiedades objeto
como en las de tipo de datos estan especi cados en su dominio (rdfs:domain)
todas las clases de nidas, brindando as capacidades para alcanzar un nivel alto
de descripcion de los objetos espaciales que se representen en esta ontolog a. A
partir de esta ontolog a preliminar el metodo propone la ejecucion de un proceso
de extension a partir de Geonames, OSM y BDE, que se describen a continuacion.
3.2.</p>
        </sec>
        <sec id="sec-3-2-2">
          <title>Extension usando Geonames</title>
          <p>En esta primera fase, se lleva a cabo un proceso automatico de extension
de la ontolog a preliminar, a partir de extraer toda la informacion posible de
Geonames. Como parte de este proceso se extraen de la fuente espec ca nuevos
conceptos a ser incorporados a la ontolog a preliminar, as como propiedades e
individuos. Este proceso de extraccion de informacion es guiado por los
individuos almacenados en Geonames, es decir, a partir de cada individuo se extraen
todos los conceptos con los cuales esta relacionado, as como sus relaciones y
propiedades. En correspondencia con la informacion descrita en Geonames, se
extiende automaticamente la taxonom a de clases de la ontolog a preliminar. La
extension incluye la propia descripcion (Annotations en OWL2) que aparece en
Geonames para cada nueva clase. Se extrae informacion impl cita, evitando la
utilizacion de razonadores para inferir conocimiento. Aqu tambien se identi can
y eliminan toponimos ambiguos.</p>
          <p>En esta investigacion dos toponimos seran considerados ambiguos si la
distancia espacial entre sus dos puntos mas cercanos es menor que 1000 metros y sus
nombres o nombres alternativos son sintacticamente similares segun la funcion
de similitud Damerau-Levenshtein12. Con el objetivo de considerar la longitud
de las cadenas a comparar, la funcion se utilizo de la siguiente forma: dos
cadenas son similares si el resultado de la funcion es menor o igual que uno, cuando
el promedio de las cadenas comparadas es menor o igual a siete, o menor o igual
que dos cuando el promedio es mayor que siete. Esta modi cacion permite
ajustar el impacto de las diferencias en las cadenas a comparar en correspondencia
con la longitud de las mismas, no es lo mismo una distancia de uno en cadenas de
longitud cuatro que en cadenas de longitud 30. La fundamentacion del uso de la
funcion de similitud Damerau-Levenshtein esta basada en que dos de las fuentes
de datos utilizadas en esta investigacion son construidas de manera voluntaria
por los humanos, por tal motivo los errores tipogra cos tienen mayor
probabilidad de aparecer en comparacion con otros tipos de errores. Cabe sen~alar que no
todos los toponimos de Geonames tienen un boundingBox de nido, para lo cual
se construye la cadena WKT a partir de las coordenadas geogra cas del punto
que identi ca al objeto. Por el contrario, para los casos que tienen de nida la
propiedad boundingBox, la cadena WKT es construida a partir de las
coordenadas de los cuatro puntos que de nen el propio boundingBox. Para acceder a
los recursos de Geonames se utilizo la biblioteca de Java geonames-1.1.1313, la
cual garantiza acceso pleno a los recursos de Geonames a traves de servicios web
desde el lenguaje de programacion Java.
3.3.</p>
        </sec>
        <sec id="sec-3-2-3">
          <title>Extension usando OSM</title>
          <p>
            Una vez que la ontolog a preliminar ha sido enriquecida con la informacion
de Geonames, en esta segunda fase se extrae de manera automatica toda la
informacion posible de OSM. De forma analoga al proceso anterior, tambien se
identi can en esta fuente conceptos, propiedades e individuos a ser incorporados
a la ontolog a en construccion, igualmente guiado por estos ultimos. En
correspondencia con la informacion descrita en [
            <xref ref-type="bibr" rid="ref14">14</xref>
            ], se extiende automaticamente la
taxonom a de clases de la ontolog a. La extension incluye la propia descripcion
(Annotations en OWL2) que aparece en [
            <xref ref-type="bibr" rid="ref14">14</xref>
            ] para cada nueva clase. Como parte
del proceso de integracion de informacion, tambien se analizan y reducen
posibles ambiguedades tanto en individuos como en clases, usando la misma tecnica
empleada anteriormente basada en el analisis de similitud sintactica y distancia
espacial. Ademas, para cada tipo de objeto se extraen todos sus puntos del borde
y se genera la cadena WKT a partir de ellos. A diferencia de Geonames, OSM
permite generar con exactitud la geometr a del objeto espacial, ya que
proporciona mecanismos que permiten acceder a los puntos que delimitan el objeto
espacial.
          </p>
          <p>El algoritmo de extension usando OSM que se ha aplicado se muestra a
continuacion:
12 https://en.wikipedia.org/wiki/Damerau-Levenshtein_distance
13 http://www.geonames.org/source-code
Ontology ExtensionOSM(Ontology ontology){</p>
          <p>int cantObject= ontology.cantObjetosOSMPertenecientesZona
Geografica();
for i = 1 to cantObject hacer {</p>
          <p>Tnode objetoEspacial = ontology.ObtenerObjetoEspacial(i);
if (InfoValida(objetoEspacial)){
string typeClass = identificarClase(objetoEspacial);
ontology.WriteToponymInOntology(objetoEspacial);
switch (typeClass){
case "type1":</p>
          <p>AnalizarCorrespondenciaConClasesDeOntolog aEn
Construccion(typeClass);</p>
          <p>BuscaryDefinirIndividuosAmbiguos(objetoEspacial,</p>
          <p>listClases_a_Comparar(typeClass));
break;
case "typeN":</p>
          <p>AnalizarCorrespondenciaConClasesDeOntolog aEn
Construccion(typeClass);</p>
          <p>BuscaryDefinirIndividuosAmbiguos(objetoEspacial,</p>
          <p>listClases_a_Comparar(typeClass));
break;
}</p>
          <p>}
}
}
return ontology;</p>
          <p>InfoEsValida(objetoEspacial ): de ne si la informacion presente en
objetoEspacial es valida o no.</p>
          <p>Identi carClase(objetoEspacial ): identi ca la clase presente en la
ontolog a a la cual debe pertenecer el objeto espacial objetoEspacial o de ne una
nueva clase para el.</p>
          <p>AnalizarCorrespondenciaConClasesDeOntolog aEnConstruccion
(typeClass): identi ca la clase typeClass en la ontolog a o construye una nueva
clase. En caso de construir una nueva clase, la ubica en la taxonom a de la ontolog a
y de ne un comentario o Annotations para esa nueva clase.</p>
          <p>listClases a Comparar(typeClass): obtiene el listado de clases presentes
en la ontolog a que pudieran tener individuos ambiguos al objeto espacial que se
esta analizando.</p>
        </sec>
        <sec id="sec-3-2-4">
          <title>BuscaryDe nirIndividuosAmbiguos: identi ca individuos ambiguos en</title>
          <p>la ontolog a y los de ne como similares.</p>
          <p>Por ultimo, la gestion de los recursos disponibles en OSM se hizo a traves de
la biblioteca Java osm4j 14, la cual brinda varias ventajas si la comparamos con
sus homologas mas conocidas como Osmosis15.
14 http://www.topobyte.de/projects/osm4j
15 http://wiki.openstreetmap.org/wiki/Osmosis</p>
        </sec>
        <sec id="sec-3-2-5">
          <title>Extension usando BDE</title>
          <p>El objetivo de esta fase es extraer toda la informacion posible de una BDE que
este al menos en Primera Forma Normal, e incorporarla a la ontolog a en
construccion, tambien tratando la ambiguedad de individuos y clases. El mecanismo
de nido posibilita obtener informacion e integrarla a la ontolog a proveniente de
cualquier BDE. Se propone para la integracion de informacion proveniente de
una BDE la utilizacion de la cadena WKT como alternativa para representar en
OWL2 el campo Geometry de los gestores de BDE. Todas las relaciones entre
tablas se han modelado como relaciones funcionales del tipo \HasA", de nida
en la ontolog a preliminar como una propiedad de objeto funcional. Por ultimo,
tambien se ha llevado a cabo la traduccion a OWL2 de restricciones sobre
atributos y tablas: condicion de Primera Forma Normal, NOT NULL, UNIQUE y
PRIMARY KEY.</p>
          <p>Toda la estructura organizativa de la BDE es generada automaticamente a
partir del modelo f sico de la misma. El usuario nal solo pudiera intervenir
para especi car por cada tabla que concepto de la ontolog a es equivalente al
concepto asociado a la tabla y el nombre de la columna que representa el nombre
de los objetos espaciales. Si este ultimo atributo no se suministra, se asume que
es el campo llave y si no se suministra un concepto equivalente se asume que no
existe. En este enriquecimiento es posible incorporar nuevas clases e individuos a
la ontolog a, ademas de equivalencia entre clases, relaciones entre esos individuos,
restricciones de datos y de objetos. Una vez ejecuta las reglas de mapeado entre
los componentes de la BDE y la ontolog a en construccion, se analiza la posible
ambiguedad de los individuos. Por cada nuevo individuo que este dentro del area
geogra ca de interes, se buscan individuos ambiguos en la ontolog a, incluyendo
los de la BDE. El algoritmo utilizado para buscar ambiguedades es similar al
utilizado en las fuentes anteriores. Por ultimo, la gestion de la BDE se hace a
partir del Java Database Connectivity(JDBC)-9.3-1104 de PostgreSQL16 y el
1.3.3 de PostGIS17 para administrar los datos espaciales.
3.5.</p>
        </sec>
        <sec id="sec-3-2-6">
          <title>Generacion Automatica de Relaciones Espaciales entre</title>
        </sec>
        <sec id="sec-3-2-7">
          <title>Individuos</title>
          <p>Una vez integradas en la ontolog a las tres fuentes de datos, se identi can
todos los pares de individuos que cumplen con alguna de las propiedades de
objetos de nidas en la ontolog a preliminar, las cuales representan relaciones
espaciales. Esta informacion es almacenada en una base de datos y no en el
chero OWL, usando la clase Ontology descrita anteriormente. En este proceso
se aprovecha la integracion de informacion realizada en la ontolog a al culminar
las tres fases anteriores, en el cual todos los individuos tienen su geometr a en
un mismo formato: cadena WKT. Al igual que en la extension desde Geonames,
este modulo es capaz de identi car todos los pares de individuos que cumplen
16 http://www.postgresql.org
17 http://postgis.net
1ra 2da 3ra
fase fase fase</p>
          <p>Clases 667 699 723</p>
          <p>Clases equivalentes 0 1 11
Relaciones taxonomicas o subclases 682 749 956</p>
          <p>Individuos 47 5.863 8.158
Rel. de objeto entre pares de individuos 264 264 264</p>
          <p>Prop. de datos con valor en individuos 1.316 48.343 105.054</p>
          <p>Pares de individuos similares 1 1.216 2.115</p>
          <p>Anotaciones 696 728 728</p>
          <p>Generacion
de Rel. Esp.</p>
          <p>27.763.887</p>
          <p>12.217
Tabla 1. Resultado de la extension de la ontolog a preliminar para el municipio
Marianao (La Habana)
con alguna de las propiedades de objeto de nidas en la ontolog a preliminar, sin
importar que algunos puedan ser generados posteriormente por los razonadores.
Para ello, se apoya en la biblioteca ESRI JAVA Geometry18.
4.</p>
        </sec>
      </sec>
    </sec>
    <sec id="sec-4">
      <title>Resultados</title>
      <p>A partir de la ontolog a preliminar construida se realizaron pruebas de los
procesos de extension de nidos en el metodo. Las pruebas se realizaron
mediante la ejecucion de esos procesos sobre las fuentes seleccionadas, pero
considerando solo informacion relacionada con una region de Cuba, espec camente la
del municipio de Mariano de la provincia de La Habana. No obstante, el metodo
esta disen~ado para procesar informacion relacionada con cualquier area geogra
ca sobre la que se almacene informacion en las fuentes. En la Tabla 1 se muestra
como la ontolog a se va enriqueciendo con la ejecucion de los diferentes procesos,
obteniendose al nal un recurso ontologico con un gran volumen de informacion
representada; sobre todo muy enriquecido en cuanto a individuos y relaciones
semanticas entre ellos. Esto alcanza especial relevancia teniendo en cuenta el
proposito de esta ontolog a (fuente primaria de informacion en un sistema de
RIG) ya que mientras mas informacion sea representada, el sistema de RIG
tendra mayores capacidades para satisfacer las necesidades de informacion de
los usuarios. La inclusion de 728 anotaciones con informacion descriptiva y
complementaria de los elementos representados tambien es otro aspecto relevante
porque facilita el uso de este recurso y, ademas, esta informacion tambien puede
ser suministrada a los usuarios como resultado de la RIG.</p>
      <p>Adicionalmente, se realizaron pruebas de funcionalidad teniendo en cuenta
el proposito de esta ontolog a. En este sentido, se realizaron 50 consultas sobre
la ontolog a dirigidas a recuperar informacion referente a objetos espaciales (ej.
toponimos), con resultados satisfactorios. En la Tabla 2 se muestran los
resultados de cuatro consultas realizadas, las cuales se formalizan mediante la terna:
18 http://github.com/Esri/geometry-api-java/wiki
Q1
Q2
Q3
Q4
Id Requisito de informacion</p>
      <p>Recursos
hidrogra cos
en Marianao
Calles que cruzan
la localidad de
\Los Pocitos"</p>
      <p>Objetos
espaciales en
\Los Pocitos"</p>
      <p>Objetos
espaciales
en un radio de</p>
      <p>3 kms del
Hospital Infantil
\Juan Manuel</p>
      <p>Marquez"
fuente, identi cador (en la fuente), nombre del objeto; en el caso de la BDE,
los dos ultimos elementos de la terna se convierten en uno. En los resultados
de cada consulta se puede apreciar como la informacion recuperada proviene de
diferentes fuentes, como intervienen varias clases de la ontolog a en la obtencion
de la respuesta, y el requisito de informacion.</p>
      <p>Por ultimo, cabe resen~ar que dadas las caracter sticas de la geontolog a
obtenida donde la informacion no esta ntegramente en el chero OWL, no fue
posible utilizar SPARQL como lenguaje de consultas, utilizandose en su lugar
los metodos de razonamiento implementados.</p>
    </sec>
    <sec id="sec-5">
      <title>Conclusiones</title>
      <p>En este trabajo se describe un metodo computacional para generar, de
manera semiautomatica, una ontolog a geogra ca que conceptualiza cualquier zona
geogra ca del mundo con el objetivo de ser utilizada en un sistema de RIG. Los
experimentos realizados sobre el municipio de Marianao (La Habana) evidencian
que las caracter sticas de la ontolog a geogra ca resultante son idoneas para el
exito de un futuro sistema de RIG sobre dicho municipio. Aunque solo se hicieron
pruebas funcionales utilizando la ontolog a resultante, los resultados obtenidos
demuestran el progreso de caracter sticas que de nen la evaluacion cualitativa
de la ontolog a generada por cada una de las etapas de enriquecimiento y las
consultas realizadas con rman el exito del proceso de RIG.</p>
    </sec>
    <sec id="sec-6">
      <title>Agradecimientos</title>
      <p>Este trabajo ha sido parcialmente nanciado por el Ministerio de Econom a
y Competitividad del Gobierno de Espan~a, proyecto REDES
(TIN2015-65136C2-1-R).</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          1.
          <string-name>
            <surname>Baglioni</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Masserotti</surname>
            ,
            <given-names>V.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Renso</surname>
            ,
            <given-names>C.</given-names>
          </string-name>
          :
          <article-title>Building geospatial ontologies form geographical databases</article-title>
          .
          <source>In: Proceedings of the Second International Conference on Geospatial Semantics</source>
          (
          <year>2007</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          2.
          <string-name>
            <surname>Egenhofer</surname>
          </string-name>
          , M.J.:
          <article-title>On the Equivalence of Topological Relations</article-title>
          .
          <source>International Journal of Geographical Information Systems</source>
          <volume>9</volume>
          ,
          <fpage>133</fpage>
          {
          <fpage>152</fpage>
          (
          <year>1995</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          3.
          <string-name>
            <surname>Freeman</surname>
            ,
            <given-names>J.:</given-names>
          </string-name>
          <article-title>The modelling of spatial relations</article-title>
          .
          <source>Computer Graphics and Image Processing</source>
          <volume>4</volume>
          (
          <issue>2</issue>
          ),
          <volume>156</volume>
          {
          <fpage>171</fpage>
          (
          <year>1975</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          4.
          <string-name>
            <surname>Hahmann</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Burghardt</surname>
            ,
            <given-names>D.</given-names>
          </string-name>
          :
          <article-title>Connecting LinkedGeoData and Geonames in the Spatial Semantic Web</article-title>
          .
          <source>In: 6th International Conference on Geographic Information Science</source>
          , GIScience
          <year>2010</year>
          (
          <year>2010</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          5.
          <string-name>
            <surname>Hess</surname>
            ,
            <given-names>G.N.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Iochpe</surname>
            ,
            <given-names>C.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Ferrara</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Castano</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          :
          <article-title>Towards e ective geographic ontology matching</article-title>
          . In: Fonseca,
          <string-name>
            <given-names>F.T.</given-names>
            ,
            <surname>Rodr</surname>
          </string-name>
          <string-name>
            <given-names>guez</given-names>
            , M.A.,
            <surname>Levashkin</surname>
          </string-name>
          , S. (eds.)
          <source>GeoS. Lecture Notes in Computer Science</source>
          , vol.
          <volume>4853</volume>
          , pp.
          <volume>51</volume>
          {
          <fpage>65</fpage>
          . Springer (
          <year>2007</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          6.
          <string-name>
            <given-names>Linares</given-names>
            <surname>Zaila</surname>
          </string-name>
          ,
          <string-name>
            <given-names>Y.</given-names>
            ,
            <surname>Montesi</surname>
          </string-name>
          ,
          <string-name>
            <surname>D.</surname>
          </string-name>
          : Geographic Information Extraction, Disambiguation and
          <string-name>
            <given-names>Ranking</given-names>
            <surname>Techniques</surname>
          </string-name>
          .
          <source>In: Proceedings of the 9th Workshop on Geographic Information Retrieval</source>
          . pp.
          <volume>11</volume>
          :
          <issue>1</issue>
          {
          <issue>11</issue>
          :
          <article-title>7</article-title>
          . GIR '15,
          <string-name>
            <surname>ACM</surname>
          </string-name>
          (
          <year>2015</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          7.
          <string-name>
            <surname>Llano</surname>
            ,
            <given-names>E.G.</given-names>
          </string-name>
          :
          <article-title>Estado actual de la interpretacion semantica de datos espaciales</article-title>
          .
          <source>Blue Series. Pattern Recognition. Digital version</source>
          (
          <year>2007</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          8.
          <string-name>
            <given-names>Maruf</given-names>
            <surname>Pasha</surname>
          </string-name>
          , Abdul Sattar:
          <article-title>Building Domain Ontologies From Relational Database Using Mapping Rules</article-title>
          .
          <source>International Journal of Intelligent Engineering &amp; Systems</source>
          <volume>5</volume>
          (
          <issue>1</issue>
          ) (
          <year>2012</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          9.
          <string-name>
            <surname>Mustafa</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Khan</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Latif</surname>
            ,
            <given-names>K.</given-names>
          </string-name>
          :
          <article-title>Ontology based semantic information retrieval</article-title>
          .
          <source>In: 4th International IEEE Conference Intelligent Systems</source>
          . vol.
          <volume>3</volume>
          , pp.
          <volume>22</volume>
          {
          <issue>14</issue>
          {
          <fpage>22</fpage>
          {
          <fpage>19</fpage>
          (
          <year>2008</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          10.
          <string-name>
            <surname>Natalya F. Noy</surname>
          </string-name>
          ,
          <string-name>
            <surname>Deborah L. McGuinness: Desarrollo de Ontolog</surname>
          </string-name>
          as-
          <volume>101</volume>
          :
          <article-title>Gu a Para Crear Tu Primera Ontolog a (</article-title>
          <year>2005</year>
          ), http://ocw.uc3m.
          <article-title>es/ingenieria-informatica/ sistemas-avanzados-</article-title>
          <string-name>
            <surname>de-</surname>
          </string-name>
          recuperacion-de-informacion/ejercicios/ ontology101-es.pdf/view
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          11.
          <string-name>
            <surname>Patroumpas</surname>
            ,
            <given-names>K.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Giannopoulos</surname>
            ,
            <given-names>G.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Athanasiou</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          :
          <article-title>Towards GeoSpatial Semantic Data Management: Strengths, Weaknesses, and Challenges Ahead</article-title>
          .
          <source>In: Proceedings of the 22Nd ACM SIGSPATIAL International Conference on Advances in GIS</source>
          . pp.
          <volume>301</volume>
          {
          <fpage>310</fpage>
          . SIGSPATIAL '14,
          <string-name>
            <surname>ACM</surname>
          </string-name>
          (
          <year>2014</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          12.
          <string-name>
            <surname>Ping</surname>
            ,
            <given-names>D.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Yong</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          :
          <article-title>Building Place Name Ontology to Assist in Geographic Information Retrieval</article-title>
          . vol.
          <volume>1</volume>
          , pp.
          <volume>306</volume>
          {
          <fpage>309</fpage>
          .
          <string-name>
            <surname>IEEE</surname>
          </string-name>
          (
          <year>2009</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          13.
          <string-name>
            <given-names>Sarabia</given-names>
            <surname>Lopez</surname>
          </string-name>
          , G.:
          <article-title>Busqueda y ponderacion de informacion contenida en bases de datos espaciales, utilizando jerarqu as</article-title>
          .
          <source>Ph.D. thesis</source>
          , Instituto Politecnico Nacional de Mexico (
          <year>2008</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          14.
          <string-name>
            <surname>Stadler</surname>
            ,
            <given-names>C.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Lehmann</surname>
          </string-name>
          , J., H&gt;
          <volume>12</volume>
          ner,
          <string-name>
            <given-names>K.</given-names>
            ,
            <surname>Auer</surname>
          </string-name>
          ,
          <string-name>
            <surname>S.:</surname>
          </string-name>
          <article-title>LinkedGeoData: A core for a web of spatial open data</article-title>
          .
          <source>Semantic Web</source>
          <volume>3</volume>
          (
          <issue>4</issue>
          ),
          <volume>333</volume>
          {
          <fpage>354</fpage>
          (
          <year>2012</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          15.
          <string-name>
            <given-names>Torres</given-names>
            <surname>Ruiz</surname>
          </string-name>
          ,
          <string-name>
            <surname>M.J.</surname>
          </string-name>
          :
          <article-title>Representacion Ontologica Basada en Descriptores Semanticos Aplicada a Objetos Geogra cos</article-title>
          .
          <source>Ph.D. thesis</source>
          , IPN. CIC (
          <year>2007</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref16">
        <mixed-citation>
          16. Vega Ram rez, A.,
          <string-name>
            <surname>Grangel</surname>
            <given-names>Gonzalez</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>I.</given-names>
            ,
            <surname>Saez</surname>
          </string-name>
          <string-name>
            <surname>Mosquera</surname>
          </string-name>
          ,
          <string-name>
            <surname>I.</surname>
          </string-name>
          , Garc a Castro, R.:
          <article-title>Procedimiento para la obtencion de un modelo ontologico para representar la informacion contenida en bases de datos</article-title>
          .
          <source>In: Proceedings of the 1st Cuban Workshop on Semantic Web</source>
          <year>2014</year>
          (
          <year>2014</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref17">
        <mixed-citation>
          17.
          <string-name>
            <given-names>Vera</given-names>
            <surname>Voronisky</surname>
          </string-name>
          ,
          <string-name>
            <given-names>F.</given-names>
            ,
            <surname>Garea Llano</surname>
          </string-name>
          , E.:
          <article-title>Alineamiento de ontolog as en el dominio geoespacial</article-title>
          .
          <source>Tech. rep.</source>
          , Centro de Aplicaciones de Tecnolog as de Avanzada,
          <source>CENATAV</source>
          (
          <year>2009</year>
          )
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>