<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Aplicacion de metodos de aprendiza je automatico en un sistema basado en ontolog a</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Mar a-Isabel Castellanos</string-name>
          <email>mcastellanosd@uho.edu.cu</email>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Ariam Rivas</string-name>
          <email>arivasm90@gmail.com</email>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Emilio Lucas</string-name>
          <email>elucasl@uho.edu.cu</email>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Departamento de Ingenier a Informatica, Universidad de Holgu n</institution>
          ,
          <country country="CU">Cuba</country>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>Departamento de Matematica, Universidad de Holgu n</institution>
          ,
          <country country="CU">Cuba</country>
        </aff>
      </contrib-group>
      <fpage>86</fpage>
      <lpage>97</lpage>
      <abstract>
        <p>The ontology-based system for the management of environmental indicators in corporations (SIGCIA) allows the detection of an indicator alteration, if it exceeds a limit value. In this case, this system recommends the possible environmental impacts, the causes of the indicator alteration and the mitigation actions. In order to make these recommendations, the limit value for each indicator must be pre-de ned in the software by the environmental management specialist. This means that the determination of limit values is done subjectively, based on the knowledge of the historical behavior of the indicator in a speci c organization; so it is necessary to have an automatic forecast method. This research transits through all the phases of the process of Knowledge Discovery in Data (KDD). A selection of attributes in the dataset was made applying several selectors and a group of regression models were applied. Arti cial Neural Networks with Multi-Layer Perceptron topology showed best performance. It allows the prediction of the limit value of the energy consumption indicator, dataset selected as study case. The prediction of limit values and the potential o ered by the ontology-based recommendation system make it a powerful tool to support decision-making in the process of environmental management, with broad generalization possibilities in Cuban business sector.</p>
      </abstract>
      <kwd-group>
        <kwd>Environmental Indicators</kwd>
        <kwd>Arti cial Neural Networks</kwd>
        <kwd>Forecast</kwd>
        <kwd>Ontology-based System</kwd>
      </kwd-group>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>Resumen. El sistema basado en ontolog a para la gestion de los
indicadores ambientales empresariales (SIGCIA) permite detectar la
alteracion de un indicador, si sobrepasa un valor l mite; recomendando los
posibles impactos ambientales, las causas de la alteracion del indicador y
las acciones de mitigacion. Para poder realizar estas recomendaciones, en
el software debe estar prede nido por el especialista de gestion ambiental
el valor l mite para cada indicador. Esto trae como consecuencia que la
determinacion de valores l mites se realice de forma subjetiva, en base al
conocimiento del comportamiento historico del indicador en una
organizacion espec ca; por lo que se hace necesario contar con un metodo de
pronostico automatico. Esta investigacion transita por todas las fases del
proceso de Descubrimiento del Conocimiento en Datos (KDD). Se realiza
una seleccion de atributos en el conjunto de datos, donde se aplicaron
varios selectores y algoritmos de regresion. El de mejor rendimiento fue
las Redes Neuronales Arti ciales con topolog a Multi-Layer Perceptron;
el cual permite la prediccion del valor l mite del indicador de consumo de
energ a que fue el conjunto de datos seleccionado como caso de estudio.
La prediccion de valores l mites, unido a las potencialidades que ofrece el
sistema de recomendacion basado en ontolog a, convierten al SIGCIA en
una potente herramienta de apoyo a la toma de decisiones en el proceso
de Gestion Ambiental, con una amplia posibilidad de generalizacion en
el sector empresarial cubano.</p>
      <p>Palabras claves: Indicadores Ambientales, Redes Neuronales Arti
ciales, Prediccion, Sistema Basado en Ontolog a
1.</p>
    </sec>
    <sec id="sec-2">
      <title>Introduccion</title>
      <p>
        La herramienta de gestion mas importante para el control medioambiental
son los indicadores1. Los indicadores ambientales condensan la informacion y
simpli can el acercamiento a los fenomenos medioambientales, a menudo
complejos, lo que los hace muy utiles para la comunicacion [
        <xref ref-type="bibr" rid="ref10">10</xref>
        ].
      </p>
      <p>
        La utilidad de estos indicadores consiste en facilitar, tanto a la direccion de la
organizacion como al resto de los miembros, informacion relevante y resumida,
en forma de declaraciones concisas e ilustrativas para la toma de decisiones.
Por lo tanto, aseguran una rapida evaluacion de las principales mejoras y de los
puntos debiles en la proteccion ambiental de la empresa; para aquellos que han
de tomar las decisiones [
        <xref ref-type="bibr" rid="ref13">13</xref>
        ].
      </p>
      <p>Por esta razon, es una necesidad el uso de indicadores ambientales para medir
el comportamiento de la organizacion en esta area, facilitar la comunicacion y
condensar la informacion ambiental. El uso de indicadores, a su vez, contribuye
a una mejora en la gestion del conocimiento ambiental.</p>
      <p>
        Para gestionar el conocimiento es determinante su representacion, lo cual
no es mas que el proceso de estructurar el conocimiento sobre un problema
de manera que sea mas facil de resolver. En aras de potenciar la gestion y
espec camente la representacion del conocimiento, las Tecnolog as Semanticas
(TS) son cada vez mas utilizadas [
        <xref ref-type="bibr" rid="ref14">14</xref>
        ][
        <xref ref-type="bibr" rid="ref16">16</xref>
        ]. Dentro de las TS, las ontolog as son
actualmente una de las Formas de Representacion del Conocimiento (FRC) mas
empleadas [
        <xref ref-type="bibr" rid="ref6">6</xref>
        ][
        <xref ref-type="bibr" rid="ref17">17</xref>
        ].
      </p>
      <p>
        En este sentido los autores [
        <xref ref-type="bibr" rid="ref3">3</xref>
        ] desarrollaron un Sistema basado en ontolog a
para la gestion del conocimiento de indicadores ambientales (SIGCIA); con el
objetivo de gestionar el conocimiento ambiental que se in ere del almacenamiento
historico de los indicadores ambientales empresariales. En esta investigacion se
propone el uso de las Redes Neuronales Arti ciales (RNA) para predecir el valor
l mite del indicador a partir de su almacenamiento historico. Entre las
potencialidades que las RNA ofrecen esta que no necesitan un experto humano al cual
extraerle el conocimiento.
1 Un dato que ha sido seleccionado a partir de un conjunto estad stico mas amplio por
poseer una signi cacion y una representatividad particular [
        <xref ref-type="bibr" rid="ref10">10</xref>
        ].
      </p>
    </sec>
    <sec id="sec-3">
      <title>Sistema basado en ontolog a de indicadores ambientales</title>
      <p>
        Una de las formas de representacion del conocimiento mas empleadas
actualmente son las ontolog as; las cuales ofrecen dis miles ventajas para la modelacion,
generacion, distribucion y uso del conocimiento producido y acumulado en las
organizaciones [
        <xref ref-type="bibr" rid="ref1">1</xref>
        ][
        <xref ref-type="bibr" rid="ref4">4</xref>
        ]. Dadas estas ventajas para la gestion del conocimiento, las
ontolog as son ampliamente usadas para gestionar los amplios volumenes de
informacion ambiental que devienen de este proceso, principalmente del
almacenamiento historico de los indicadores ambientales.
      </p>
      <p>El sistema SIGCIA se basa en la ontolog a OntoEnvironmental, en la cual se
modelan los indicadores ambientales que rigen el proceso de gestion ambiental
empresarial. En la Figura 1 se muestra el sistema de indicadores al que se hace
referencia.</p>
      <p>
        Este software basado en este sistema de indicadores, permite el calculo de
estos teniendo en cuenta que el indicador debe tener prede nido su valor l mite
(el cual es de nido por el Especialista de Gestion Ambiental de forma manual,
en correspondencia al concomimiento tacito sobre el comportamiento historico
del indicador). En respuesta a esta accion el sistema se encarga de comparar el
valor y el valor l mite del indicador. En caso de que el valor del indicador resulte
mayor que el valor l mite, el sistema declara que el indicador esta alterado y
mediante la maquina de inferencia recomienda las posibles causas, los posibles
impactos ambientales y las acciones de mitigacion [
        <xref ref-type="bibr" rid="ref3">3</xref>
        ].
      </p>
      <p>No obstante a las potenciales mejoras que la implantacion del sistema
SIGCIA ofrece para el correcto desempen~o del proceso de gestion ambiental en las
organizaciones, aun existe la siguiente de ciencia. Al Especialista de Gestion
Ambiental se le di culta el establecimiento de valores l mites debido a que los
indicadores re ejan diversas area de la entidad (por ejemplo area energetica,
transporte), por lo tanto se establece el valor de una forma subjetiva. Esto trae
como consecuencia que una mala decision al establecer un valor l mite restrinja
las potencialidades que el sistema ofrece, al no hacer las recomendaciones de
forma oportuna.
3.</p>
      <p>Proceso de descubrimiento de conocimiento en datos
Los grandes volumenes de datos e informacion que se manejan en la
actualidad han tra do como consecuencia la necesidad de desarrollar tecnicas y
herramientas que permitan asistir al hombre a extraer informacion util, conocimiento
y patrones de los datos almacenados. Para suplir esta necesidad surge el Proceso
de Descubrimiento de Conocimiento en Datos (KDD ).</p>
      <p>
        De acuerdo a Fayyad [
        <xref ref-type="bibr" rid="ref8">8</xref>
        ] es de nido como: El proceso no trivial de
identi cacion en los datos, de patrones validos, novedosos, comprensibles y
potencialmente utiles. El KDD es un area de la computacion que intenta explotar la
enorme cantidad de informacion mediante el descubrimiento de patrones utiles
y representativos, extrayendo conocimiento que pueda asistir a un humano para
llevar a cabo tareas de forma mas e ciente y satisfactoria. A continuacion se
muestran de manera general las fases por las que atraviesa este proceso:
Seleccion: desarrolla un entendimiento del dominio del problema y de los
datos que seran utilizados en la tarea de descubrimiento de conocimiento.
Pre-procesamiento y transformacion: cubre el total de actividades para la
construccion de conjunto de datos nal. En esta tarea se incluye la seleccion
de registros, atributos, limpieza de los datos, tratamiento de los valores
ausentes, entre otros. Tambien se realiza la transformacion de los datos en
el formato requerido por la herramienta de miner a de datos seleccionada.
Esta tarea consume entre el 35% y 20% del tiempo [
        <xref ref-type="bibr" rid="ref5">5</xref>
        ].
      </p>
      <p>Miner a de datos (MD): es la determinacion de la tarea de descubrimiento
a realizar (clasi cacion, regresion, agrupamiento) y la aplicacion de uno o
varios algoritmos, de dicha tarea, con el n de descubrir patrones ocultos en
los datos. Esta tarea ocupa entre el 15% y 20% del tiempo de realizacion del
proyecto.</p>
      <p>Interpretacion y evaluacion: se interpretan y evaluan los patrones
descubiertos, por lo que en ocasiones es necesario regresar a los pasos anteriores, lo
que implica repetir el proceso, tal vez con otros datos, algoritmos, metas y
estrategias. Este paso puede ser auxiliado por visualizaciones y contribuye a
eliminar patrones redundantes o irrelevantes.
3.1.</p>
      <sec id="sec-3-1">
        <title>Seleccion de los datos</title>
        <p>Todo proyecto KDD tiene sus or genes en la peticion de un cliente el cual
quiere mejorar algunos de sus procesos, haciendo uso de los datos historicos de
dichos procesos. Para sacar el maximo provecho de estos datos se hace necesario
que los que realicen de este tipo de proyecto conozcan y comprendan dichos
datos.</p>
        <p>El almacenamiento historico de cada indicador ambiental constituye un
conjunto de datos. A este indicador es necesario calcularle su valor l mite para
delimitar cuando esta alterado y recomendar las posibles causas, los posibles
impactos ambientales y las acciones de mitigacion. Para determinar el valor l mite
se aplico el esquema KDD, con la idea de encontrar un modelo que permita
obtener dicho valor de la manera mas exacta posible.</p>
        <p>Para la realizacion de esta investigacion se cuenta con los datos referentes al
indicador de consumo de energ a mensual de la Empresa Constructora del Poder
Popular (ECOPP) de la provincia de Holgu n, Cuba. Esta informacion contiene
un historial de aproximadamente 5 an~os (del 1 de diciembre del 2010 hasta 1 de
noviembre del 2015). La ECOPP para registrar en sus archivos el consumo de
electricidad mensual maneja cinco parametros como se muestra en la tabla 1.</p>
        <p>La gura 2 muestra el comportamiento de las instancias del conjunto de
datos. Se puede observar como en la mayor a de los meses el consumo de energ a
se encuentra entre 1600-2445 (watt/hora).</p>
      </sec>
      <sec id="sec-3-2">
        <title>Seleccion de atributos</title>
        <p>La Seleccion de Atributos (SA) se puede de nir como el proceso de obtener
los n atributos mas representativos de los N originales a partir de la eliminacion
de los redundantes e irrelevantes. De una manera mas formal, el objetivo es
seleccionar un subconjunto de atributos S del espacio original A con clase C,
tal que P (CjS) P (CjA), es decir, obtener mejor o igual desempen~o predictivo
mediante la eliminacion de atributos ruidosos y redundantes.</p>
        <p>Existen varios criterios para agrupar los algoritmos de SA. Uno de ellos lo
constituye el modo de aplicacion, segun el cual pueden ser vistos como de ltro
( lter) o envolvente (wrapper). En esta investigacion el modo de aplicacion de
los algoritmos de seleccion de atributos fue mediante el criterio de wrapper.</p>
        <p>Los envolventes son aquellos que se auxilian de la precision del clasi cador
para evaluar a los subconjuntos del espacio. Esta estrategia ofrece mejores
resultados, ya que en un paso previo a la clasi cacion el algoritmo de aprendizaje
escoge a los atributos que mejor representen el conocimiento para su construccion;
sin embargo es altamente costosa. Se emplearon cinco algoritmos de
estrategias envolventes: LinearRegression (LR), MultilayerPerceptron (MLP), M5P, K
vecinos mas cercanos (K-nn) y M5Rules (M5R).</p>
        <p>
          LinearRegression El analisis regresivo es una tecnica utilizada para inter y
extra polar las observaciones, las cuales pueden clasi carse como regresion lineal
o no lineal. Se habla de modelo de regresion cuando la variable de respuesta y
las variables explicativas son todas cuantitativas. Ademas permite determinar el
modelo o ecuacion matematica que mejor representa la relacion existente entre
las variables que se analizan [
          <xref ref-type="bibr" rid="ref18">18</xref>
          ].
        </p>
        <p>
          MultilayerPerceptron Una Red Neuronal Arti cial (RNA) es un modelo
computacional que pretende simular el funcionamiento del cerebro. El proceso de
aprendizaje de una RNA de topolog a MultilayerPerceptron consiste en
determinar los pesos que permitan codi car el conocimiento subyacente en los datos [
          <xref ref-type="bibr" rid="ref2">2</xref>
          ].
Esto consiste en hacer variar los pesos en funcion de alguna regla de aprendizaje
hasta que los mismos sean constantes, con lo que se dice que la red ha aprendido.
El buen funcionamiento predictivo del mismo viene dado por la alta tolerancia
al ruido de los datos y la habilidad de capturar relaciones complejas entre los
atributos y la clase.
        </p>
        <p>
          M5P En el caso del algoritmo M5P, se trata de obtener un arbol de modelos
(un modelo lineal que predice el valor de la clase), si bien se puede utilizar para
obtener un arbol de regresion, por ser este un caso espec co de arbol de modelos
[
          <xref ref-type="bibr" rid="ref12">12</xref>
          ].
        </p>
        <p>
          K vecinos mas cercanos Es un algoritmo simple que almacena todos los
casos disponibles y clasi ca los nuevos casos sobre la base de una medida de
similitud (funciones de distancia). K-nn se ha utilizado en el reconocimiento de
patrones estad sticos, estimacion y ya en el inicio de decada de 1970 como una
tecnica no parametrica. Un caso se clasi ca por un voto de la mayor a de sus
vecinos, con el caso que se asigna a la clase mas comun entre sus vecinos mas
cercanos K, medidos por una funcion de la distancia. Si K = 1, entonces el caso
es simplemente asignado a la clase de su vecino mas cercano [
          <xref ref-type="bibr" rid="ref15">15</xref>
          ].
M5Rules El algoritmo M5R [
          <xref ref-type="bibr" rid="ref11">11</xref>
          ] es un algoritmo de induccion simple aunque los
conjuntos de reglas de los arboles de modelos son precisos. El algoritmo trabaja
construyendo modelos de arboles repetidamente y selecciona la mejor regla en
cada iteracion. Produce conjuntos de reglas que son en general tan precesio y a
la vez mas pequen~os que los arboles de modelos contruidos con el conjunto de
datos completo.
3.3.
        </p>
      </sec>
      <sec id="sec-3-3">
        <title>Miner a de datos</title>
        <p>
          En esta investigacion se ha preparado un estudio experimental para explorar
el comportamiento de las RNA, en conjuntos de datos donde su tipo de clase es
continua. Se ha utilizado para la ejecucion de los experimentos la herramienta
Weka [
          <xref ref-type="bibr" rid="ref9">9</xref>
          ]. Desarrollada en la Universidad de Waikato (Nueva Zelanda) bajo
licencia GNU (General Public License), se caracteriza por la independencia de
arquitectura.
        </p>
        <p>
          Es utilizado un esquema de experimentacion basado en validacion cruzada
que garantiza una mayor robustez estad stica. Esta propuesta consiste en un
procedimiento de validacion cruzada con diez particiones con una corrida como lo
propone [
          <xref ref-type="bibr" rid="ref7">7</xref>
          ]. Como parametro de evaluacion se emplea: coe ciente de correlacion
y error medio absoluto.
        </p>
        <p>La correlacion es la tecnica estad stica que estudia el problema de medir la
intensidad o el grado de relacion que existe entre las variables que se investigan.
El Coe ciente de Correlacion, es un valor comprendido entre 1 y 1, indica la
relacion lineal que existe entre dos variables. El error medio absoluto mide la
magnitud media de los errores en un conjunto de pronosticos, sin tener en cuenta
su direccion. Mide la precision para las variables continuas.</p>
        <p>Se realizo una experimentacion utilizando los algoritmos de seleccion de
estrategia Wrapper mencionados anteriormente y como algoritmos de regresion:
LR, MLP, M5P, K-nn y M5R. Los resultados arrojados se muestran en la Tabla
2 y Tabla 3.
3.4.</p>
      </sec>
      <sec id="sec-3-4">
        <title>Interpretacion y evaluacion</title>
        <p>En la Tabla 2 y en la Tabla 3 los valores resaltados son los algoritmos de
mejor coe ciente de correlacion y error absoluto medio respectivamente. Se puede
observar como el algoritmo de regresion MLP con el selector de atributos de
estrategia Wrapper MLP es el de mayor coe ciente de correlacion en la Tabla 2
y el de menor error medio absoluto en la Tabla 3.</p>
        <p>En la Figura 3 se muestra el consumo de energ a electrica en la ECOPP
durante cinco an~os. En dicha gra ca de tendencia los consumos estan presentados
por meses. El color azul representa el consumo real, mientras que el color rojo es
el consumo pronosticado por el algoritmo MLP. Se puede apreciar como el error
del clasi cador es bajo.</p>
        <p>Integracion del algoritmo de prediccion de valores
l mites en el SIGCIA</p>
        <p>Con el modelo optimo seleccionado, MLP, se dio paso a la integracion del
algoritmo de prediccion de valores l mites, Figura 4, en el modelo SIGCIA. En
este diagrama el primer paso es que el usuario introduzca los datos, que
constituyen el valor del indicador para ese mes. Luego el modelo de RNA seleccionado
analiza estos datos de entrada y realiza su pronostico, que para el SIGCIA va
ser el valor l mite. Cuando se obtenga el valor real del indicador este se
compara con el pronostico (valor l mite). En caso de ser mayor el real, mediante la
maquina de inferencia, que posee la arquitectura del SIGCIA, esta recomienda
las posibles causas de alteracion del indicador, los posibles impactos ambientales
y las acciones de mitigacion.</p>
        <p>Para lograr la integracion del algoritmo de prediccion de valores l mites al
SIGCIA, se crea en el sistema un grupo de clases. Una clase (Modelo Clasi cacion)
la cual se encarga de construir el Dataset haciendo uso de los datos que se
encuentran en la tabla (tb consumo energ a) incluida en la base de datos db indicadores.
Para la construccion del modelo y clasi car la instancia se hace uso de la librer a
WEKA ver Figura 5.</p>
        <p>Fig. 5. Integracion de Weka al
SIGCIA.</p>
        <p>Cuando el usuario (Especialista de Gestion Ambiental) desea gestionar el
valor l mite del indicador, en este caso consumo total de energ a, una vez
seleccionado el indicador hace click en el boton adicionar y se muestra una ventana de
dialogo donde se tienen dos opciones, introducir el valor manualmente o generar
el valor como se muestra en la Figura 6. Si el usuario selecciona la opcion de
generar el valor l mite, se le muestra un formulario el cual debe llenar para el
correcto funcionamiento del algoritmo (ver Figura 7). Luego de llenar los datos del
formulario correctamente el usuario hace click en el boton insertar, acto seguido
se ejecuta el metodo generarValorl mite() el cual crea primeramente una
instancia temporal con los datos introducidos por el usuario en el formulario, construye
el modelo de regresion, clasi ca la instancia y propone el valor l mite. Una vez
de nido el valor l mite del indicador; el usuario calcula el valor real del mismo
para el mes en curso. Este valor es guardado en la base de datos y se actualiza el
dataset. Posteriormente si el valor del indicador real sobrepasa el valor l mite el
sistema ofrece un conjunto de recomendaciones, fruto de las consultas realizadas
a la ontolog a OntoEnvironmental.</p>
      </sec>
    </sec>
    <sec id="sec-4">
      <title>Conclusiones</title>
      <p>En el estudio de los algoritmos de seleccion de atributos con la estrategia
Wrapper para seleccionar los metodos a aplicar en la investigacion, permitio
constatar que exist an atributos redundantes e irrelevantes, debido a que el de
mejores resultados fue Wrapper (MLP) eliminando el atributo Intensidad. El
estudio realizado sobre los cinco modelos de regresion de distintas ramas, arrojo
que el algoritmo de regresion MultiLayerPerceptron en cuanto a los parametros
medidos (coe ciente de correlacion y error absoluto medio) fue el de mejores
resultados.</p>
      <p>La integracion del algoritmo de regresion MultiLayerPerceptron al sistema
SIGCIA permite la prediccion del valor l mite del indicador consumo de energ a
que fue el conjunto de datos seleccionado en la investigacion actual. Lo anterior
facilita el trabajo del Especialista de Gestion Ambiental debido a que el sistema
realiza las recomendaciones de forma oportuna y favorece la toma de decisiones
al respecto. Los resultados obtenidos con la aplicacion del algoritmo de regresion
MultiLayerPerceptron al conjunto de datos tomado de la Empresa Constructora
del Poder Popular acerca del indicador consumo de energ a demuestra que para
este indicador en otras organizaciones el algoritmo antes mencionado se puede
generalizar.</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          1.
          <string-name>
            <surname>Arp</surname>
            ,
            <given-names>R.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Smith</surname>
            ,
            <given-names>B.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Spear</surname>
            ,
            <given-names>A.D.</given-names>
          </string-name>
          :
          <article-title>Building ontologies with basic formal ontology</article-title>
          . Mit Press (
          <year>2015</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          2.
          <string-name>
            <surname>Bishop</surname>
            ,
            <given-names>C.</given-names>
          </string-name>
          :
          <article-title>Extremely well-written, up-to-date. Requires a good mathematical background, but rewards careful reading, putting neural networks rmly into a statistical context</article-title>
          .
          <source>Neural Networks for Pattern Recognition</source>
          (
          <year>1995</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          3. Castellanos Dom ngez,
          <string-name>
            <surname>M.I.</surname>
          </string-name>
          ,
          <string-name>
            <given-names>Quevedo</given-names>
            <surname>Castro</surname>
          </string-name>
          ,
          <string-name>
            <given-names>C.M.</given-names>
            , Vega Ram rez, A.,
            <surname>Grangel</surname>
          </string-name>
          <string-name>
            <surname>Gonzalez</surname>
          </string-name>
          ,
          <string-name>
            <surname>I.</surname>
          </string-name>
          , Moreno Rodr guez, R.:
          <article-title>Sistema basado en ontolog a para el apoyo a la toma de decisiones en el proceso de gestion ambiental empresarial</article-title>
          .
          <source>In: II International Workshop of Semantic Web</source>
          . vol.
          <volume>1797</volume>
          .
          <string-name>
            <surname>CEUR-WS</surname>
            , La
            <given-names>Habana</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Cuba</surname>
          </string-name>
          (
          <year>2016</year>
          ), http://ceur-ws.
          <source>org/</source>
          Vol-
          <volume>1797</volume>
          /
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          4.
          <string-name>
            <surname>Cimiano</surname>
            ,
            <given-names>P.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>McCrae</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Buitelaar</surname>
            ,
            <given-names>P.</given-names>
          </string-name>
          :
          <article-title>Lexicon model for ontologies: Community report</article-title>
          . W3C
          <string-name>
            <surname>Ontology-Lexicon Community Group</surname>
          </string-name>
          (
          <year>2016</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          5.
          <string-name>
            <surname>Cios</surname>
            ,
            <given-names>K.J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Kurgan</surname>
            ,
            <given-names>L.A.</given-names>
          </string-name>
          :
          <article-title>Trends in Data Mining and Knowledge Discovery (Dm</article-title>
          ),
          <volume>1</volume>
          {
          <fpage>26</fpage>
          (
          <year>2000</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          6.
          <string-name>
            <surname>Davis</surname>
          </string-name>
          , E.:
          <article-title>Representations of commonsense knowledge</article-title>
          . Morgan Kaufmann (
          <year>2014</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          7.
          <string-name>
            <surname>Demsar</surname>
          </string-name>
          , J.:
          <article-title>Comparison of Classi ers over Multiple Data Sets</article-title>
          .
          <source>Journal of Machine Learning Research</source>
          vol.
          <volume>7</volume>
          :
          <issue>31</issue>
          (
          <year>2006</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          8.
          <string-name>
            <surname>Fayyad</surname>
            ,
            <given-names>U.</given-names>
          </string-name>
          :
          <source>The KDD Process for Extracting Useful Knowledge from Volumes of Data</source>
          <volume>39</volume>
          (
          <issue>11</issue>
          ),
          <volume>27</volume>
          {
          <fpage>34</fpage>
          (
          <year>1996</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          9.
          <string-name>
            <surname>Frank</surname>
            ,
            <given-names>I.H.W.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>E:</surname>
          </string-name>
          <article-title>Practical Machine Learning Tools and Techniques (</article-title>
          <year>2005</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          10.
          <string-name>
            <surname>Heink</surname>
            ,
            <given-names>U.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Kowarik</surname>
            ,
            <given-names>I.</given-names>
          </string-name>
          :
          <article-title>What are indicators? On the de nition of indicators in ecology and environmental planning</article-title>
          .
          <source>Ecological Indicators ELSEVIER</source>
          <volume>10</volume>
          ,
          <issue>584</issue>
          {
          <fpage>593</fpage>
          (
          <year>2010</year>
          ), www.elsevier.com/locate/ecolind
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          11.
          <string-name>
            <surname>Holmes</surname>
            ,
            <given-names>G.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Hall</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Frank</surname>
          </string-name>
          , E.:
          <article-title>Generating Rule Sets from Model Trees (</article-title>
          <year>1999</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          12.
          <string-name>
            <surname>Holte</surname>
          </string-name>
          , R.C.:
          <article-title>Very Simple Classi cation Rules Perform Well on Most Commonly Used Datasets (</article-title>
          <year>1988</year>
          ),
          <volume>63</volume>
          {
          <fpage>91</fpage>
          (
          <year>1993</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          13. IHOBE:
          <article-title>Gu a de Indicadores Medioambientales para la Empresa (</article-title>
          <year>1999</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          14.
          <string-name>
            <surname>Kharlamov</surname>
            ,
            <given-names>E.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Solomakhina</surname>
            , N.,
            <given-names>O</given-names>
          </string-name>
          zcep,
          <string-name>
            <given-names>O.L.</given-names>
            ,
            <surname>Zheleznyakov</surname>
          </string-name>
          ,
          <string-name>
            <given-names>D.</given-names>
            ,
            <surname>Hubauer</surname>
          </string-name>
          ,
          <string-name>
            <given-names>T.</given-names>
            ,
            <surname>Lamparter</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S.</given-names>
            ,
            <surname>Roshchin</surname>
          </string-name>
          ,
          <string-name>
            <given-names>M.</given-names>
            ,
            <surname>Soylu</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            ,
            <surname>Watson</surname>
          </string-name>
          ,
          <string-name>
            <surname>S.</surname>
          </string-name>
          :
          <article-title>How semantic technologies can enhance data access at siemens energy</article-title>
          .
          <source>In: International Semantic Web Conference</source>
          . pp.
          <volume>601</volume>
          {
          <fpage>619</fpage>
          . Springer (
          <year>2014</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          15.
          <string-name>
            <surname>Kheli</surname>
            J.,
            <given-names>F..J.:</given-names>
          </string-name>
          <article-title>K-NN Regression to Improve Statistical Feature Extraction for Texture Retrieval</article-title>
          .
          <source>IEEE Transactions on Image Processing</source>
          pp.
          <volume>20</volume>
          ,
          <issue>293</issue>
          {
          <fpage>298</fpage>
          . (
          <year>2011</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref16">
        <mixed-citation>
          16.
          <string-name>
            <surname>Meron</surname>
          </string-name>
          <article-title>~o Pen~uela,</article-title>
          <string-name>
            <given-names>A.</given-names>
            ,
            <surname>Ashkpour</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            ,
            <surname>Van Erp</surname>
          </string-name>
          ,
          <string-name>
            <given-names>M.</given-names>
            ,
            <surname>Mandemakers</surname>
          </string-name>
          ,
          <string-name>
            <given-names>K.</given-names>
            ,
            <surname>Breure</surname>
          </string-name>
          ,
          <string-name>
            <given-names>L.</given-names>
            ,
            <surname>Scharnhorst</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            ,
            <surname>Schlobach</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S.</given-names>
            ,
            <surname>Van Harmelen</surname>
          </string-name>
          ,
          <string-name>
            <surname>F.</surname>
          </string-name>
          :
          <article-title>Semantic technologies for historical research: A survey</article-title>
          .
          <source>Semantic Web</source>
          <volume>6</volume>
          (
          <issue>6</issue>
          ),
          <volume>539</volume>
          {
          <fpage>564</fpage>
          (
          <year>2015</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref17">
        <mixed-citation>
          17.
          <string-name>
            <surname>Tiropanis</surname>
            ,
            <given-names>T.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Davis</surname>
            ,
            <given-names>H.C.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Cerri</surname>
            ,
            <given-names>S.A.</given-names>
          </string-name>
          :
          <article-title>Semantic Technologies and Learning</article-title>
          .
          <source>In: Encyclopedia of the Sciences of Learning</source>
          , pp.
          <volume>3029</volume>
          {
          <fpage>3032</fpage>
          . Springer (
          <year>2012</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref18">
        <mixed-citation>
          18.
          <string-name>
            <surname>Torres-Reyna</surname>
          </string-name>
          :
          <article-title>Regression Analysis</article-title>
          .
          <source>Data Analysis 101</source>
          . University Princeton (
          <year>2009</year>
          )
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>