<?xml version="1.0" encoding="UTF-8"?>
<TEI xml:space="preserve" xmlns="http://www.tei-c.org/ns/1.0" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://www.tei-c.org/ns/1.0 https://raw.githubusercontent.com/kermitt2/grobid/master/grobid-home/schemas/xsd/Grobid.xsd"
 xmlns:xlink="http://www.w3.org/1999/xlink">
	<teiHeader xml:lang="en">
		<fileDesc>
			<titleStmt>
				<title level="a" type="main">Aplicación de métodos de aprendizaje automático en un sistema basado en ontología</title>
			</titleStmt>
			<publicationStmt>
				<publisher/>
				<availability status="unknown"><licence/></availability>
			</publicationStmt>
			<sourceDesc>
				<biblStruct>
					<analytic>
						<author>
							<persName><forename type="first">María-Isabel</forename><surname>Castellanos</surname></persName>
							<email>mcastellanosd@uho.edu.cu</email>
							<affiliation key="aff0">
								<orgName type="department">Departamento de Ingeniería Informática</orgName>
								<orgName type="institution">Universidad de Holguín</orgName>
								<address>
									<country key="CU">Cuba</country>
								</address>
							</affiliation>
						</author>
						<author>
							<persName><forename type="first">Ariam</forename><surname>Rivas</surname></persName>
							<affiliation key="aff1">
								<orgName type="department">Departamento de Matemática</orgName>
								<orgName type="institution">Universidad de Holguín</orgName>
								<address>
									<country key="CU">Cuba</country>
								</address>
							</affiliation>
						</author>
						<author>
							<persName><forename type="first">Emilio</forename><surname>Lucas</surname></persName>
							<email>elucasl@uho.edu.cu</email>
							<affiliation key="aff0">
								<orgName type="department">Departamento de Ingeniería Informática</orgName>
								<orgName type="institution">Universidad de Holguín</orgName>
								<address>
									<country key="CU">Cuba</country>
								</address>
							</affiliation>
						</author>
						<title level="a" type="main">Aplicación de métodos de aprendizaje automático en un sistema basado en ontología</title>
					</analytic>
					<monogr>
						<imprint>
							<date/>
						</imprint>
					</monogr>
					<idno type="MD5">7D3BADB9A149BE1309D48320CD18D1C5</idno>
				</biblStruct>
			</sourceDesc>
		</fileDesc>
		<encodingDesc>
			<appInfo>
				<application version="0.7.2" ident="GROBID" when="2023-03-24T00:49+0000">
					<desc>GROBID - A machine learning software for extracting information from scholarly documents</desc>
					<ref target="https://github.com/kermitt2/grobid"/>
				</application>
			</appInfo>
		</encodingDesc>
		<profileDesc>
			<textClass>
				<keywords>
					<term>Environmental Indicators</term>
					<term>Artificial Neural Networks</term>
					<term>Forecast</term>
					<term>Ontology-based System</term>
				</keywords>
			</textClass>
			<abstract>
<div xmlns="http://www.tei-c.org/ns/1.0"><p>The ontology-based system for the management of environmental indicators in corporations (SIGCIA) allows the detection of an indicator alteration, if it exceeds a limit value. In this case, this system recommends the possible environmental impacts, the causes of the indicator alteration and the mitigation actions. In order to make these recommendations, the limit value for each indicator must be pre-defined in the software by the environmental management specialist. This means that the determination of limit values is done subjectively, based on the knowledge of the historical behavior of the indicator in a specific organization; so it is necessary to have an automatic forecast method. This research transits through all the phases of the process of Knowledge Discovery in Data (KDD). A selection of attributes in the dataset was made applying several selectors and a group of regression models were applied. Artificial Neural Networks with Multi-Layer Perceptron topology showed best performance. It allows the prediction of the limit value of the energy consumption indicator, dataset selected as study case. The prediction of limit values and the potential offered by the ontology-based recommendation system make it a powerful tool to support decision-making in the process of environmental management, with broad generalization possibilities in Cuban business sector.</p></div>
			</abstract>
		</profileDesc>
	</teiHeader>
	<text xml:lang="en">
		<body>
<div xmlns="http://www.tei-c.org/ns/1.0"><p>Resumen. El sistema basado en ontología para la gestión de los indicadores ambientales empresariales (SIGCIA) permite detectar la alteración de un indicador, si sobrepasa un valor límite; recomendando los posibles impactos ambientales, las causas de la alteración del indicador y las acciones de mitigación. Para poder realizar estas recomendaciones, en el software debe estar predefinido por el especialista de gestión ambiental el valor límite para cada indicador. Esto trae como consecuencia que la determinación de valores límites se realice de forma subjetiva, en base al conocimiento del comportamiento histórico del indicador en una organización específica; por lo que se hace necesario contar con un método de pronóstico automático. Esta investigación transita por todas las fases del proceso de Descubrimiento del Conocimiento en Datos (KDD). Se realiza una selección de atributos en el conjunto de datos, donde se aplicaron varios selectores y algoritmos de regresión. El de mejor rendimiento fue las Redes Neuronales Artificiales con topología Multi-Layer Perceptron; el cual permite la predicción del valor límite del indicador de consumo de energía que fue el conjunto de datos seleccionado como caso de estudio. La predicción de valores límites, unido a las potencialidades que ofrece el sistema de recomendación basado en ontología, convierten al SIGCIA en una potente herramienta de apoyo a la toma de decisiones en el proceso de Gestión Ambiental, con una amplia posibilidad de generalización en el sector empresarial cubano.</p><p>Palabras claves: Indicadores Ambientales, Redes Neuronales Artificiales, Predicción, Sistema Basado en Ontología</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="1.">Introducción</head><p>La herramienta de gestión más importante para el control medioambiental son los indicadores<ref type="foot" target="#foot_0">1</ref> . Los indicadores ambientales condensan la información y simplifican el acercamiento a los fenómenos medioambientales, a menudo complejos, lo que los hace muy útiles para la comunicación <ref type="bibr" target="#b9">[10]</ref>.</p><p>La utilidad de estos indicadores consiste en facilitar, tanto a la dirección de la organización como al resto de los miembros, información relevante y resumida, en forma de declaraciones concisas e ilustrativas para la toma de decisiones. Por lo tanto, aseguran una rápida evaluación de las principales mejoras y de los puntos débiles en la protección ambiental de la empresa; para aquellos que han de tomar las decisiones <ref type="bibr" target="#b12">[13]</ref>.</p><p>Por esta razón, es una necesidad el uso de indicadores ambientales para medir el comportamiento de la organización en esta área, facilitar la comunicación y condensar la información ambiental. El uso de indicadores, a su vez, contribuye a una mejora en la gestión del conocimiento ambiental.</p><p>Para gestionar el conocimiento es determinante su representación, lo cual no es más que el proceso de estructurar el conocimiento sobre un problema de manera que sea más fácil de resolver. En aras de potenciar la gestión y específicamente la representación del conocimiento, las Tecnologías Semánticas (TS) son cada vez más utilizadas <ref type="bibr" target="#b13">[14]</ref> <ref type="bibr" target="#b15">[16]</ref>. Dentro de las TS, las ontologías son actualmente una de las Formas de Representación del Conocimiento (FRC) más empleadas <ref type="bibr" target="#b5">[6]</ref> <ref type="bibr" target="#b16">[17]</ref>.</p><p>En este sentido los autores <ref type="bibr" target="#b2">[3]</ref> desarrollaron un Sistema basado en ontología para la gestión del conocimiento de indicadores ambientales (SIGCIA); con el objetivo de gestionar el conocimiento ambiental que se infiere del almacenamiento histórico de los indicadores ambientales empresariales. En esta investigación se propone el uso de las Redes Neuronales Artificiales (RNA) para predecir el valor límite del indicador a partir de su almacenamiento histórico. Entre las potencialidades que las RNA ofrecen está que no necesitan un experto humano al cual extraerle el conocimiento.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="2.">Sistema basado en ontología de indicadores ambientales</head><p>Una de las formas de representación del conocimiento más empleadas actualmente son las ontologías; las cuales ofrecen disímiles ventajas para la modelación, generación, distribución y uso del conocimiento producido y acumulado en las organizaciones <ref type="bibr">[1][4]</ref>. Dadas estas ventajas para la gestión del conocimiento, las ontologías son ampliamente usadas para gestionar los amplios volúmenes de información ambiental que devienen de este proceso, principalmente del almacenamiento histórico de los indicadores ambientales.</p><p>El sistema SIGCIA se basa en la ontología OntoEnvironmental, en la cual se modelan los indicadores ambientales que rigen el proceso de gestión ambiental empresarial. En la Figura 1 se muestra el sistema de indicadores al que se hace referencia. Este software basado en este sistema de indicadores, permite el cálculo de estos teniendo en cuenta que el indicador debe tener predefinido su valor límite (el cual es definido por el Especialista de Gestión Ambiental de forma manual, en correspondencia al concomimiento tácito sobre el comportamiento histórico del indicador). En respuesta a esta acción el sistema se encarga de comparar el valor y el valor límite del indicador. En caso de que el valor del indicador resulte mayor que el valor límite, el sistema declara que el indicador está alterado y mediante la máquina de inferencia recomienda las posibles causas, los posibles impactos ambientales y las acciones de mitigación <ref type="bibr" target="#b2">[3]</ref>.</p><p>No obstante a las potenciales mejoras que la implantación del sistema SIG-CIA ofrece para el correcto desempeño del proceso de gestión ambiental en las organizaciones, aún existe la siguiente deficiencia. Al Especialista de Gestión Ambiental se le dificulta el establecimiento de valores límites debido a que los indicadores reflejan diversas área de la entidad (por ejemplo área energética, transporte), por lo tanto se establece el valor de una forma subjetiva. Esto trae como consecuencia que una mala decisión al establecer un valor límite restrinja las potencialidades que el sistema ofrece, al no hacer las recomendaciones de forma oportuna.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.">Proceso de descubrimiento de conocimiento en datos</head><p>Los grandes volúmenes de datos e información que se manejan en la actualidad han traído como consecuencia la necesidad de desarrollar técnicas y herramientas que permitan asistir al hombre a extraer información útil, conocimiento y patrones de los datos almacenados. Para suplir esta necesidad surge el Proceso de Descubrimiento de Conocimiento en Datos (KDD).</p><p>De acuerdo a Fayyad <ref type="bibr" target="#b7">[8]</ref> es definido como: El proceso no trivial de identificación en los datos, de patrones válidos, novedosos, comprensibles y potencialmente útiles. El KDD es un área de la computación que intenta explotar la enorme cantidad de información mediante el descubrimiento de patrones útiles y representativos, extrayendo conocimiento que pueda asistir a un humano para llevar a cabo tareas de forma más eficiente y satisfactoria. A continuación se muestran de manera general las fases por las que atraviesa este proceso: Selección: desarrolla un entendimiento del dominio del problema y de los datos que serán utilizados en la tarea de descubrimiento de conocimiento. Pre-procesamiento y transformación: cubre el total de actividades para la construcción de conjunto de datos final. En esta tarea se incluye la selección de registros, atributos, limpieza de los datos, tratamiento de los valores ausentes, entre otros. También se realiza la transformación de los datos en el formato requerido por la herramienta de minería de datos seleccionada. Esta tarea consume entre el 35% y 20% del tiempo <ref type="bibr" target="#b4">[5]</ref>. Minería de datos (MD): es la determinación de la tarea de descubrimiento a realizar (clasificación, regresión, agrupamiento) y la aplicación de uno o varios algoritmos, de dicha tarea, con el fin de descubrir patrones ocultos en los datos. Esta tarea ocupa entre el 15% y 20% del tiempo de realización del proyecto. Interpretación y evaluación: se interpretan y evalúan los patrones descubiertos, por lo que en ocasiones es necesario regresar a los pasos anteriores, lo que implica repetir el proceso, tal vez con otros datos, algoritmos, metas y estrategias. Este paso puede ser auxiliado por visualizaciones y contribuye a eliminar patrones redundantes o irrelevantes.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.1.">Selección de los datos</head><p>Todo proyecto KDD tiene sus orígenes en la petición de un cliente el cual quiere mejorar algunos de sus procesos, haciendo uso de los datos históricos de dichos procesos. Para sacar el máximo provecho de estos datos se hace necesario que los que realicen de este tipo de proyecto conozcan y comprendan dichos datos.</p><p>El almacenamiento histórico de cada indicador ambiental constituye un conjunto de datos. A este indicador es necesario calcularle su valor límite para delimitar cuando está alterado y recomendar las posibles causas, los posibles impactos ambientales y las acciones de mitigación. Para determinar el valor límite se aplicó el esquema KDD, con la idea de encontrar un modelo que permita obtener dicho valor de la manera más exacta posible.</p><p>Para la realización de esta investigación se cuenta con los datos referentes al indicador de consumo de energía mensual de la Empresa Constructora del Poder Popular (ECOPP) de la provincia de Holguín, Cuba. Esta información contiene un historial de aproximadamente 5 años (del 1 de diciembre del 2010 hasta 1 de noviembre del 2015). La ECOPP para registrar en sus archivos el consumo de electricidad mensual maneja cinco parámetros como se muestra en la tabla 1. La figura 2 muestra el comportamiento de las instancias del conjunto de datos. Se puede observar como en la mayoría de los meses el consumo de energía se encuentra entre 1600-2445 (watt/hora). </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.2.">Selección de atributos</head><p>La Selección de Atributos (SA) se puede definir como el proceso de obtener los n atributos más representativos de los N originales a partir de la eliminación de los redundantes e irrelevantes. De una manera más formal, el objetivo es seleccionar un subconjunto de atributos S del espacio original A con clase C, tal que P (C|S) ≈ P (C|A), es decir, obtener mejor o igual desempeño predictivo mediante la eliminación de atributos ruidosos y redundantes.</p><p>Existen varios criterios para agrupar los algoritmos de SA. Uno de ellos lo constituye el modo de aplicación, según el cual pueden ser vistos como de filtro (filter) o envolvente (wrapper). En esta investigación el modo de aplicación de los algoritmos de selección de atributos fue mediante el criterio de wrapper.</p><p>Los envolventes son aquellos que se auxilian de la precisión del clasificador para evaluar a los subconjuntos del espacio. Esta estrategia ofrece mejores resultados, ya que en un paso previo a la clasificación el algoritmo de aprendizaje escoge a los atributos que mejor representen el conocimiento para su construcción; sin embargo es altamente costosa. Se emplearon cinco algoritmos de estrategias envolventes: LinearRegression (LR), MultilayerPerceptron (MLP), M5P, K vecinos más cercanos (K-nn) y M5Rules (M5R).</p><p>LinearRegression El análisis regresivo es una técnica utilizada para inter y extra polar las observaciones, las cuales pueden clasificarse como regresión lineal o no lineal. Se habla de modelo de regresión cuando la variable de respuesta y las variables explicativas son todas cuantitativas. Además permite determinar el modelo o ecuación matemática que mejor representa la relación existente entre las variables que se analizan <ref type="bibr" target="#b17">[18]</ref>.</p><p>MultilayerPerceptron Una Red Neuronal Artificial (RNA) es un modelo computacional que pretende simular el funcionamiento del cerebro. El proceso de aprendizaje de una RNA de topología MultilayerPerceptron consiste en determinar los pesos que permitan codificar el conocimiento subyacente en los datos <ref type="bibr" target="#b1">[2]</ref>. Esto consiste en hacer variar los pesos en función de alguna regla de aprendizaje hasta que los mismos sean constantes, con lo que se dice que la red ha aprendido. El buen funcionamiento predictivo del mismo viene dado por la alta tolerancia al ruido de los datos y la habilidad de capturar relaciones complejas entre los atributos y la clase.</p><p>M5P En el caso del algoritmo M5P, se trata de obtener un árbol de modelos (un modelo lineal que predice el valor de la clase), si bien se puede utilizar para obtener un árbol de regresión, por ser este un caso específico de árbol de modelos <ref type="bibr" target="#b11">[12]</ref>.</p><p>K vecinos más cercanos Es un algoritmo simple que almacena todos los casos disponibles y clasifica los nuevos casos sobre la base de una medida de similitud (funciones de distancia). K-nn se ha utilizado en el reconocimiento de patrones estadísticos, estimación y ya en el inicio de década de 1970 como una técnica no paramétrica. Un caso se clasifica por un voto de la mayoría de sus vecinos, con el caso que se asigna a la clase más común entre sus vecinos más cercanos K, medidos por una función de la distancia. Si K = 1, entonces el caso es simplemente asignado a la clase de su vecino más cercano <ref type="bibr" target="#b14">[15]</ref>.</p><p>M5Rules El algoritmo M5R <ref type="bibr" target="#b10">[11]</ref> es un algoritmo de inducción simple aunque los conjuntos de reglas de los árboles de modelos son precisos. El algoritmo trabaja construyendo modelos de árboles repetidamente y selecciona la mejor regla en cada iteración. Produce conjuntos de reglas que son en general tan precesio y a la vez más pequeños que los árboles de modelos contruidos con el conjunto de datos completo.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.3.">Minería de datos</head><p>En esta investigación se ha preparado un estudio experimental para explorar el comportamiento de las RNA, en conjuntos de datos donde su tipo de clase es continua. Se ha utilizado para la ejecución de los experimentos la herramienta Weka <ref type="bibr" target="#b8">[9]</ref>. Desarrollada en la Universidad de Waikato (Nueva Zelanda) bajo licencia GNU (General Public License), se caracteriza por la independencia de arquitectura.</p><p>Es utilizado un esquema de experimentación basado en validación cruzada que garantiza una mayor robustez estadística. Esta propuesta consiste en un procedimiento de validación cruzada con diez particiones con una corrida como lo propone <ref type="bibr" target="#b6">[7]</ref>. Como parámetro de evaluación se emplea: coeficiente de correlación y error medio absoluto.</p><p>La correlación es la técnica estadística que estudia el problema de medir la intensidad o el grado de relación que existe entre las variables que se investigan. El Coeficiente de Correlación, es un valor comprendido entre 1 y 1, indica la relación lineal que existe entre dos variables. El error medio absoluto mide la magnitud media de los errores en un conjunto de pronósticos, sin tener en cuenta su dirección. Mide la precisión para las variables continuas.</p><p>Se realizó una experimentación utilizando los algoritmos de selección de estrategia Wrapper mencionados anteriormente y como algoritmos de regresión: LR, MLP, M5P, K-nn y M5R. Los resultados arrojados se muestran en la Tabla 2 y Tabla 3.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.4.">Interpretación y evaluación</head><p>En la Tabla 2 y en la Tabla 3 los valores resaltados son los algoritmos de mejor coeficiente de correlación y error absoluto medio respectivamente. Se puede observar como el algoritmo de regresión MLP con el selector de atributos de estrategia Wrapper MLP es el de mayor coeficiente de correlación en la Tabla 2 y el de menor error medio absoluto en la Tabla 3. Wrapper LR MLP M5P K-nn M5R -LR 0,598 0,631 0,598 0,164 0,636 0,640 MLP 0,796 0,901 0,796 0,226 0,888 0,885 M5P 0,876 0,863 0,876 0,718 0,874 0,863 K-nn 0,705 0,806 0,705 0,674 0,683 0,7 M5R 0,800 0,860 0,800 0,779 0,882 0,86 En la Figura 3 se muestra el consumo de energía eléctrica en la ECOPP durante cinco años. En dicha gráfica de tendencia los consumos están presentados por meses. El color azul representa el consumo real, mientras que el color rojo es el consumo pronosticado por el algoritmo MLP. Se puede apreciar como el error del clasificador es bajo. </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="4.">Integración del algoritmo de predicción de valores límites en el SIGCIA</head><p>Con el modelo óptimo seleccionado, MLP, se dio paso a la integración del algoritmo de predicción de valores límites, Figura 4, en el modelo SIGCIA. En este diagrama el primer paso es que el usuario introduzca los datos, que constituyen el valor del indicador para ese mes. Luego el modelo de RNA seleccionado analiza estos datos de entrada y realiza su pronóstico, que para el SIGCIA va ser el valor límite. Cuando se obtenga el valor real del indicador este se compara con el pronóstico (valor límite). En caso de ser mayor el real, mediante la máquina de inferencia, que posee la arquitectura del SIGCIA, esta recomienda las posibles causas de alteración del indicador, los posibles impactos ambientales y las acciones de mitigación.</p><p>Para lograr la integración del algoritmo de predicción de valores límites al SIGCIA, se crea en el sistema un grupo de clases. Una clase (Modelo Clasificación) la cual se encarga de construir el Dataset haciendo uso de los datos que se encuentran en la tabla (tb consumo energía) incluida en la base de datos db indicadores. Para la construcción del modelo y clasificar la instancia se hace uso de la librería WEKA ver Figura 5.  </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="4.1.">Funcionalidades del SIGCIA una vez integrado</head><p>Cuando el usuario (Especialista de Gestión Ambiental) desea gestionar el valor límite del indicador, en este caso consumo total de energía, una vez seleccionado el indicador hace click en el botón adicionar y se muestra una ventana de diálogo donde se tienen dos opciones, introducir el valor manualmente o generar el valor como se muestra en la Figura 6. Si el usuario selecciona la opción de generar el valor límite, se le muestra un formulario el cual debe llenar para el correcto funcionamiento del algoritmo (ver Figura 7). Luego de llenar los datos del formulario correctamente el usuario hace click en el botón insertar, acto seguido se ejecuta el método generarValorlímite() el cual crea primeramente una instancia temporal con los datos introducidos por el usuario en el formulario, construye el modelo de regresión, clasifica la instancia y propone el valor límite. Una vez definido el valor límite del indicador; el usuario calcula el valor real del mismo para el mes en curso. Este valor es guardado en la base de datos y se actualiza el dataset. Posteriormente si el valor del indicador real sobrepasa el valor límite el sistema ofrece un conjunto de recomendaciones, fruto de las consultas realizadas a la ontología OntoEnvironmental.  </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="5.">Conclusiones</head><p>En el estudio de los algoritmos de selección de atributos con la estrategia Wrapper para seleccionar los métodos a aplicar en la investigación, permitió constatar que existían atributos redundantes e irrelevantes, debido a que el de mejores resultados fue Wrapper (MLP) eliminando el atributo Intensidad. El estudio realizado sobre los cinco modelos de regresión de distintas ramas, arrojó que el algoritmo de regresión MultiLayerPerceptron en cuanto a los parámetros medidos (coeficiente de correlación y error absoluto medio) fue el de mejores resultados.</p><p>La integración del algoritmo de regresión MultiLayerPerceptron al sistema SIGCIA permite la predicción del valor límite del indicador consumo de energía que fue el conjunto de datos seleccionado en la investigación actual. Lo anterior facilita el trabajo del Especialista de Gestión Ambiental debido a que el sistema realiza las recomendaciones de forma oportuna y favorece la toma de decisiones al respecto. Los resultados obtenidos con la aplicación del algoritmo de regresión MultiLayerPerceptron al conjunto de datos tomado de la Empresa Constructora del Poder Popular acerca del indicador consumo de energía demuestra que para este indicador en otras organizaciones el algoritmo antes mencionado se puede generalizar.</p></div><figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_0"><head>Fig. 1 .</head><label>1</label><figDesc>Fig. 1. Indicadores medioambientales para empresas.</figDesc><graphic coords="3,208.47,308.88,198.43,175.70" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_1"><head>Fig. 2 .</head><label>2</label><figDesc>Fig. 2. Distribución por instancia (atributo consumo).</figDesc><graphic coords="5,236.81,493.55,141.74,146.21" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_2"><head>Fig. 3 .</head><label>3</label><figDesc>Fig. 3. Pronóstico del consumo de energía.</figDesc><graphic coords="8,137.60,469.43,340.16,133.88" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_3"><head>Fig. 4 .</head><label>4</label><figDesc>Fig. 4. Diagrama de flujo predicción de valor límite.</figDesc><graphic coords="9,145.96,371.97,175.75,130.41" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_4"><head>Fig. 5 .</head><label>5</label><figDesc>Fig. 5. Integración de Weka al SIG-CIA.</figDesc><graphic coords="9,321.90,371.97,175.76,130.39" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_5"><head>Fig. 6 .</head><label>6</label><figDesc>Fig. 6. Generar valor límite.</figDesc><graphic coords="10,137.60,257.84,340.17,150.93" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_6"><head>Fig. 7 .</head><label>7</label><figDesc>Fig. 7. Atributos del indicador.</figDesc><graphic coords="10,137.60,501.37,340.17,138.89" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_0"><head>Table 1 .</head><label>1</label><figDesc>Descripción del conjunto de datos.</figDesc><table><row><cell>Atributo</cell><cell>Valor</cell></row><row><cell cols="2">potencia global activa (kilowatt) real</cell></row><row><cell cols="2">potencia global reactiva (kilowatt) real</cell></row><row><cell>voltaje (volt)</cell><cell>real</cell></row><row><cell>intensidad global (ampere)</cell><cell>real</cell></row><row><cell>consumo (watt/hora)</cell><cell>real</cell></row></table></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_1"><head>Table 2 .</head><label>2</label><figDesc>Resultado de coeficiente de correlación.</figDesc><table /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_2"><head>Table 3 .</head><label>3</label><figDesc>Resultado de error medio absoluto.</figDesc><table><row><cell>Wrapper</cell></row><row><cell>LR MLP M5P K-nn M5R -</cell></row><row><cell>LR 733 739 733 825 726 723</cell></row><row><cell>MLP 436 329 436 795 349 351</cell></row><row><cell>M5P 396 397 396 573 401 397</cell></row><row><cell>K-nn 390 295 390 370 350 368</cell></row><row><cell>M5R 420 373 420 364 352 373</cell></row></table></figure>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="1" xml:id="foot_0">Un dato que ha sido seleccionado a partir de un conjunto estadístico más amplio por poseer una significación y una representatividad particular<ref type="bibr" target="#b9">[10]</ref>.</note>
		</body>
		<back>
			<div type="references">

				<listBibl>

<biblStruct xml:id="b0">
	<monogr>
		<title level="m" type="main">Building ontologies with basic formal ontology</title>
		<author>
			<persName><forename type="first">R</forename><surname>Arp</surname></persName>
		</author>
		<author>
			<persName><forename type="first">B</forename><surname>Smith</surname></persName>
		</author>
		<author>
			<persName><forename type="first">A</forename><forename type="middle">D</forename><surname>Spear</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2015">2015</date>
			<publisher>Mit Press</publisher>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b1">
	<analytic>
		<title level="a" type="main">Extremely well-written, up-to-date. Requires a good mathematical background, but rewards careful reading, putting neural networks firmly into a statistical context</title>
		<author>
			<persName><forename type="first">C</forename><surname>Bishop</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Neural Networks for Pattern Recognition</title>
				<imprint>
			<date type="published" when="1995">1995</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b2">
	<analytic>
		<title level="a" type="main">Sistema basado en ontología para el apoyo a la toma de decisiones en el proceso de gestión ambiental empresarial</title>
		<author>
			<persName><forename type="first">M</forename><forename type="middle">I</forename><surname>Castellanos Domíngez</surname></persName>
		</author>
		<author>
			<persName><forename type="first">C</forename><forename type="middle">M</forename><surname>Quevedo Castro</surname></persName>
		</author>
		<author>
			<persName><forename type="first">A</forename><surname>Vega Ramírez</surname></persName>
		</author>
		<author>
			<persName><forename type="first">I</forename><surname>Grangel González</surname></persName>
		</author>
		<author>
			<persName><forename type="first">R</forename><surname>Moreno Rodríguez</surname></persName>
		</author>
		<ptr target="http://ceur-ws.org/Vol-1797/" />
	</analytic>
	<monogr>
		<title level="m">II International Workshop of Semantic Web</title>
				<meeting><address><addrLine>La Habana, Cuba</addrLine></address></meeting>
		<imprint>
			<publisher>CEUR-WS</publisher>
			<date type="published" when="2016">2016</date>
			<biblScope unit="volume">1797</biblScope>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b3">
	<monogr>
		<author>
			<persName><forename type="first">P</forename><surname>Cimiano</surname></persName>
		</author>
		<author>
			<persName><forename type="first">J</forename><surname>Mccrae</surname></persName>
		</author>
		<author>
			<persName><forename type="first">P</forename><surname>Buitelaar</surname></persName>
		</author>
		<title level="m">Lexicon model for ontologies: Community report</title>
				<imprint>
			<date type="published" when="2016">2016</date>
		</imprint>
	</monogr>
	<note>W3C Ontology-Lexicon Community Group</note>
</biblStruct>

<biblStruct xml:id="b4">
	<analytic>
		<author>
			<persName><forename type="first">K</forename><forename type="middle">J</forename><surname>Cios</surname></persName>
		</author>
		<author>
			<persName><forename type="first">L</forename><forename type="middle">A</forename><surname>Kurgan</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Trends in Data Mining and Knowledge Discovery</title>
				<imprint>
			<date type="published" when="2000">2000</date>
			<biblScope unit="page" from="1" to="26" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b5">
	<monogr>
		<title level="m" type="main">Representations of commonsense knowledge</title>
		<author>
			<persName><forename type="first">E</forename><surname>Davis</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2014">2014</date>
			<publisher>Morgan Kaufmann</publisher>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b6">
	<analytic>
		<title level="a" type="main">Comparison of Classifiers over Multiple Data Sets</title>
		<author>
			<persName><forename type="first">J</forename><surname>Demsar</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Journal of Machine Learning Research</title>
		<imprint>
			<biblScope unit="volume">7</biblScope>
			<biblScope unit="page">31</biblScope>
			<date type="published" when="2006">2006</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b7">
	<analytic>
		<title level="a" type="main">The KDD Process for Extracting Useful Knowledge from Volumes of</title>
		<author>
			<persName><forename type="first">U</forename><surname>Fayyad</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Data</title>
		<imprint>
			<biblScope unit="volume">39</biblScope>
			<biblScope unit="issue">11</biblScope>
			<biblScope unit="page" from="27" to="34" />
			<date type="published" when="1996">1996</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b8">
	<monogr>
		<title level="m" type="main">E: Practical Machine Learning Tools and Techniques</title>
		<author>
			<persName><forename type="first">I</forename><forename type="middle">H W</forename><surname>Frank</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2005">2005</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b9">
	<analytic>
		<title level="a" type="main">What are indicators? On the definition of indicators in ecology and environmental planning</title>
		<author>
			<persName><forename type="first">U</forename><surname>Heink</surname></persName>
		</author>
		<author>
			<persName><forename type="first">I</forename><surname>Kowarik</surname></persName>
		</author>
		<ptr target="www.elsevier.com/locate/ecolind" />
	</analytic>
	<monogr>
		<title level="j">Ecological Indicators ELSEVIER</title>
		<imprint>
			<biblScope unit="volume">10</biblScope>
			<biblScope unit="page" from="584" to="593" />
			<date type="published" when="2010">2010</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b10">
	<monogr>
		<title level="m" type="main">Generating Rule Sets from Model Trees</title>
		<author>
			<persName><forename type="first">G</forename><surname>Holmes</surname></persName>
		</author>
		<author>
			<persName><forename type="first">M</forename><surname>Hall</surname></persName>
		</author>
		<author>
			<persName><forename type="first">E</forename><surname>Frank</surname></persName>
		</author>
		<imprint>
			<date type="published" when="1999">1999</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b11">
	<monogr>
		<title level="m" type="main">Very Simple Classification Rules Perform Well on Most Commonly Used Datasets</title>
		<author>
			<persName><forename type="first">R</forename><forename type="middle">C</forename><surname>Holte</surname></persName>
		</author>
		<imprint>
			<date type="published" when="1988">1988. 1993</date>
			<biblScope unit="page" from="63" to="91" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b12">
	<monogr>
		<author>
			<persName><surname>Ihobe</surname></persName>
		</author>
		<title level="m">Guía de Indicadores Medioambientales para la Empresa</title>
				<imprint>
			<date type="published" when="1999">1999</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b13">
	<analytic>
		<title level="a" type="main">How semantic technologies can enhance data access at siemens energy</title>
		<author>
			<persName><forename type="first">E</forename><surname>Kharlamov</surname></persName>
		</author>
		<author>
			<persName><forename type="first">N</forename><surname>Solomakhina</surname></persName>
		</author>
		<author>
			<persName><forename type="first">O</forename><forename type="middle">L</forename><surname>Özçep</surname></persName>
		</author>
		<author>
			<persName><forename type="first">D</forename><surname>Zheleznyakov</surname></persName>
		</author>
		<author>
			<persName><forename type="first">T</forename><surname>Hubauer</surname></persName>
		</author>
		<author>
			<persName><forename type="first">S</forename><surname>Lamparter</surname></persName>
		</author>
		<author>
			<persName><forename type="first">M</forename><surname>Roshchin</surname></persName>
		</author>
		<author>
			<persName><forename type="first">A</forename><surname>Soylu</surname></persName>
		</author>
		<author>
			<persName><forename type="first">S</forename><surname>Watson</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">International Semantic Web Conference</title>
				<imprint>
			<publisher>Springer</publisher>
			<date type="published" when="2014">2014</date>
			<biblScope unit="page" from="601" to="619" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b14">
	<analytic>
		<title level="a" type="main">K-NN Regression to Improve Statistical Feature Extraction for Texture Retrieval</title>
		<author>
			<persName><forename type="first">J</forename><surname>Khelifi</surname></persName>
		</author>
		<author>
			<persName><forename type="first">F</forename><forename type="middle">J</forename></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">IEEE Transactions on Image Processing</title>
		<imprint>
			<biblScope unit="volume">20</biblScope>
			<biblScope unit="page" from="293" to="298" />
			<date type="published" when="2011">2011</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b15">
	<analytic>
		<title level="a" type="main">Semantic technologies for historical research: A survey</title>
		<author>
			<persName><forename type="first">A</forename><surname>Meroño Peñuela</surname></persName>
		</author>
		<author>
			<persName><forename type="first">A</forename><surname>Ashkpour</surname></persName>
		</author>
		<author>
			<persName><forename type="first">M</forename><surname>Van Erp</surname></persName>
		</author>
		<author>
			<persName><forename type="first">K</forename><surname>Mandemakers</surname></persName>
		</author>
		<author>
			<persName><forename type="first">L</forename><surname>Breure</surname></persName>
		</author>
		<author>
			<persName><forename type="first">A</forename><surname>Scharnhorst</surname></persName>
		</author>
		<author>
			<persName><forename type="first">S</forename><surname>Schlobach</surname></persName>
		</author>
		<author>
			<persName><forename type="first">F</forename><surname>Van Harmelen</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Semantic Web</title>
		<imprint>
			<biblScope unit="volume">6</biblScope>
			<biblScope unit="issue">6</biblScope>
			<biblScope unit="page" from="539" to="564" />
			<date type="published" when="2015">2015</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b16">
	<analytic>
		<title level="a" type="main">Semantic Technologies and Learning</title>
		<author>
			<persName><forename type="first">T</forename><surname>Tiropanis</surname></persName>
		</author>
		<author>
			<persName><forename type="first">H</forename><forename type="middle">C</forename><surname>Davis</surname></persName>
		</author>
		<author>
			<persName><forename type="first">S</forename><forename type="middle">A</forename><surname>Cerri</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Encyclopedia of the Sciences of Learning</title>
				<imprint>
			<publisher>Springer</publisher>
			<date type="published" when="2012">2012</date>
			<biblScope unit="page" from="3029" to="3032" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b17">
	<analytic>
		<title level="a" type="main">Regression Analysis</title>
		<author>
			<persName><surname>Torres-Reyna</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Data Analysis</title>
				<imprint>
			<date type="published" when="2009">2009</date>
			<biblScope unit="volume">101</biblScope>
		</imprint>
		<respStmt>
			<orgName>University Princeton</orgName>
		</respStmt>
	</monogr>
</biblStruct>

				</listBibl>
			</div>
		</back>
	</text>
</TEI>
