<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Representation of Knowledge from Intelligent Data Analysis as Requirements</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Macario Ruiz-Grijalva al</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff1">1</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
          <xref ref-type="aff" rid="aff3">3</xref>
          <xref ref-type="aff" rid="aff4">4</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>@alumnos.uacj.mx</string-name>
          <email>al144857@alumnos.uacj.mx</email>
          <email>al150666@alumnos.uacj.mx</email>
          <email>al151096@alumnos.uacj.mx</email>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff1">1</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
          <xref ref-type="aff" rid="aff3">3</xref>
          <xref ref-type="aff" rid="aff4">4</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Alexis Plata</institution>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>Departamento de Eléctrica y Computación Instituto de Ingeniería y Tecnología, UACJ Maestría en Cómputo Aplicado Cd. Juárez</institution>
          ,
          <addr-line>Chih.</addr-line>
          ,
          <country country="MX">México</country>
        </aff>
        <aff id="aff2">
          <label>2</label>
          <institution>Karla Olmos-Sánchez</institution>
        </aff>
        <aff id="aff3">
          <label>3</label>
          <institution>Raymundo Camarena</institution>
        </aff>
        <aff id="aff4">
          <label>4</label>
          <institution>Tania Olivier</institution>
        </aff>
      </contrib-group>
      <abstract>
        <p>The technological dependence that society suffers has propitiated that the information stored in servers of the whole world has an exponential growth. As a consequence of this phenomenon the useful information consultation becomes complex and it is necessary to use intelligent methods to reach it. This article mentions how Intelligent Data Analysis helps to search for knowledge within information banks regardless of their size.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>RESUMEN</title>
      <p>Título: Representación del Conocimiento proveniente del
Análisis Inteligente de Datos como Requisitos
La dependencia tecnológica que sufre la sociedad ha propiciado que
la información almacenada en servidores de todo el mundo tenga un
crecimiento exponencial. Como consecuencia de este fenómeno la
consulta de información útil se torna compleja y es necesario
emplear metodos inteligentes para llegar a ella. Este artículo
menciona como el Análisis Inteligente de datos ayuda a la búsqueda
de conocimiento dentro de bancos de información sin importar su
tamaño.
Analisis inteligente de datos; Representacion del
Conocimiento; Requisitos</p>
    </sec>
    <sec id="sec-2">
      <title>1. INTRODUCCIÓN</title>
      <p>
        La transferencia y el almacenamiento diario de i nformacion
digital crece exponencialmente. Esto ha obligado a l os i
nvestigadores a desarrollar tecnicas y herramientas para l a
depuracion y el analisis de l a i nformacion con l a nalidad de
identi car i nformacion util, es decir conocimiento.
El conocimiento adquirido de la informacion puede ser
producto del proceso llamado Analisis Inteligente de Datos (IDA,
Intelligent Data Analysis) o del Descubrimiento de
Conocimiento en Grandes Bases de Datos (KDD, Knowledge
Discovery Data) [
        <xref ref-type="bibr" rid="ref1">1</xref>
        ].
      </p>
      <p>
        En ambas areas se recurre a un proceso i nteractivo e i terativo
de analisis que i nvolucra l os siguientes pasos: conocimiento
del dominio, preparacion de l os datos, extraer i
rregularidades, busqueda de patrones ocultos, evaluacion y re namiento
de l os patrones encontrados para determinar cuales de ellos
puedan ser considerados como nuevo conocimiento.
El KDD se i deo para trabajar con grandes cantidades de
datos, regularmente esta asociado con el analisis de i nforma-cion
para el area nanciera, i ngenier a, seguridad i nformati-ca,
El IDA, al no tener restriccion de la cantidad de datos
para analizar fue disen~ado para dar soluciones a problemas
complejos e imprecisos mediante el analisis de la
informacion relacionada con el problema. Regularmente el IDA es
asociado en el analisis de la informacion medica, biomedica,
educacion, ingenier a de software, cambio climatico,
etcetera. Una discusion detallada de las coincidencias y diferencias
entre ellas se puede encontrar en [
        <xref ref-type="bibr" rid="ref2">2</xref>
        ].
      </p>
      <p>Para que tanto el KDD como el IDA brinden conocimiento,
es necesario tener claridad en cuanto a como es la relacion
e interaccion entre las partes comprendidas en el dominio
del problema a resolver. Esto es un problema no trivial,
especialmente en los dominios que con mas frecuencia atiende
el IDA, ya que ademas de tratar con conocimiento expl cito
del dominio del problema a resolver, es necesario
contemplar grandes cantidades de conocimiento tacito o impl cito
que por su naturaleza carece de estructura, siendo mas
complejo el analisis de la informacion.</p>
      <p>Figura 1: Esquema representativo del proceso
general del KD. El KD consta de seis etapas principales
que parte de los datos y concluye en el
descubrimiento de conocimiento para la toma de desiciones
La clave para obtener conocimiento al aplicar el IDA es la
habilidad para reconocer el problema a resolver. Algunas
de las tecnicas empleadas son: agrupacion, visualizacion de
datos, interpretaciones de datos en el tiempo.</p>
      <p>
        Un ejemplo de la aplicacion del IDA en medicina
mencionado por [
        <xref ref-type="bibr" rid="ref3">3</xref>
        ], es la implementacion de los siguientes metodos:
Reglas simbolicas explicitas para entrenar casos y usarlos
en induccion basada en reglas o en arboles de decisiones,
clasi cando los datos de interes. El aprendizaje basado en
instanciacion almacena casos ya entrenados para referenciar,
cuando hay nuevos casos se clasi can comparandolos con los
casos almacenados (CBK).
      </p>
      <p>Otro caso es la probabilidad condicional empleando la
abstraccion de datos en el tiempo para el ambito medico donde
esta relacionado con el proceso que envuelve al seguimiento
de enfermedades para trabajar con un historial medico. Por
lo general, en la mayor a de los modelos el tiempo se
representa como una integral y permite optimizar la formacion
de posibles soluciones.</p>
      <p>Las abstracciones temporales sobre el tiempo y los datos
juegan un rol fundamental para los sistemas medicos basados
en conocimiento ya que es necesario aplicar el conocimiento
en datos espec cos de pacientes con el objetivo de emitir
un pre diagnostico que apoye la decision de alguna terapia
para el paciente, tambien el monitoreo de terapias y acciones
complementarias.</p>
      <p>
        Los sistemas inteligentes agrupan algoritmos que
implementan o emulan distintos modelos de aprendizaje,
comportamientos de ciertos sistemas biologicos, entre otras cosas, y
su aplicacion a la resolucion de problemas complejos. Entre
los problemas abordados en este campo esta el de inducir
conocimientos a partir de datos o ejemplos, esto resulta una
alternativa de solucion a problemas que no pueden ser
resueltos mediante metodos convencionales, tales como
metodos estad sticos, modelos matematicos, entre otros.
Todos estos metodos convencionales son esencialmente
matematicamente formales. En contraposicion, los metodos
basados en sistemas inteligentes estan orientados
principalmente hacia el desarrollo de descripciones simbolicas de los
datos, que puedan caracterizar uno o mas grupos de conceptos,
diferenciar distintas clases, seleccionar los atributos mas
representativos de grupos de datos, ser capaces de predecir
secuencias, etc. Estos metodos son esencialmente cualitativos,
lo cual permite el descubrimiento de patrones en estructuras
de informacion [
        <xref ref-type="bibr" rid="ref3">3</xref>
        ].
      </p>
    </sec>
    <sec id="sec-3">
      <title>Análisis inteligente de datos para la búsqueda de conocimiento</title>
      <p>En el presente art culo se somete a discusion la pertinencia
de llevar a cabo una caracterizacion que apoye a los
buscadores de conocimiento a arrojar informacion certera
para la identi cacion del dominio de la solucion del problema
teniendo resultados utiles, signi cativos y e cientes. La
seccion 2 revisa un conjunto amplio de referencias antecedentes
de los Problemas en Dominios Parcialmente De nidos. La
seccion 3 resalta la Importancia del Conocimiento del
Dominio y la necesidad de establecer un instrumento para la
caracterizacion de un Problema enmarcado por un Dominio
Parcialmente De nido. En la seccion 4 se mencionan
algunas de las representaciones de conocimientos empleadas en
el IDA. En la seccion 5 se indican algunas de las areas de
interes donde lo sen~alado en la seccion 3 tendr a un impacto
directo. Finalmente en la seccion 6 se presenta la Discusion
y Trabajo Futuro.</p>
      <p>
        Inteligencia Arti cial, Simon [
        <xref ref-type="bibr" rid="ref4">4</xref>
        ] postula que existen dos
tipos de problemas: los Bien Estructurados y los Parcialmente
Estructurados. Los primeros tienen una formulacion
correcta, se puede determinar el estado inicial y el estado meta a
partir de esta formulacion; y los operadores estan bien
denidos por lo que permiten progresar del estado inicial al
estado meta sin complicaciones. Los Problemas
Parcialmente Estructurados forman parte de una categor a residual y
son todos los problemas que no cumplen con alguna
caracter stica de los Bien Estructurados.
      </p>
      <p>Los problemas de matematicas y ciencias generalmente se
consideran como Bien Estructurados. Por otro lado, los
problemas relacionados con etica, disen~o, leyes y diagnostico
medico se consideran Parcialmente Estructurados.
Los Problemas se enmarcan en un Dominio, entendiendo
este ultimo como un Universo del Discurso. As como los
problemas, los Dominios tambien se han intentado clasi
car. Para Lynch los Dominios t picamente connotan un area
de estudio tal como la f sica, o un conjunto de problemas
y hace un estudio exhaustivo de los Dominios Parcialmente
De nidos. Para Lynch un Dominio Parcialmente De nido
se caracteriza por 1) La falta de estandares para veri car la
solucion de los problemas 2) Las Teor as Formales en estos
Dominios generalmente son consensuadas, t picamente
usadas para guiar intuiciones y no para dictar resultados, 3)
La Estructura de la Tarea es parcialmente de nida y para
resolver un problema se requiere determinar que leyes o
teor as se deben aplicar a la situacion actual. 4) Los conceptos
en estos dominios carecen de una de nicion absoluta, y 5)
La division de los problemas en sub problemas no reduce la
complejidad, ya que los sub problemas se restringen unos a
otros, y ninguno de ellos puede ser resuelto sin considerar
los efectos de los otros.</p>
      <p>
        Sin embargo considera que los terminos Parcialmente
Estructurado y Parcialmente De nido son intercambiables y,
para efectos de su trabajo, no establece una distincion entre
los Problemas y Dominios [
        <xref ref-type="bibr" rid="ref5">5</xref>
        ].
      </p>
      <p>
        En el trabajo de Gibert [
        <xref ref-type="bibr" rid="ref6">6</xref>
        ] se clasi can los problemas que
se atienden como Dominios Poco Estructurados y los
caracteriza por: 1) Los elementos del dominio vienen descritos
por conjuntos heterogeneos de variables, 2) Existe un
conocimiento a priori adicional sobre la estructura del dominio,
y 3) La complejidad inherente al dominio hace que el
conocimiento que de el se tiene sea parcial (en este dominio existe
gran cantidad de conocimiento impl cito y grandes
incognitas) y no homogeneo (el grado de especi car el conocimiento
disponible es distinto para distintas partes del dominio).
De acuerdo a esta revision referencial se puede observar que
existe una necesidad de clasi cacion de los Problemas y que
una forma de clasi carlos es de acuerdo a las caracter sticas
del Dominio en el que se enmarcan. Sin embargo, a pesar
de las coincidencias, se puede observar una divergencia de
opiniones. Lo anterior lo atribuimos a la vision que de estos
Problemas y sus Dominios tienen los autores de acuerdo a
su area de investigacion. Por lo que es necesario establecer
una postura que permita construir una argumentacion.
      </p>
    </sec>
    <sec id="sec-4">
      <title>ANTECEDENTES DE LOS PROBLEMAS</title>
    </sec>
    <sec id="sec-5">
      <title>DE DOMINIOS PARCIALMENTE DEFI</title>
    </sec>
    <sec id="sec-6">
      <title>NIDOS 3.</title>
    </sec>
    <sec id="sec-7">
      <title>CONOCIMIENTO DEL DOMINIO Y NE</title>
    </sec>
    <sec id="sec-8">
      <title>CESIDAD DE CARACTERIZAR EL PRO</title>
    </sec>
    <sec id="sec-9">
      <title>BLEMA QUE ENMARCA</title>
      <p>A lo largo de la historia se han realizado diversos esfuerzos
por caracterizar los problemas. Por ejemplo, en el area de
La necesidad de caracterizar problemas pertenecientes a
dominios de estructura informal representa un problema no
trivial para el proceso de extraccion de conocimientos. En
las dos subsecciones posteriores se abordaran algunos
puntos importantes relacionados al IDA y su implementacion en
dominios de estructura informal.
3.1</p>
    </sec>
    <sec id="sec-10">
      <title>Importancia del Conocimiento del Dominio</title>
      <p>Una de las discusiones actuales de la comunidad de IDA
tiene que ver con que los trabajos en esta area se enfocan mas al
analisis de algoritmos de miner a de datos, cuando la esencia
original de la disciplina era generar nuevo conocimiento para
automatizar algunas de las habilidades de razonamiento de
los analistas de datos.</p>
      <p>
        Es as que una corriente actual del IDA es orientarse a
resolver problemas practicos de valor para la sociedad en ambitos
como: el cambio climatico, la perdida de habitat, educacion
y medicina [
        <xref ref-type="bibr" rid="ref7">7</xref>
        ]. Segun Cohen para responder efectivamente a
estos retos se deben replantear las siguientes actividades: el
origen de los datos, los metadatos y la busqueda de datos, el
razonamiento acerca del contenido o el signi cado de los
datos, las interfaces de usuario, la visualizacion de resultados e
incluso considerar temas de privacidad y etica. Un esquema
general del proceso del IDA que engloba sus caracter sticas
es presentado en la gura 2. Ademas, el conocimiento
descubierto debe ser validado no solo con mediciones tecnicas sino
tambien por el grado de valor que tiene para los expertos en
el area de interes.
      </p>
      <p>
        Figura 2: Esquema representativo del proceso
general de aplicacion del IDA para la toma de desiciones
inteligentes
Como puede observarse, lo anterior implica incluir el
Conocimiento del Dominio en el proceso de Descubrimiento de
Conocimiento. El Conocimiento del Dominio se re ere al
conocimiento que es valido y directamente utilizado en un
Dominio preseleccionado de un desaf o humano o una
actividad de computo autonomo. Los especialistas y expertos
utilizan y desarrollan su propio conocimiento del dominio.
Siguiendo a [
        <xref ref-type="bibr" rid="ref8">8</xref>
        ] el Conocimiento del Dominio puede ser
clasicado en dos tipos, el conocimiento factico y el
conocimiento relativo a la experiencia. El conocimiento factico consiste
de conocimiento expl cito del dominio, tal como hechos,
datos, contexto y relaciones relevantes al problema de decision;
mientras que el conocimiento relativo a la experiencia
consiste de conocimiento impl cito del dominio que poseen los
expertos.
      </p>
      <p>El conocimiento del dominio incluye informacion acerca de
las relaciones entre los objetos, tipos de atributos y otros
aspectos semanticos; esto comprende el alcance de los valores
y el signi cado de valores espaciales como los valores por
defecto o las excepciones.</p>
      <p>Diversos autores coinciden en la importancia del
Conocimiento del Dominio como estrategia para mejorar los
resultados del proceso de Descubrimiento de Conocimiento, en
particular en Dominios cuyas caracter sticas se asemejan a
las de los Semi formalmente De nidos.</p>
      <p>
        Por ejemplo, en [
        <xref ref-type="bibr" rid="ref9">9</xref>
        ] se argumenta que para automatizar un
proceso de KDD con exito se requiere capturar el
Conocimiento del Dominio de tal forma que de soporte a los
diferentes estados del proceso. Para Redpath algunos temas
que requieren resolverse son a) El establecimiento una
clasi cacion general de Conocimiento del Dominio que pueda
ser aplicable en diferentes dominios y b) La adopcion de un
lenguaje formal y notacion que permita manipular las clases
del Dominio del Conocimiento que sean reconocidas como
estandares.
      </p>
      <p>
        Por otro lado, Cao [
        <xref ref-type="bibr" rid="ref10">10</xref>
        ] va mas alla y sugiere la inclusion
de la Inteligencia del Dominio en el proceso de miner a de
datos para salir avante en el analisis de problemas de la
vida real. La Inteligencia del Dominio consiste en el Dominio
del Conocimiento y de los expertos, la consideracion de
restricciones, y el desarrollo de patrones dif ciles de visualizar.
Para Cao es el usuario o el experto, quien dice \si" o \no" a
los resultados obtenidos.
      </p>
      <p>
        Existen otras areas como la biomedicina donde las
caracter sticas propias de los datos en estos dominios complican el
proceso de extraccion de conocimiento. Para enfrentar
estos problemas, uno de las alternativas que se plantea es la
necesidad de desarrollar metodos que sean capaces de
utilizar alguna forma del conocimiento medico existente en las
actividades de descubrimiento de conocimiento, ya que
estas actividades solo son signi cativas cuando consideran el
conocimiento existente en el area de aplicacion [
        <xref ref-type="bibr" rid="ref11">11</xref>
        ].
Por ultimo, citando a Deng [
        <xref ref-type="bibr" rid="ref12">12</xref>
        ] \Sin el uso propio y su
ciente del Conocimiento del Dominio en las aplicaciones de
miner a de datos se corre el riesgo de: a) elegir los algoritmos
o modelos equivocados o sub-optimos, b) malinterpretar los
resultados del analisis de datos, y por lo tanto c) reducir la
con anza del usuario en el uso de estos metodos".
3.2
      </p>
    </sec>
    <sec id="sec-11">
      <title>Necesidad de caracterización de Problemas enmarcados en Dominios de Estructura Informal</title>
      <p>Como hemos mencionado anteriormente, actualmente
existen grandes volumenes de datos y una creciente necesidad de
manipularlos para transformarlos en conocimiento. Sin
embargo, mucho del trabajo en las areas de KDD e IDA se ha
enfocado en evaluar la e ciencia de los algoritmos con poco
o nulo valor para las personas interesadas en la estructura
de los datos, como el medico, el inversionista, el
ambientalista, el ingeniero de software. Por tal motivo, diversos autores
concuerdan que es necesario orientarse a resolver problemas
de valor para la sociedad como el cambio climatico, la
perdida de habitat, educacion y medicina, entre otros.
Sin embargo, las tecnicas o metodos convencionales para
descubrir conocimiento en estos Dominios generalmente no
generan resultados satisfactorios. La revision referencial nos
indica que en parte lo anterior es consecuencia de las
caracter sticas inherentes del Dominio al que pertenecen estos
problemas. Lo que implica la utilizacion de grandes
cantidades de conocimiento impl cito para solucionarlos. Por lo que
muchas ocasiones es preciso soluciones de hechura a la
medida en las que se consume mucho tiempo para idearlas, ya
que generalmente se realizan a prueba y error, y es probable
que los metodos encontrados no funcionen para otros tipos
de problemas, incluso con caracter sticas similares.</p>
    </sec>
    <sec id="sec-12">
      <title>REPRESENTACIÓN DEL CONOCIMIENTO</title>
      <p>Una de las metas del Analisis Inteligente de Datos consiste
en generar conocimiento nuevo auxiliandose de
representaciones de conocimiento. Para cumplirla es necesario pasar
por un proceso donde los datos y la informacion se colectan,
clasi can, organizan e integran para que puedan agregar
valor resultando en conocimiento nuevo. Tambien es
primordial adaptar la representacion del conocimiento de acuerdo a
las necesidades del problema y visualizar las especi caciones
del problema o necesidad como requisitos. Uno de los
principales retos es encontrar una representacion de conocimiento
adecuada para garantizar que el conocimiento representado
comunique lo correcto y facilitar su interpretacion. Una
manera de representacion de conocimiento es a traves de los
requisitos que consiste basicamente en la abstraccion de
necesidades o condiciones a satisfacer de un problema dado.
Los requisitos deben tener como caracter stica principal que
sean medibles, comprobables, sin ambiguedades ni
contradicciones. Existe una variedad de opciones para crear
representaciones de conocimientos en la ingenier a de requisitos.
Estas representaciones pueden ser tan sencillas como una
lista o ser presentadas tan completas como lo son las
Ontolog as. Las matrices, los modelos, los metodos, los algoritmos
o en su caso alguna combinacion de estos pueden ser
representaciones validas en la ingenier a de requisitos. El escoger
que tipo de representacion a usar dependera en su totalidad
del tipo de problema que se aborda y encontrar la que facilite
su interpretacion. La manera en que se comunique o se trate
de transmitir conocimiento es amplia y existen esfuerzos
para que sea de manera formal. Para cada area de aplicacion
ha evolucionado a distintos ritmos. Actualmente las
distintas ramas de conocimiento han desarrollado y formalizado
sus tecnicas para poder representar el conocimiento. El
objetivo fundamental de la representacion del conocimiento es
facilitar la inferencia, el sacar conclusiones a partir de dicha
representacion.</p>
      <p>ÁREA DE INCIDENCIA: INGENIERÍA DE</p>
    </sec>
    <sec id="sec-13">
      <title>REQUISITOS</title>
      <p>
        Las areas de incidencia de esta propuesta ser an aquellas
cuyos Dominios empaten con la de nicion propuesta de Semi
formalmente De nidos como el diagnostico medico, el
cambio climatico, educacion, desarrollo de software. A
continuacion se analiza el impacto en Ingenier a de Software.
En Ingenier a de Software no solo existe la necesidad de
gestionar el conocimiento de la organizacion, sino que tambien
es necesario entender el dominio para el cual el software sera
desarrollado. En este sentido Brooks [
        <xref ref-type="bibr" rid="ref13">13</xref>
        ] sen~ala que \... la
di cultad del desarrollo de software es la especi cacion,
disen~o y prueba de sus constructos conceptuales y no la tarea
de representar y probar la delidad de su representacion".
Lo anterior implica que se debe poner especial cuidado en
entender el dominio para de nir debidamente los
requerimientos del sistema para que el producto nal se apegue en
lo posible a las especi caciones del cliente. De igual forma,
mucho del conocimiento de las organizaciones es
conocimiento tacito dif cil de describir y transformar en informacion que
el analista pueda manipular para resolver algun problema o
satisfacer alguna necesidad [
        <xref ref-type="bibr" rid="ref14">14</xref>
        ].
      </p>
      <p>
        En la aplicacion de la Ingenier a de Requisitos para procesos
de desarrollo de software existen otros Dominios en los que
las caracter sticas del problema hace que las tecnicas
estandares de agrupamiento de miner a de datos como K-means,
agrupamiento acumulativo jerarquico, y las tecnicas
probabil sticas no generen resultados satisfactorios [
        <xref ref-type="bibr" rid="ref15">15</xref>
        ]. Descubrir
conocimiento en estos Dominios requiere generalmente de
soluciones de hechura a la medida que permita lidiar con
la complejidad del problema en s mismo y que incluyan el
Conocimiento del Dominio.
6.
6.1
      </p>
    </sec>
    <sec id="sec-14">
      <title>DISCUSIÓN Y TRABAJO FUTURO</title>
    </sec>
    <sec id="sec-15">
      <title>Discusión</title>
      <p>Una vez que se ha establecido el panorama general de los
Dominios Semi formalmente De nidos y la necesidad de
caracterizarlos, es importante discutir algunas cuestiones.
Primero, como puede observarse existe divergencia de
opiniones y no hay mucho acuerdo en cuanto a la terminolog a
utilizada en este tema y a las de niciones que dan
soporte a esta tematica. Por lo que es evidente la necesidad de
una formalizacion de estos Dominios. La idea es transitar
del Modelo Conceptual propuesto en la seccion 2.2 a una
Ontolog a formal que intente poner orden a las ideas de los
diversos autores.</p>
      <p>Otro punto es la necesidad de caracterizar los Problemas
y Dominios desde el punto de vista del KDD o del IDA.
Gran parte de las referencias encontradas acerca de los
Problemas y Dominios se relacionan con el area educativa.
Generalmente se enfocan en desarrollar habilidades para un
Dominio como area de estudio en particular, por lo que su
interes es trabajar con Problemas espec cos de un Dominio
particular. En el area de Descubrimiento de Conocimiento
generalmente el proceso es inverso, el Problema se genera de
acuerdo a una necesidad de una o un grupo de personas
interesadas en descubrir conocimiento en un Dominio del que
se considera especialista. Otra diferencia es que cuando en
el area educativa generalmente se enfocan a un Dominio, en
el area de Descubrimiento de Conocimiento resolver un
Problema puede necesitar conocimiento de diversos Dominios
como area de estudio.</p>
      <p>Por ultimo, es importante hacer notar la necesidad de
considerar expl citamente el conocimiento tacito en la de nicion
de los Dominios Semi formalmente De nidos y analizar a
detalle la forma en que afecta la caracterizacion de los
Problemas y el grado en que se debe involucrar al experto en el
Proceso de Descubrimiento de Conocimiento.
6.2</p>
    </sec>
    <sec id="sec-16">
      <title>Trabajo futuro</title>
      <p>Se detectaron las siguientes necesidades:
1. El desarrollo de una Ontolog a que proporcione una
especi cacion expl cita de la conceptualizacion de estos
Dominios que permita poner orden a esta tematica y
que sea realizada desde el punto de vista del KDD y
del IDA.
2. Una vez desarrollada la ontolog a se puede
determinar de una manera mas formal cual es la relacion
espec ca entre los Problemas y los Dominios, ademas
determinar con mayor exactitud de que forma las
caracter sticas del Dominio determina las caracter sticas
del Problema.
3. Un trabajo a mediano plazo es explorar de que forma
las caracter sticas del Dominio ayuden a seleccionar
algoritmos o metodolog as que minimicen el proceso de
Descubrimiento de Conocimiento que permita enfocar
los esfuerzos en solucion de Problemas de valor para la
humanidad.</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          [1]
          <string-name>
            <surname>U.</surname>
          </string-name>
          ~Fayyad, G.~
          <article-title>PiatetskyShapiro, and</article-title>
          P.~Smith, \
          <article-title>From data mining to knowledge discovery: an overview,"</article-title>
          <source>The AI Magazine</source>
          , vol.~
          <volume>17</volume>
          , no.
          <source>~3</source>
          , pp.~
          <volume>37</volume>
          {
          <fpage>54</fpage>
          ,
          <year>1996</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          [2]
          <string-name>
            <given-names>N.</given-names>
            ~
            <surname>Lavrac</surname>
          </string-name>
          ,
          <string-name>
            <given-names>E.</given-names>
            ~
            <surname>Keravnou</surname>
          </string-name>
          , and
          <string-name>
            <surname>B.</surname>
          </string-name>
          ~Zupan, \
          <article-title>Intelligent data analysis in medicine,"</article-title>
          <source>Encyclopedia ofComputer and Technology</source>
          ,
          <source>vol.~9</source>
          , pp.~
          <volume>113</volume>
          {
          <fpage>157</fpage>
          ,
          <year>2000</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          [3]
          <string-name>
            <given-names>N.</given-names>
            ~
            <surname>Lavrac</surname>
          </string-name>
          ,
          <string-name>
            <given-names>E.</given-names>
            ~
            <surname>Keravnou</surname>
          </string-name>
          , and
          <string-name>
            <surname>B.</surname>
          </string-name>
          ~
          <article-title>Zupan, Intelligent Data Analysis in Medicine andPharmacology</article-title>
          . New York: Springer science and Business Media, LLC,
          <year>1997</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          [4]
          <string-name>
            <surname>H.</surname>
          </string-name>
          ~Simon, \
          <article-title>The structure of ill structured problems,"</article-title>
          <source>Arti cial Intelligence</source>
          , vol.~
          <volume>4</volume>
          , no.
          <issue>~3-4</issue>
          , pp.~
          <volume>181</volume>
          {
          <fpage>201</fpage>
          ,
          <year>1973</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          [5]
          <string-name>
            <given-names>C.</given-names>
            ~
            <surname>Lynch</surname>
          </string-name>
          and V.~Aleven, \
          <article-title>De ning ill de ned domains a literature survey,"</article-title>
          <source>8th Conference onIntelligent Tutoring System</source>
          ,
          <year>2009</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          [6]
          <string-name>
            <surname>K.</surname>
          </string-name>
          ~Gibert and
          <string-name>
            <surname>U.</surname>
          </string-name>
          ~Cortes, \
          <article-title>Tecnicas h bridas de inteligencia arti cial y estadstica para el descubrimiento de conocimiento y miner a de datos," Tendencias dela Miner a de Datos en Espan~a</article-title>
          , pp.~
          <volume>119</volume>
          {
          <fpage>130</fpage>
          ,
          <year>2004</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          [7]
          <string-name>
            <surname>P.</surname>
          </string-name>
          ~Cohen and
          <string-name>
            <surname>N.</surname>
          </string-name>
          ~Addams, \
          <article-title>Intelligent data analysis in the 21 st century,"</article-title>
          <source>in Proceedings ofthe 8th International Symposium onIntelligent DataAnalysis: Advances in IntelligentData AnalysisVIII</source>
          ., (Lyon, France),
          <year>2009</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          [8]
          <string-name>
            <given-names>S.~</given-names>
            <surname>Viademont</surname>
          </string-name>
          and
          <string-name>
            <surname>F.</surname>
          </string-name>
          ~Burstein, \
          <article-title>From knowledge discovery to computational intelligent: A framework for support decision systems,"</article-title>
          <source>En IntelligentDecisionmaking Support Systems Foundations,Applications and Challenges</source>
          , pp.~
          <volume>57</volume>
          {
          <fpage>78</fpage>
          ,
          <year>2006</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          [9]
          <string-name>
            <given-names>R.~</given-names>
            <surname>Redpath</surname>
          </string-name>
          and
          <string-name>
            <surname>B.</surname>
          </string-name>
          ~Srinivasan, \
          <article-title>A model for domain centered knowledge discovery in database,"</article-title>
          <source>in Proceedings of the IEEE 4thInternational Conference on Intelligent Systems Designsand Applications</source>
          , (Budapest, Hungary),
          <year>2004</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          [10]
          <string-name>
            <given-names>L.</given-names>
            ~
            <surname>Cao</surname>
          </string-name>
          ,
          <string-name>
            <given-names>P.</given-names>
            ~
            <surname>Yu</surname>
          </string-name>
          ,
          <string-name>
            <surname>C.</surname>
          </string-name>
          ~Zhang, and
          <string-name>
            <surname>Y.</surname>
          </string-name>
          ~
          <article-title>Zhao in Domain Data Mining</article-title>
          , (New York), Springer,
          <year>2010</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          [11] N.~
          <string-name>
            <surname>Peek</surname>
            ,
            <given-names>C.</given-names>
          </string-name>
          ~
          <string-name>
            <surname>Combi</surname>
          </string-name>
          , and A.~Tucker, \
          <article-title>Biomedicarl data mining,"</article-title>
          <source>Journal Methodsof Information inMedicine</source>
          , vol.~
          <volume>48</volume>
          , pp.~
          <volume>225</volume>
          {
          <fpage>228</fpage>
          ,
          <year>2009</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          [12]
          <string-name>
            <given-names>J.~</given-names>
            <surname>Deng</surname>
          </string-name>
          and
          <string-name>
            <surname>M.</surname>
          </string-name>
          ~Purvis, \
          <article-title>Software e ort estimation: Harmonizing algorithms and domain knowledge in an integrated data mining approach</article-title>
          .,"
          <year>2009</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          [13]
          <string-name>
            <surname>F.</surname>
          </string-name>
          ~Brooks, \
          <article-title>No silver bullet - essence and accidentals of software engineerning,"</article-title>
          <source>IEEE Computing</source>
          , vol.~
          <volume>20</volume>
          , pp.~
          <volume>10</volume>
          {
          <fpage>19</fpage>
          ,
          <year>1987</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          [14]
          <string-name>
            <surname>W.~</surname>
          </string-name>
          <article-title>Friedrich and</article-title>
          J.~V.~
          <string-name>
            <given-names>D.</given-names>
            <surname>Poll</surname>
          </string-name>
          , \
          <article-title>Towards a methodology to elicit tacit dnowledge domain knowledge to users,"</article-title>
          <source>Interdisciliplary Journal of Information, Knowledge and Managament</source>
          , pp.~
          <volume>179</volume>
          {
          <fpage>193</fpage>
          ,
          <year>2007</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          [15]
          <string-name>
            <surname>C.</surname>
          </string-name>
          ~Duan, \
          <article-title>Clustering and its applications in software engineering," DePaul University</article-title>
          . USA,
          <year>2008</year>
          .
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>