=Paper= {{Paper |id=Vol-1318/paper10 |storemode=property |title=Clasificadores Supervisados para el Análisis Predictivo de Muerte y Sobrevida Materna |pdfUrl=https://ceur-ws.org/Vol-1318/paper10.pdf |volume=Vol-1318 |dblpUrl=https://dblp.org/rec/conf/simbig/Leon14 }} ==Clasificadores Supervisados para el Análisis Predictivo de Muerte y Sobrevida Materna== https://ceur-ws.org/Vol-1318/paper10.pdf
  Clasificadores supervisados para el análisis predictivo de muerte y
                         sobrevida materna
                                      Pilar Vanessa Hidalgo León

                     Universidad Andina del Cusco/San Jerónimo, Cusco-Perú
                                   phidalgo@uandina.edu.pe

                                                          cuando este problema requiere prontitud por su
                     Resumen                              naturaleza, los clasificadores transforman los
                                                          datos en conocimiento y aportan aplicaciones
El presente trabajo se basa en el análisis de los
clasificadores supervisados que puedan generar            exitosas.
resultados aceptables para la predicción de la muerte     En el caso de factores de riesgo para la salud
y sobrevida materna, según características de             materna, existen estudios estadísticos y
pacientes complicadas durante su gestación                aplicaciones salubristas para determinarla, mas
determinada por los expertos salubristas. Se describe
                                                          no integrados simultáneamente como parte de
la metodología del desarrollo, las particularidades de
la muestra, además los instrumentos utilizados para el    una probabilidad clasificatoria como modelo.
procesamiento de los datos. Los resultados de la          Por ello, este estudio determinará, el clasificador
investigación luego de la evaluación de cada              supervisado más eficiente en tiempo y resultado
clasificador y entre ellos el que mejores resultados      que establezca la diferencia de clases entre
arroja. Los histogramas acerca de cada atributo de las
                                                          pacientes gestantes complicadas durante su
pacientes, y la inclusión en la muestra. Los
parámetros determinantes para su correcta                 embarazo que pueden llegar a presentar síntomas
clasificación. La comparación de cada resultado entre     fatales y las que no, así apoyar al personal de
cada tipo de clasificador dentro de la familia a la que   salud a tomar la decisión más optima y a
pertenece para después de identificado, implementar,      prevenir futuras alzas en el índice de mortalidad
el algoritmo de Naive-Bayes con estimador de              de su comunidad.
Núcleo activado (KERNEL=TRUE), en un software
que contribuya a la toma de decisiones certera y          Los problemas que generan el alza de este
respaldada para los profesionales de la salud. En         indicador ya son conocidos y puestos en valor en
conclusión se encontró un clasificador supervisado        esta investigación:
que responde positivamente a dar cambio y mejora de
                                                          “Hoy en día existe suficiente evidencia que
la problemática que abarca a la sobrevida materna a
pesar de sus complicaciones.
                                                          demuestra que las principales causas de la
                                                          muerte materna son la hemorragia posparto, la
Palabras Clave: Mortalidad materna,                       preclampsia o la sepsis y los problemas
clasificadores supervisados, Redes bayesianas,            relacionados con la presentación del feto.
Aprendizaje supervisado.                                  Asimismo, sabemos cuáles son las medidas más
                                                          eficaces y seguras para tratar estas emergencias
    1    Introducción                                     obstétricas. Para poder aplicarlas, es necesario
                                                          que la gestante acceda a un establecimiento de
El objetivo en el uso de clasificadores                   salud    con     capacidad     resolutiva,    pero
supervisados (Araujo, 2006), es construir                 lamentablemente muchas mujeres indígenas no
modelos que optimicen un criterio de                      acuden a este servicio por diversas razones, tanto
rendimiento, utilizando datos o experiencia               relacionadas con las características geográficas,
previa. En ausencia de la experiencia humana,             económicas, sociales y culturales de sus grupos
para resolver una disyuntiva que requiere                 poblacionales, como por las deficiencias del
explicación precisa, los sistemas implementados           propio sistema de salud.
por modelos clasificadores han sido parte
importante en la toma de decisiones. A parte,             En los últimos años se han hecho muchos




                                                   67
esfuerzos para revertir esta situación, tanto            ya que el estado del registro de las historias
mediante proyectos promovidos por el estado              clínicas correspondientes a los casos de
como      ejecutados    por    organismos    no          fallecimiento no son legibles, ni están
gubernamentales de desarrollo. Estos esfuerzos           conservadas en las mejores condiciones en los
han tenido, sin embargo, resultados desiguales           archivos de la Dirección Regional de Salud
debido principalmente a la poca adecuación de            Cusco, esto hace que la muestra no pueda ser
los proyectos al contexto geográfico y de                nutrida con mayor diversidad de datos.
infraestructura en el que vive gran parte de la          (DIRESA, 2007)
población indígena, a sus dificultades
económicas para acceder al servicio, su cultura,         Existe poca investigación acerca del tema
sus propios conceptos de salud y enfermedad, y           relacionado con el uso de clasificadores
su sistema de salud.”(Cordero, 2010)                     supervisados y otras correspondientes a
                                                         diagnósticos médicos que tienen similitud con la
2 Contenido                                              muestra pero ninguna que se relacione
                                                         directamente.
Problema
                                                         La relevancia de los datos se limito a los
¿Cuáles son los clasificadores supervisados que
                                                         antecedentes sobre estudios en mortalidad
predicen la muerte o la sobrevida materna con
                                                         materna (edad, estado civil, analfabeta,
mayor efectividad?
                                                         ocupación, procedencia, anticoncepción, entorno
Entonces para determinar adecuadamente la                (estrato social), controles pre-natales, ubicación
efectividad   de   cada   algoritmos  nos                domiciliaria, tiempo de demora en atención,
cuestionamos:                                            atención profesional, antecedentes familiares,
                                                         espacio intergenésico (en años), paridad (número
    •       ¿Cuál     es la especificidad, la            de hijos), complicaciones no tratadas,
            clasificación correcta y el error absoluto   fallecimiento), conservando el anonimato de
            y     sensibilidad    del     clasificador   cada paciente.
            supervisado en relación a los datos de
            mortalidad materna?                          Objetivos

        -      Redes neuronales                               •   Determinar el clasificador supervisado
                                                                  que brinde mejores resultados para el
        -      Redes Bayesianas                                   análisis predictivo     de muerte y
                                                                  sobrevida materna.
        -      Regresión Logística
                                                                  Luego para lograr este objetivo se debe:
        -      Arboles de Decisión
                                                              •   Determinar       la   especificidad,    la
        -      Algoritmos Basados en Distancias
                                                                  clasificación correcta, el error absoluto,
Mediante la herramienta Weka, se determinó la                     la     sensibilidad    del    clasificador
sensibilidad, la certeza más cercana de cada uno                  supervisado en relación a los datos de
de estos algoritmos, y cuya conclusión sugerirá                   muerte y sobrevida materna.
el más eficiente.
                                                                      -   Redes neuronales
Actualmente la problemática en mortalidad                             -   Redes Bayesianas
materna es un indicador determinante de
desarrollo en los países Latinoamericanos.                            -   Regresión Logística
Siendo no solo un indicador de pobreza y
desigualdad sino de vulnerabilidad de los                             -   Arboles de Decisión
derechos de la mujer. (OMS, 2008)
                                                                      -   Algoritmos Basados en
Limitaciones de la Investigación                                          Distancias

Los datos recolectados para este estudio con
respecto a pacientes fallecidas que tuvieron
complicaciones durante el embarazo fueron 48,




                                                         68
Hipótesis General.                                          control sanitario de mortalidad materna de la
                                                            Región Cusco.

Hi: Existen clasificadores supervisados que                 El número es limitado, pues las historias desde
predicen la muerte o la sobrevida materna con               1992 al 2011, no han sido redactadas ni
efectividad                                                 conservadas en el mejor estado haciendo difícil
                                                            la tarea de interpretar los datos suficientes para
H. nula: No existen clasificadores supervisados             ser analizados.
que predicen la muerte o la sobrevida materna
con efectividad                                             Estas pacientes no fueron necesariamente
                                                            atendidas desde el inicio en estos
                                                            establecimientos, sino que debido a sus
                                                            complicaciones durante el parto y e embarazo
Definición de Variables:                                    fueron derivadas a las capitales y luego a los
                                                            establecimientos      de    mayor    capacidad
Variable principal:                                         resolutiva para su atención.
       Clasificadores supervisados                          Los datos de las historias clínicas que
                                                            incluyeran:
Variables Implicadas:
                                                                       •   Edad
                                                                       •   Estado civil
   Variable          Clasificadores supervisados
                                                                       •   Analfabeta
  Dimensión       Las Redes Neuronales, Algoritmos
                                                                       •   Ocupación
                        supervisados, Las Redes
                   Bayesianas, Arboles de decisión,                    •   Procedencia
                   Regresión Logística, Algoritmos                     •   Anticoncepción
                          basados en instancias                        •   Entorno (estrato social)
 Indicador/       Clasificación correcta,
 Criterios de     Clasificación incorrecta,                            •   Controles pre-natales
  Medición        Sensibilidad,Especificidad, Tiempo                   •   Ubicación domiciliaria
                  de ejecución                                         •   Tiempo de demora en atención
                  Mean absolute error
                  Kappa statistic
                                                                       •   Atención profesional
                  Root mean squared erro, Relative                     •   Antecedentes familiares
                  absolute error                                       •   Espacio intergenésico (en años)
                  Root relative squared error                          •   Paridad (#de hijos)
    Clase                  Numérica discreta
                                                                       •   Complicaciones no tratadas
 Instrumento            Weka 3.5.7, Explored
                                                                       •   Fallecimiento

            Tabla I: Variables implicadas                   Entre 52 sobrevivientes y 48 fallecidas, ambos
                                                            grupos con similares características, siendo
                                                            factores determinantes: (Ramírez, 2009)
Metodología de investigación
                                                              Ubicación domiciliaria /tiempo demora en
Cuasi Experimental, Aplicada, Inductiva                                      atención
                                                                     Controles > 2: n (49.0/2.0)
Descripción de la muestra y método de                           PRODECENCIA = rural: s (6.0/1.0)
recolección
                                                            Técnica e instrumentos de investigación
Los datos recolectados en todas 100 historias               Se utilizó la herramienta Weka Explorer para
clínicas (HC) de casos de sobrevida y de casos              la interpretación de los datos.
de muerte materna.                                          Las opciones de clasificación supervisada y los
                                                            algoritmos que propone esta herramienta.
 Las características de las gestantes son muy
                                                            (Corso, 2009)
 similares entre si y corresponden a la población
 de la ciudad del Cusco, del archivo en la Red
 Sur de la Dirección Regional de Salud sobre el




                                                       69
 Se evaluaron los siguientes clasificadores                          o    Identificación de las fuentes de
 supervisados:                                                            información externas e internas y
                                                                          selección del subconjunto de
      • Las Redes Neuronales                                              datos necesario.
          - MultilayerPerceptron                          •       Pre procesamiento: estudio de la calidad
          - RBFNetwork                                            de los datos y determinación de las
     • Las Redes Bayesianas                                       operaciones de minería que se pueden
          - BayesNet                                              realizar.
          - Bayes simple estimator                        •       Transformación de datos: conversión de
          - BMA bayes                                             datos en un modelo analítico.
          - Naive-Bayes                                   •       Análisis de datos interpretación de los
          - BayesNet Kernel                                       resultados obtenidos en la etapa anterior,
          - Naive-Bayes                                           generalmente con la ayuda de una
          - Discretizacion Supervisada                            técnica de visualización.
     • Arboles de decisión                                •       Asimilación         de      conocimiento
          - J48                                                   descubierto(Calderón, 2006)
          - DecisionTable                                 •       Minería      de     datos:    tratamiento
     • Regresión Logística                                        automatizado de los datos seleccionados
          - MultiClassClassifier                                  con una combinación apropiada de
          - Logistic                                              algoritmos. (Ramirez, 2011).
     • Algoritmos basados en Distancias                            NEGATIVO         POSITIVO       VALORES
          - IBK                                   Edad             Menor a 19 y     Entre 19-35    14-48
          - LWL                                                    mayor 35
          - KStar                                 Estado civil     Soltera          Pareja         Soltera-pareja
Estos resultados fueron comparados con las        Analfabeta       Analfabeta       Primaria       Analfabeta-
reglas de clasificación que nos proporcionará                                                      primaria-
                                                                                                   secundaria-
los algoritmos de predicción inmediata:                                                            superior
                                                  Ocupación        No               Remunerada     Remunerada-no
              -   OneR                                             remunerada                      remunerada
                                                  Procedencia      Rural            Urbana         Rural-urbana
              -   ZeroR
                                                  Anticoncepc      No               Si             Si-no
                                                  ión
 Procedimiento de recolección de datos            Entorno          Bajo             Medio-alto     Baja-alta
                                                  (estrato
                                                  social)
 Las Historias Clínicas se insertaron en un       Controles        De 1 a 5         6 a mas        0-12
 fichero CSV (delimitado por comas) cuya
                                                  Ubicación        Más de       2   Menos 3 del    Menos de 1 hora,
 cabecera contiene las etiquetas de cada          domiciliaria/    horas            ee.ss          1-2,3-5,6 a mas
 atributo, y la última columna se refiere a la    tiempo
 clase a la pertenecen.                           demora en
                                                  atención
 Con respecto a los indicadores particulares en   Personal de      No               Si             No-si
 cada uno de los atributos de los sujetos de la   atención
 clase tenemos los siguientes valores: Tabla II   profesional
                                                  Antecedente      No               Si             No-si
                                                  s familiares
  •       La calidad de la estructuración         Espacio          Menos de 2       Entre 2-4      Primera gesta,1-
                                                  intergenésic     mayor a 4                       3,4-6, menos 1
  •       Comparar todas mediciones en cada       o (en años)
          clasificador por algoritmo.             Paridad (#de     Primípara o      Entre 2-4      0-10
  •       Evaluar los resultados.                 hijos)           mas de 4
                                                  Complicacio      Complicacion     Sin            No-si
  •       Interpretar los resultados.             nes        no    es antes y       complicacion
                                                  tratadas         durante          es
 2.9. Plan de análisis de la información          Fallecida        Si               No             No-si


      •    Determinación de objetivos                Tabla II: Rango de valores de los atributos en las
      •    Preparación de datos                                   pacientes de la muestra
      •    Selección de datos:




                                                     70
Histogramas:


Cada Atributo es evaluado visualmente por los          •     Fracción de verdaderos negativos (FVN).
histogramas que arroja Weka (en total 15), por               Demuestra la cantidad de pacientes que
ejemplo con respecto a la EDAD de las pacientes              realmente pertenecen a la clase
de la muestra.                                               Sobreviviente. Quiere decir que si el
                                                             algoritmo estudiado tiene alto porcentaje
                                                             de especificidad determina con gran éxito
                                                             la probabilidad de sobrevida en pacientes
                                                             complicadas durante su embarazo según
                                                             los datos proporcionados en la ficha de
                                                             antecedentes.

                                                           • Clasificación correcta: de la totalidad de
                                                             datos, entre los que 52 que pertenecen a la
                                                             clase Sobreviviente, y los 48 que pertenece
                                                             a la clase Fallecida, determina dentro de
                                                             cada clase cuantas instancias luego de la
                                                             construcción del clasificador cuantas si
                                                             pertenecen a la clase determinada.
Gráfico 1: Histograma de la Edad de las
pacientes de la muestra
                                                       •     En el caso de pertenecer a la clase
Este histograma nos muestra el intervalo de edad             sobreviviente o a la fallecida de las 100
de las pacientes de la muestra, la diferencia de             instancias cuantas fueron clasificadas
colores determinan la clase a la que pertenece               correctamente.
cada intervalo. Podemos observar lo siguiente:
                                                       •     Clasificación incorrecta: del mismo
      •    Las pacientes del intervalo 14-20 años            modo la cantidad de instancias que no
           pertenecen en su mayoría a la clase               fueron clasificadas de manera correcta,
           “sobreviviente”                                   son las que de manera supervisada se sabe
                                                             que pertenecen a una u otra clase y fueron
      •    Las pacientes del intervalo 21-31 años            incluidas dentro de la cual no eran. Si el
           tienen un mayor porcentaje de sobrevida,          indicador emite un número mayor al 50%
           coincide con el promedio de edad                  de la cantidad total de instancias, no se
           adecuado y de la muestra.                         debe considerar como eficiente.
      •    El intervalo de paciente entre 32-40 años   •     Sensibilidad: es la capacidad del
           tiene mayor porcentaje de muerte.                 algoritmo de clasificar a las pacientes
                                                             complicadas dentro de la clase Fallecidas.
      •    Las pacientes mayores a 40 años
                                                             Es decir que si el clasificador tiene un alto
           pertenecen a la clase “fallecida” en gran
                                                             porcentaje tiene mejor curva de corte y
           porcentaje.
                                                             discernimiento entre los sujetos que
Resultados por algoritmo testeado:                           pertenecen o no a la clase fallecida, es así
                                                             que si la cifra de sensibilidad es del 90%,
Los algoritmos usados para evaluar la base de                existe entonces esa probabilidad de que la
datos en mortalidad materna dieron como                      paciente fallezca.
resultado cifras continuas indicando los
siguientes sucesos: Tabla 2.
                                                       •     Mean absolute error: Se define error
  •       Especificidad: es la probabilidad de que           absoluto de una medida la diferencia entre
          pacientes complicadas y de riesgo                  el valor medio obtenido y el hallado en esa
          pertenezcan a la clase Sobreviviente. Es           medida todo en valor absoluto.
          decir los verdaderos negativos.




                                                 71
•   Entonces el promedio de error absoluto, es        •      Relative absolute error: es el error
    la suma de los errores absolutos de                      relativo a cada característica de la clase,
    clasificación en cada uno de los sujetos                 por ejemplo el error relativo de tener de
    llevados a promedio. El clasificador que                 Espacio Intergenésico 0.5 años y
    arroje mayor cifra (mayor a 0.1) define un               pertenecer o no a la clase fallecida, la
    error de clasificación alto, por lo cual no              clasificación indicaría que si pertenece,
    se debe considerar por sobre los que                     por ser el valor indicado para aquellas
    arrojen una cifra menor.                                 pacientes que están en peligro.
                                                             En este caso el valor positivo para
•   Tiempo de ejecución: medido en                           pertenecer al clase sobreviviente es de
    segundos es la cantidad de tiempo que                    entre 2-4 años o primera gesta: 0.5 años
    demora en construir la arquitectura del                  incluido en la clase fallecido si el error
    clasificador y en arrojar resultados.                    entre los valores determinados por la clase
•   Puede que un clasificador se defina como                 y el valor ingresado es menor a 1.
    eficiente si el tiempo que emplea en emitir
    resultados es menor a 5 segundos, aun así         •      Root relative squared error: La raíz
    depende de los demás indicadores para                    relativa E de error al cuadrado i de un
    valerse de esta característica.                          programa individual i es evaluado por la
                                                             ecuación:
•   Kappa statistic: el Kappa statistic es la
    concordancia de comparación que tienen
    los observadores de clasificación. Quiere
    decir en una matriz de clasificación, el
    índice esperado entre el diagonal principal
    esperada (Xii elemento clasificado en la
    misma clase por ambos observadores) y el                 donde P (ij) es el valor predicho por el
    índice real luego de la clasificación                  programa para el individuo i j muestra de
    efectuada por la arquitectura seleccionada            casos (de los casos de la muestra n), T j es el
    (sea regresión lineal, backpropagation,                  valor objetivo para la muestra j caso,
    Naive-bayes, etc.), es la diferencia en                         y     está dada por la fórmula:
    porcentaje de su lejanía a este valor.

•   Si por ejemplo, la matriz esperada clasifica
    el valor en 25.00 y el resultado de la
    arquitectura es 26.7, la diferencia seria, 1.7
    equivale al 90.32%. Entonces cuanto mas               Para un ajuste perfecto, el numerador es
    grande sea el porcentaje, estará más cerca            igual a 0 y E i = 0. Así, el E i índice varía de
    de ser considerado eficiente.                         0 a infinito, con el ideal que corresponde a
                                                          0.
•   Root mean squared error: error
    cuadrático medio, es una medida de uso
                                                                                   Redes      Redes
    frecuente de las diferencias entre los                                Reglas   Bayesianas Neuronales
    valores pronosticados por un modelo o un                                       NAÏVE
    estimador y los valores realmente                                              BAYES
    observados. RMSD es una buena medida             INDICADORES OneR              KERNEL RBFNetwork
    de precisión, pero sólo para comparar                                                     0.9
                                                     Especificidad        0.836    0.91
    diferentes errores de predicción dentro de       Clasificación                            90
    un conjunto de datos y no entre los              correcta             84       91
    diferentes, ya que es dependiente de la una      Clasificación                           10
    escala       muestra. Estas     diferencias      incorrecta           16       9
    individuales           también           se                                              0.9
                                                     Sensibilidad         0.868    0.914
    denominan residuos, y la RMSD sirve para                                                 0.1468
    agregarlos en una sola medida de la              Mean      absolute
                                                     error                0.16     0.1142
    capacidad de predicción.




                                                     72
  Tiempo         de                          0.26                   • Relative absolute error <25%, <1 ideal
  ejecución            0.2      0.01                                • Root relative squared <50%, 0 ideal
                                             0.7997
  Kappa statistic      0.6759   0.819                          El clasificador que cumpla con estas
  Root        mean                           0.3032            especificaciones, se considera como optimo
  squared error        0.4      0.2737
  Relative absolute                          29.39%
                                                               para la integración en un sistema que evaluará
  error                32.03% 22.86%                           la base de datos que contengan los datos de las
  Root      relative                         60.64%            pacientes a comparar con un registro nuevo de
  squared error        80.01% 54.74%                           entrada.

          Tabla III: Algoritmos de clasificación              Etapa de Evaluación:
         supervisada con mejores resultados por
                                                              Cada uno de los clasificadores estudiados, que
                         familia
                                                              analizaron la muestra de pacientes, arrojaron los
                                                              indicadores que muestra la tabla, en nivel de
                     Arboles    Algoritmos                    rendimiento y buenos resultados, aceptables para
                     de         de            Regresión       el estudio, la arquitectura que lleva los
                     Decisión   Distancia     Logística       porcentajes mas óptimos dentro de los
INDICADORES J48                 LWL           Logistic        parámetros, es el algoritmo de Naive bayes con
                                0.889         0.82            estimador de núcleo.
Especificidad        0.9
Clasificación                   89            82
correcta             90                                       Descartando así el resto de arquitecturas como
Clasificación                   11            18              apropiadas para este tipo de muestras. Además
incorrecta           10                                       de visualizar de manera más clara y correcta los
Sensibilidad    0.9             0.902         0.82            resultados comunes entre cada una de las
Mean absolute                   0.168         0.1753          arquitecturas dejando atrás aquel paradigma que
error           0.1174                                        incluye a la regresión logística como la más
Tiempo       de                 0             0.81            adecuada a la hora de realizar diagnósticos
ejecución       0.02
                                0.6388        0.6388
                                                              preventivos en salud.
Kappa statistic      0.7994
Root        mean                0.3019        0.4157
squared error        0.299                                    Kernel estimator, al ser un método de
Relative absolute               33.64%        35.10%          construcción no paramétrico, es mas flexible que
error                23.75%                                   los clasificadores que incluyen parámetros.
Root      relative              60.39%        83.15%          Dividiendo la muestra en 40 grupos en la
squared error        59.80%                                   variable edad, paridad 15, controles 17, para la
                                                              exploración descubre nuevas alternativas de
  Tabla IV: Algoritmos de clasificación                       clasificación en los atributos de la clase,
  supervisada con mejores resultados por familia              mostrándolos como relevantes.

  Descripción de la metodología propuesta                     El problema más resaltante es que requiere
                                                              mayor tamaño de muestra para mantener estos
  Se propone entonces que evaluando cada uno                  resultados, ya que utilizado el agrupamiento para
  de los indicadores más importantes en la                    la clasificación (clustering) que podría ser una
  construcción del clasificador, se descarten                 desventaja si de clasificadores supervisados
  aquellos que no cumplen las siguientes                      hablamos. Esto se denomina the curse of
  características:                                            dimensionality, pues dependen de la elección de
                                                              un parámetro suavizado, en este caso los valores
        • Especificidad > 90%                                 la edad, número de controles, y número de hijos,
        • Clasificación correcta > 90 instancias              transformándola en no objetiva.
        • Clasificación incorrecta < 10 instancias
        • Sensibilidad >90%                                   Cuando Naive-Bayes actúa con la estimación no
        • Mean absolute error < 0.1 ideal                     paramétrica, las estructuras que se construyen a
        • Kappa statistic >0.79, >0.9 ideal                   partir de esta arquitectura se obtienen a partir de
        • Root mean squared error < 0.3, <1 ideal             un árbol formado con variables potencialmente
                                                              predictoras multidimensionales. (Serrano, 2010)




                                                         73
3 Conclusiones
Con respecto a la respuesta de las hipótesis
podemos afirmar lo siguiente:

   •   Encontramos que las arquitecturas
       propuestas por esta memoria, totas
       conservan una efectividad bastante
       aceptable e cada uno de sus indicadores
       que en conjunto hacen un 80% de
       eficacia. Siendo el más optimo el de
       Naive-Bayer Kernel.

   •   Descarta estas     hipótesis luego del
       trabajo realizado.

   •   Las Redes Bayesianas brindan al estudio
                                                           Gráfico 2: Indicadores estadísticos de
       de los datos en mortalidad y sobrevida
                                                           todos los algoritmos de clasificación
       materna una especificidad         91%,
                                                           supervisada
       clasificación correcta 91%., error
       absoluto 0.1142, y sensibilidad 0.914      4 Recomendaciones
       recomendada.
                                                       •   Se recomienda usar datos discretizados,
   •   Las Redes Neuronales brindan al estudio
                                                           si se desea usar Naive-Bayes para su
       de los datos en mortalidad y sobrevida
                                                           evaluación.
       materna una especificidad         90%,
       clasificación correcta 90%, error               •   Agrupar los datos de la manera
       absoluto 0.1468 y sensibilidad 90%                  propuesta en la Tabla 1, así podremos
       recomendada.                                        respetar los parámetros acerca de
                                                           mortalidad materna que establecen los
   •   Los Arboles de Decisión brindan al                  expertos salubristas.
       estudio de los datos en mortalidad y            •   Es importante comparar los resultados
       sobrevida materna una especificidad                 con la regla de decisión OneR para
       90%, clasificación correcta 90%, error              próximos experimentos, pues nos da la
       absoluto 0.1174 y sensibilidad 90%                  mejor noción de veracidad y efectividad
       recomendada.                                        a la hora de analizar la información.
                                                       •   Se pretende implementar un sistema en
   •   Los Algoritmos basados en Distancias                R Project, para ingresar nuevos registros
       brindan al estudio de los datos en                  y que lleve en la memoria la base de
       mortalidad y sobrevida materna una                  datos recolectada a través de este trabajo.
       especificidad    88.9%,   clasificación         •   Para ayudar a la muestra numeraria que
       correcta 89%, error absoluto 0.168 y                requiere Naive- Bayes Kernel, es
       sensibilidad 90.2% recomendada.                     necesario ingresar los registros de las
                                                           muertes maternas y complicaciones
   •   La Regresión Logística brinda al estudio            diarias de las gestantes a nivel Nacional
       de los datos en mortalidad y sobrevida              en la base de datos.
       materna una especificidad          82%,
       clasificación correcta 82%, error
       absoluto 0.1753 y sensibilidad 82%
       recomendada.




                                                  74
                                                   María García Jiménez, & Aránzazu Álvarez
                                                    Sierra. (2010) Análisis de Datos en WEKA
   Agradecimientos
                                                    – Pruebas de Selecitividad. Articulo.
   Agradezco al Dr. Basilio Araujo y al Dr.
   Yosu Yuramendi, por su apoyo y                  María N. Moreno García* L. A. (2005)
   perseverancia para la culminación de este        Obtención Y Validación De Modelos De
   proyecto de fin de master.                       Estimación De software Mediante Técnicas
                                                    De Minería De Datos. Revista colombiana
   Al personal de salud que proporciono la          de computación, 3[1], 53-71.
   información clínica que se usó en la
   investigación.                                  Msp Mynor Gudiel M., 1. E. (2001-2002)
5 Síntesis curricular de la autora:                 Modelo Predictor De Mortalidad Materna.
                                                    Mortalidad Materna, 22-29.
   Pilar Hidalgo León, Ingeniera de Sistemas de
   la Universidad Andina del Cusco en Perú,        Organización Mundial De La Salud.
   Docente en la Facultad de Ingeniería,            Mortalidad Materna En 2005, (2008) :
   Sustentación de proyecto de máster en la         Estimaciones Elaboradas Por La Oms, El
   Universidad      del       País       Vasco.     Unicef, El Unfpa Y El Banco. Ginebra 27:
   Contacto:phidalgo@uandina.edu.pe,                Ediciones de la OMS.
   Universidad Andina de Cusco, San Jerónimo,
   Cusco, Perú.                                    Porcada, V. R. (2003) Clasificación
                                                    Supervisada Basada En Redes Bayesianas.
6 Referencias bibliográficas                        Aplicación En Biología Computacional.
   Clasificadores supervisados: el objetivo es      Madrid: Tesis Doctoral.
    obtener un modelo clasificatorio valido
    para permitir tratar casos futuros.( 2006)     Ramírez Ramírez, R., & Reyes Moyano, J. ,
    Araujo, B. S. Aprendizaje Automatico:           (2011). Indicadores De Resultado
    conceptos básicos y avanzados. Madrid,          Identificados En Los Programas
    España: Pearson Prentice Hall,                  Estratégicos. Lima: Encuesta Demográfica
                                                    Y De Salud Familiar – Endes
   Cordero Muñoz, L., Luna Flórez, A., &           Ramirez, C. J. (2009)Caracterización De
    Vattuone Ramírez, M. (2010) Salud de la          Algunas Técnicas Algoritmicas De La
    mujer indígena : intervenciones para reducir     Inteligencia Artificial Para El
    la muerte materna. © Banco Interamericano        Descubrimiento De Asociaciones Entre
    de Desarrollo.                                   Variables Y Su Aplicación En Un Caso De
   Antonio Serrano, E. S., (2010) Redes              Investigación Específico. Medellin: Tesis
    Neuronales Artificiales. Universidad de          Magistral.
    Valencia.                                      Reproductive Health Matters, (2009)
   Calderón Saldaña, J., & Alzamora de los           Mortalidad Y Morbilidad
    Godos Urcia, L. (2009) Regresión Logística       Materna:Gestación Más Segura Para Las
    Aplicada A La Epidemiología. Revista             Mujeres. Lima: © Reproductive Health
    Salud, Sexualidad y Sociedad, 1[4].              Matters.

   Calderón, S. G, (2006) Una Metodología          Vilca, C. P. (2009) Clasificación De Tumores
    Unificada para la Evaluación de Algoritmos        De Mama Usando Métodos. Lima: Tesis.
    de Clasificación tanto Supervisados como       Dirección Regional De Salud Cusco, (2007)
    No-Supervisados. México D. F.: resumen de         Análisis De Situación De La Mortalidad
    tesis doctoral.                                   Materna Y Perinatal, Región Cusco.
   Corso, C. L. (2009) Aplicación de algoritmos
    de clasificación supervisada usando Weka.      Ministerio De Salud, Dirección General De
    Córdoba: Universidad Tecnológica                 Epidemiología Situación De Muerte
    Nacional, Facultad Regional Córdoba.             Materna, (2010-2011), Perú.




                                            75