<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Impacto de la iron´ıa en la miner´ıa de opiniones basada en un L´exico Afectivo</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Yolanda Raquel Baca-G´omez</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>No´e Alejandro Castro-S´anchez</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Alicia Mart´ınez CENIDET</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Cuernavaca</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>M´exico</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>yolandabaca</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>ncastro</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>amartinez}@cenidet.edu.mx</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Delia Irazu ́ Herna ́ndez Far ́ıas, Paolo Rosso NLE Lab, PRHLT research center Universitat Polit`ecnica de Val`encia</institution>
          ,
          <addr-line>Espan ̃a</addr-line>
        </aff>
      </contrib-group>
      <fpage>41</fpage>
      <lpage>44</lpage>
      <abstract>
        <p>En este art´ıculo se describe un m´etodo sistema´tico que identifica la polaridad de textos en Espan˜ol, as´ı como el impacto de la iron´ıa en la miner´ıa de opiniones. Se propone una aproximaci´on basada en un aprendizaje automa´tico y en la extraccio´n de caracter´ısticas a partir de un L´exico Afectivo en Espan˜ol. Fue necesaria la creaci´on de un corpus para el entrenamiento y evaluacio´n del m´etodo propuesto. Los resultados experimentales muestran que la iron´ıa tiene un impacto negativo en la evaluacio´n realizada.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>Resumen</title>
      <p>El m´etodo propuesto consta de 4 fases, las cuales se muestran en la Fig. 1. Se consideraron 5 categor´ıas de
polaridad: muy positiva, positiva, neutral, negativa, muy negativa y adem´as se realizo´ una comparaci´on con la
clasificacio´n en 3 categor´ıas: positiva, neutral y negativa.
2.1.</p>
      <sec id="sec-1-1">
        <title>Fase 1: Extraccio´n de comentarios</title>
        <p>Se desarrollo´ una App de Facebook, mediante la cual se extrajeron autom´aticamente comentarios de Facebook
y se generaron dos corpus. El primero fue utilizado para complementar la creaci´on del L´exico Afectivo en Espan˜ol
y el segundo para el entrenamiento y evaluaci´on del m´etodo de detecci´on de polaridad.</p>
        <p>1Se organizar´a una tarea sobre Sentiment Polarity Classification (en italiano) en sentipolc@evalita2014
(http://www.di.unito.it/ tutreeb/sentipolc-evalita14/index.html); otra (en ingl´es) con datos de Twitter en SemEval-2015
(http://alt.qcri.org/semeval2015/task11/).
2.2.</p>
      </sec>
      <sec id="sec-1-2">
        <title>Fase 2: Creaci´on del L´exico Afectivo en Espan˜ol</title>
        <p>La creacio´n del L´exico Afectivo en Espan˜ol se inicio´ a partir de la traducci´on al espan˜ol de los siguientes
recursos psicolo´gicos y l´exicos en ingl´es, respectivamente: 1) Palabras clasificadas como positivas y negativas en
las teor´ıas de Klaus R. Scherer, Rick L. Morgan, David Heise, James A. Russell y Paul Ekman y 2) Los l´exicos
afectivos General Inquirer, WordNetAffect y Opinion Finder.</p>
        <p>Se etiquet´o el primer corpus de comentarios en 5 categor´ıas de polaridad, el cual consta de 1,500 comentarios.
A partir del etiquetado de este corpus, se extrajeron manualmente palabras, frases y emoticonos utilizados
frecuentemente en comentarios de Facebook, que posteriormente fueron agregados al L´exico Afectivo en Espan˜ol.</p>
        <p>Figura 1: Diagrama de las 4 fases que componen el m´etodo para la detecci´on de polaridad
2.3.</p>
      </sec>
      <sec id="sec-1-3">
        <title>Fase 3: Creaci´on del corpus de prueba</title>
        <p>El corpus de prueba consta de 1,400 comentarios y fue anotado por tres personas. Cada etiquetador anoto´ los
comentarios con alguna de las 5 categor´ıas de polaridad, y adema´s, como ir´onicos o no ir´onicos. La asignaci´on
de la categor´ıa definitiva de cada comentario se hizo a partir de las anotaciones que generaron los etiquetadores.</p>
        <p>En 5 categor´ıas el corpus qued´o distribuido de la siguiente forma: 109 comentarios muy positivos, 420 positivos,
213 neutrales, 539 negativos y 119 muy negativos. En 3 categor´ıas: 529 positivos, 213 neutrales y 625 negativos.</p>
        <p>Con el objetivo de evaluar los resultados obtenidos en el proceso de anotacio´n del corpus, se utilizo´ la m´etrica
Kappa de Fleiss[Dia13], la cual es una medida estad´ıstica que calcula el grado de acuerdo entre los etiquetadores
en la clasificacio´n, en este caso, de las categor´ıas de los comentarios.</p>
        <p>En la evaluaci´on para la anotaci´on de polaridad se obtuvo un valor de 0.417 y en la anotacio´n de iron´ıa un
valor de 0.458. Con base en la interpretacio´n de esta m´etrica, el grado de acuerdo obtenido es “moderado”. En
ambos casos se puede ver que la subjetividad involucrada en la interpretacio´n y clasificacio´n de los comentarios
tiene un alto grado de impacto.
2.4.</p>
      </sec>
      <sec id="sec-1-4">
        <title>Fase 4: Detecci´on de polaridad</title>
        <p>La detecci´on de polaridad se lleva a cabo en dos procesos. El primero consiste en el pre-procesamiento:
correcci´on ortogr´afica, lematizacio´n y eliminaci´on de StopWords. En el segundo, se lleva a cabo la obtencio´n de
caracter´ısticas utilizando el L´exico Afectivo en Espan˜ol y el Spanish Emotion Lexicon. Las caracter´ısticas que se
consideraron para ser usadas en la fase de entrenamiento son las siguientes:</p>
        <sec id="sec-1-4-1">
          <title>a) Emoticonos positivos y negativos</title>
          <p>b) Palabras muy positivas, positivas, negativas y muy negativas
c) Modificadores (palabras que aumentan o disminuyen la polaridad)
d) Palabras asociadas a emociones positivas y negativas</p>
          <p>Con las caracter´ısticas obtenidas se generan vectores que son procesados con el algoritmo SMO (Sequential
Minimal Optimization) de Weka, utilizando Ten Fold Cross-Validation, para evaluar el m´etodo propuesto.</p>
        </sec>
      </sec>
    </sec>
    <sec id="sec-2">
      <title>Experimentos y resultados</title>
      <p>La experimentacio´n se llev´o a cabo considerando las caracter´ısticas mencionadas anteriormente. En la
evaluaci´on se tomo´ en cuenta la Medida F1, la cual representa la media armo´nica de la precisio´n y la cobertura.
En los resultados se observa que sobre 3 categor´ıas se consigue una Medida F1 m´as alta. En la Tabla 1 se listan
los experimentos realizados sobre el corpus de prueba, donde: SP significa sin ningu´n tipo de procesamiento, P
significa pre-procesamiento y los incisos hacen referencia a las caracter´ısticas descritas en la secci´on anterior.</p>
      <p>Tabla 1: Evaluacio´n con la medida F1 para 5 y 3 categor´ıas
Experimentos
SP
P
P(a)
P(a)(b)
P(a)(b)(c)
P(a)(d)</p>
      <p>Medida F1 5 categor´ıas
38.3 %
42.5 %
44.8 %
45.2 %
45.4 %
44.8 %</p>
      <p>Medida F1 3 categor´ıas
53.3 %
56.4 %
59.1 %
60.2 %
60.8 %
59.2 %</p>
      <p>Adema´s, se realizaron experimentos para visualizar la diferencia a nivel de clasificacio´n de polaridad en los
casos ir´onicos y no ir´onicos. En general, los porcentajes con 5 categor´ıas son bajos, por lo tanto, este experimento
u´nicamente se realizo´ con 3 categor´ıas.</p>
      <p>En los resultados obtenidos se puede apreciar un porcentaje m´as alto en el conjunto de comentarios no ir´onicos,
es cuando se observa el impacto que tiene la iron´ıa, debido a que en el conjunto de comentarios ir´onicos se tiene
una ca´ıda en la Medida F1, en promedio del 10 %. En la Tabla 2 se muestran los resultados obtenidos sobre el
conjunto de 322 comentarios ir´onicos y el conjunto de 1,078 comentarios no ir´onicos con 3 categor´ıas.</p>
      <p>Tabla 2: Evaluaci´on con la medida F1 para 3 categor´ıas</p>
      <sec id="sec-2-1">
        <title>Experimentos SP P P(a)</title>
        <p>P(a)(b)
P(a)(b)(c)
P(a)(d)</p>
      </sec>
      <sec id="sec-2-2">
        <title>Medida F1 3 categor´ıas</title>
        <p>No ir´onicos Iro´nicos
58.1 % 45.8 %
57.7 % 49.5 %
61.8 % 55.0 %
63.4 % 53.2 %
64.3 % 54.4 %
62.1 % 53.7 %</p>
      </sec>
    </sec>
    <sec id="sec-3">
      <title>Conclusiones</title>
      <p>En este art´ıculo se ha estudiado el impacto que puede tener la iron´ıa, en la detecci´on de polaridad con
caracter´ısticas basadas en un L´exico Afectivo y se ha comprobado que se obtienen mejores resultados en los
comentarios no ir´onicos. La iron´ıa tiene un impacto negativo del 10 % sobre el mejor porcentaje de Medida F1
obtenido por el m´etodo de detecci´on de polaridad.</p>
      <sec id="sec-3-1">
        <title>Agradecimientos</title>
      </sec>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          <article-title>Esta investigaci´on ha sido financiada por el proyecto DGEST con Nu´m</article-title>
          . Ref.:
          <fpage>5049</fpage>
          -
          <lpage>13</lpage>
          -P,
          <string-name>
            <surname>Programa</surname>
            <given-names>CONACYT</given-names>
          </string-name>
          (
          <volume>290842</volume>
          ), (
          <volume>218109</volume>
          /313683) y los proyectos DIANA-
          <string-name>
            <surname>APPLICATIONS (TIN2012-38603-</surname>
          </string-name>
          C02-01)
          <article-title>y WIQEI IRSES (Grant No. 269180; FP 7 Marie Curie People)</article-title>
          .
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          [Liu12]
          <string-name>
            <given-names>B.</given-names>
            <surname>Liu</surname>
          </string-name>
          .
          <source>Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies.</source>
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          Morgan Clypool Publishers (
          <year>2012</year>
          ).
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          [Rey12]
          <string-name>
            <given-names>A.</given-names>
            <surname>Reyes</surname>
          </string-name>
          ,
          <string-name>
            <given-names>P.</given-names>
            <surname>Rosso</surname>
          </string-name>
          .
          <article-title>Making Objective Decisions from Subjective Data: Detecting Irony in Costumer Reviews</article-title>
          .
          <source>Journal on Decision Support Systems</source>
          , vol.
          <volume>53</volume>
          , issue 4, pp.
          <fpage>754</fpage>
          -
          <lpage>760</lpage>
          (
          <year>2012</year>
          ).
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          <article-title>[Dia13] I. D´ıaz Rangel. Deteccio´n de afectividad en texto en espan˜ol basada en el contexto lingu¨´ıstico para s´ıntesis de voz</article-title>
          .
          <source>Tesis Doctoral</source>
          , Instituto Polit´ecnico Nacional, M´exico (
          <year>2013</year>
          ).
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>