<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Desaf os del Analisis de Sentimientos</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Salud M</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Jimenez Zafra</string-name>
          <email>sjzafra@ujaen.es</email>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Departamento de Informatica Universidad de Jaen M. Teresa Mart n Valdivia Departamento de Informatica Universidad de Jaen</institution>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>Eugenio Mart nez Camara Departamento de Informatica Universidad de Jaen L. Alfonso Uren~a Lopez Departamento de Informatica Universidad de Jaen</institution>
        </aff>
      </contrib-group>
      <fpage>15</fpage>
      <lpage>18</lpage>
      <abstract>
        <p>La miner a de opiniones (MO), tambien conocida como analisis de sentimientos (AS), es una disciplina que se centra en detectar la informacion subjetiva de un texto y clasi carla. Existen muchos trabajos centrados en la MO, pero la mayor parte de las investigaciones se han realizado sobre opiniones escritas en ingles. Sin embargo, cada vez es mayor la presencia de otros idiomas en Internet, entre los que se encuentra el espan~ol, lo que pone de mani esto la necesidad de su tratamiento. El grupo SINAI de la Universidad de Jaen lleva unos an~os trabajando en el analisis de opiniones en espan~ol [MVMCPOUL13], [MCMVPOUL11], [MGMCMVPO13] y actualmente continua con esta tematica, debido a su gran importancia. Por otra parte, en las revisiones del estado del arte del AS de Bin Liu [Liu12] y de Pang y Lee [PL08] se muestran como desaf os el tratamiento de la negacion, de la iron a y del sarcasmo, la adaptacion al dominio, el analisis a nivel de aspecto, la deteccion de opiniones spam, etc. En este momento nos encontramos trabajando en dos de los frentes abiertos en el analisis de opiniones, como son el tratamiento de la negacion y el analisis a nivel de aspecto o caracter stica.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>Resumen</title>
      <p>En este trabajo se presenta una primera aproximacion a dos de los
frentes abiertos en el analisis de opiniones en los que nos encontramos
trabajando actualmente: el tratamiento de la negacion en espan~ol y el
analisis a nivel de aspecto en ingles. Para abordar el fenomeno de la
negacion se han de nido una serie de reglas que permiten determinar
el ambito de una part cula negativa en una frase a partir de su arbol de
dependencias. Por otro lado, para llevar a cabo un analisis de opiniones
a nivel de aspecto, se ha utilizado la base de datos colaborativa
Freebase, para extraer los aspectos relacionados con la entidad de estudio, y el
analizador de dependencias de Stanford, para determinar las palabras
que modi can a cada aspecto y as poder calcular su polaridad.</p>
    </sec>
    <sec id="sec-2">
      <title>Introduccion</title>
      <p>2</p>
    </sec>
    <sec id="sec-3">
      <title>Tratamiento de la negacion en espan~ol</title>
      <p>La negacion es un elemento fundamental en el analisis de opiniones, que requiere un tratamiento especial, ya que
una opinion negativa puede ser expresada con terminos positivos negados o, por el contrario, una opinion positiva
puede expresarse a partir de la negacion de terminos negativos. Las oraciones \La pel cula no me gusto" y \El
personaje principal no era una mala persona" son claros ejemplos de los dos casos mencionados anteriormente.</p>
      <p>Debido a la importancia de este fenomeno decidimos realizar una primera aproximacion al estudio de la
negacion en opiniones escritas en espan~ol. Este trabajo todav a no esta publicado, ya que estamos re nando
algunos aspectos, pero esperamos ponerlo a disposicion de la comunidad investigadora en un breve per odo de
tiempo.</p>
      <p>En el trabajo mencionado se propone un sistema no supervisado para la clasi cacion de opiniones teniendo
en cuenta la in uencia de la negacion. La negacion es una caracter stica particular de cada idioma que debe
ajustarse a las singularidades de la lengua en estudio. En nuestro caso se han estudiado las part culas negativas
mas importantes segun la RAE [Esp09]: \no", \tampoco", \nadie", \jamas", \ni", \sin", \nada", \nunca" y
\ninguno". Para resolver este fenomeno es necesario, en primer lugar, identi car el ambito de la negacion y,
posteriormente, modi car la polaridad del fragmento de la oracion que se ve afectado por ella.</p>
      <p>Para determinar el ambito de la negacion se han de nido una serie de reglas que permiten generalizar el
tratamiento de las distintas part culas negativas. Para construir estas reglas se ha llevado a cabo un estudio de
los arboles de dependencias de diferentes oraciones en las que esta presente alguna de las part culas abordadas.
Para ello, se ha utilizado el analizador de dependencias de Freeling [Pad12], que permite generar el arbol de
dependencias de una oracion en base a su estructura sintactica. En la Tabla 1 se muestran las reglas obtenidas
tras realizar el estudio.</p>
      <p>Part cula
no, tampoco, nadie, jamas,
ninguno
ni, sin</p>
      <p>Regla
Afecta al nodo padre y al arbol formado
por el hermano de la derecha (incluido).</p>
      <p>Afecta a todos los hijos y a todos los
arboles formados por ellos hasta llegar a nodos
hoja.</p>
      <p>Afecta al nodo padre.
nada, nunca</p>
      <p>Tabla 1: Reglas ambito de la negacion.</p>
      <p>Estas reglas permiten marcar las palabras de la oracion afectadas por alguna de las part culas de estudio,
de manera que se tenga en cuenta esta informacion a la hora de calcular la polaridad de la opinion. Nuestra
propuesta consiste en invertir la polaridad de las palabras marcadas, es decir, de las palabras pertenecientes al
ambito de la negacion. Por ejemplo, en la oracion \El personaje principal no era una mala persona", la part cula
negativa \no", segun las reglas de nidas, afecta a las palabras \era", \mala" y \persona" (Figura 1), las cuales
llevaran la marca de la negacion, pero solo \mala" expresa opinion (-1, negativa) por lo que su polaridad se
vera invertida (-1 * -1) = (1, positiva).</p>
      <p>Para demostrar que la capacidad de prediccion de la polaridad de un sistema de clasi cacion de opiniones
mejora al incluir un modulo que se encargue del tratamiento de la negacion, en este trabajo, se han realizado
experimentaciones sobre un corpus en espan~ol formado por 3.878 cr ticas de cine [CTEO08] recogidas de la web
MuchoCine1, utilizando diferentes recursos lingu sticos para el calculo de la polaridad. Las experimentaciones se
han llevado a cabo tanto sin el modulo de identi cacion de la negacion como con el, llegando a la conclusion de
que se produce una mejora en la clasi cacion.</p>
      <p>No obstante, este trabajo ha sido una primera aproximacion al desaf o del tratamiento de la negacion, en el
cual seguimos trabajando para abordar el resto de part culas negativas utilizadas en espan~ol.
3</p>
    </sec>
    <sec id="sec-4">
      <title>Analisis a nivel de aspecto en ingles</title>
      <p>En el AS se distinguen tres niveles de estudio de un texto: nivel de documento, de frase o de aspecto. El analisis
a nivel de documento determina el sentimiento general expresado en una opinion, mientras que el analisis a nivel
de frase especi ca, para cada una de las oraciones de un texto, si expresan una opinion positiva, negativa o
neutra [Liu12]. Sin embargo, estos dos tipos de analisis no llegan al nivel de detalle que desea un usuario cuando
Figura 1: Arbol de dependencias en el que se analiza la part cula \no" en la oracion \El personaje principal no
era una mala persona".
busca informacion sobre algun producto, ya que el hecho de que la opinion general de un producto sea positiva
no signi ca que el autor tenga una opinion positiva de todos los aspectos de dicho producto, ni el hecho de que
sea negativa implica que todo lo relacionado con el producto sea malo.</p>
      <p>La gran cantidad de fuentes y el elevado volumen de textos con opiniones hacen que resulte complicado para
el usuario seleccionar informacion de su interes. Por ello, es necesario desarrollar sistemas de clasi cacion de
opiniones a nivel de aspecto, que ayuden a los usuarios a tomar decisiones y que, por otro lado, muestren a las
empresas la opinion que los consumidores tienen acerca de sus productos, para ayudarles a decidir que deben
mantener, que deben eliminar o que deben mejorar.</p>
      <p>Actualmente nos encontramos trabajando en este tema sobre opiniones escritas en ingles. Nuestra primera
aproximacion se ha realizado para la participacion en la tarea 4 (Aspect Based Sentiment Analysis) del congreso
SemEval 2014. Esta tarea se centra en la extraccion de los aspectos relacionados con una entidad (ej. ordenadores,
restaurantes) y en el calculo de la polaridad expresada sobre dichos aspectos en la opinion.</p>
      <p>Nuestra propuesta para identi car los aspectos relacionados con el dominio en cuestion (ordenadores,
restaurantes) se basa en la utilizacion de una bolsa de palabras, construida a partir de los datos de entrenamiento
proporcionados y de los datos extra dos de forma automatica de la base de conocimiento colaborativa Freebase2.
Una vez extra dos los aspectos relacionados con la entidad de estudio, el siguiente paso es determinar que
palabras modi can a cada aspecto. Para ello se ha realizado un analisis de dependencias utilizando el analizador de
Stanford [DMM08], considerando las principales formas de expresar opinion acerca de un aspecto: utilizando un
verbo (\nsubj" o \nsubjpass"), empleando un adjetivo (\amod") o por medio de una relacion de dependencia
con otra palabra (\dep"). Tras identi car los modi cadores de los aspectos se ha calculado su polaridad mediante
un sistema de voto formado por tres clasi cadores basados en listas de palabras: Bin Liu [HL04], SentiWordnet
[BES10] y MPQA [WWH05].</p>
      <p>Tras esta primera aproximacion seguimos trabajando en el analisis a nivel de aspecto en ingles, considerando
otros posibles modi cadores. En un futuro cercano trataremos de extrapolarlo a textos en espan~ol.</p>
    </sec>
    <sec id="sec-5">
      <title>Agradecimientos</title>
      <p>Este trabajo ha sido parcialmente nanciado por una subvencion del Fondo Europeo de Desarrollo Regional
(FEDER), por el proyecto ATTOS (TIN2012-38536-C03-0) del Gobierno de Espan~a, por el proyecto AORESCU
(P11-TIC-7684 MO) del Gobierno Regional de la Junta de Andaluc a y por el proyecto CEATIC-2013-01 de la
Universidad de Jaen.
[BES10]</p>
      <p>Stefano Baccianella, Andrea Esuli, and Fabrizio Sebastiani. Sentiwordnet 3.0: An enhanced
lexical resource for sentiment analysis and opinion mining. In LREC, volume 10, pages
2200{2204, 2010.
[CTEO08]
[DMM08]
[Esp09]
[HL04]
[Liu12]</p>
      <p>Ferm n L Cruz, Jose A Troyano, Fernando Enriquez, and Javier Ortega. Clasi cacin de
documentos basada en la opinin: experimentos con un corpus de crticas de cine en espaol.
Procesamiento del Lenguaje Natural, 41(0), 2008.</p>
      <p>Marie-Catherine De Marne e and Christopher D Manning. Stanford typed dependencies
manual. URL http://nlp. stanford. edu/software/dependencies manual. pdf, 2008.</p>
      <p>Real Academia Espan~ola. Nueva gramatica de la lengua espan~ola, volume 1. Espasa Calpe
Madrid,, Spain, 2009.</p>
      <p>Minqing Hu and Bing Liu. Mining and summarizing customer reviews. In Proceedings of
the tenth ACM SIGKDD international conference on Knowledge discovery and data mining,
pages 168{177. ACM, 2004.</p>
      <p>Bing Liu. Sentiment analysis and opinion mining. Synthesis Lectures on Human Language
Technologies, 5(1):1{167, 2012.
[MCMVPOUL11] Eugenio Mart nez Camara, Mar a Teresa Mart n Valdivia, Jose Manuel Perea Ortega, and
Luis Alfonso Uren~a Lopez. Tecnicas de clasi cacion de opiniones aplicadas a un corpus en
espan~ol. Procesamiento del Lenguaje Natural, 47(0), 2011.
[MGMCMVPO13] M. Dolores Molina Gonzalez, Eugenio Mart nez Camara, Mar a Teresa Mart n Valdivia, and
Jose M Perea Ortega. Semantic orientation for polarity classi cation in spanish reviews.</p>
      <p>Expert Systems with Applications, 40(18):7250{7257, 2013.
[Pad12]
[PL08]
[WWH05]</p>
      <p>Llu s Padro. Analizadores multilingues en freeling. Linguamatica, 3(2):13{20, 2012.</p>
      <p>Bo Pang and Lillian Lee. Opinion mining and sentiment analysis. Foundations and trends in
information retrieval, 2(1-2):1{135, 2008.</p>
      <p>Theresa Wilson, Janyce Wiebe, and Paul Ho mann. Recognizing contextual polarity in
phrase-level sentiment analysis. In Proceedings of the conference on human language
technology and empirical methods in natural language processing, pages 347{354. Association for
Computational Linguistics, 2005.</p>
    </sec>
  </body>
  <back>
    <ref-list />
  </back>
</article>