=Paper= {{Paper |id=Vol-1199/paper3 |storemode=property |title=Desafíos del Análisis de Sentimientos |pdfUrl=https://ceur-ws.org/Vol-1199/paper3.pdf |volume=Vol-1199 |dblpUrl=https://dblp.org/rec/conf/timm/ZafraCVL14 }} ==Desafíos del Análisis de Sentimientos== https://ceur-ws.org/Vol-1199/paper3.pdf
                                              Actas V Jornadas TIMM, pp 15-18




                      Desafı́os del Análisis de Sentimientos

                     Salud Ma Jiménez Zafra                          Eugenio Martı́nez Cámara
                   Departamento de Informática                      Departamento de Informática
                       Universidad de Jaén                              Universidad de Jaén
                         sjzafra@ujaen.es                                emcamara@ujaen.es
                    M. Teresa Martı́n Valdivia                         L. Alfonso Ureña López
                   Departamento de Informática                      Departamento de Informática
                       Universidad de Jaén                              Universidad de Jaén
                         maite@ujaen.es                                   laurena@ujaen.es




                                                         Resumen

                        En este trabajo se presenta una primera aproximación a dos de los
                        frentes abiertos en el análisis de opiniones en los que nos encontramos
                        trabajando actualmente: el tratamiento de la negación en español y el
                        análisis a nivel de aspecto en inglés. Para abordar el fenómeno de la
                        negación se han definido una serie de reglas que permiten determinar
                        el ámbito de una partı́cula negativa en una frase a partir de su árbol de
                        dependencias. Por otro lado, para llevar a cabo un análisis de opiniones
                        a nivel de aspecto, se ha utilizado la base de datos colaborativa Freeba-
                        se, para extraer los aspectos relacionados con la entidad de estudio, y el
                        analizador de dependencias de Stanford, para determinar las palabras
                        que modifican a cada aspecto y ası́ poder calcular su polaridad.




1    Introducción
La minerı́a de opiniones (MO), también conocida como análisis de sentimientos (AS), es una disciplina que se
centra en detectar la información subjetiva de un texto y clasificarla. Existen muchos trabajos centrados en la
MO, pero la mayor parte de las investigaciones se han realizado sobre opiniones escritas en inglés. Sin embargo,
cada vez es mayor la presencia de otros idiomas en Internet, entre los que se encuentra el español, lo que pone de
manifiesto la necesidad de su tratamiento. El grupo SINAI de la Universidad de Jaén lleva unos años trabajando
en el análisis de opiniones en español [MVMCPOUL13], [MCMVPOUL11], [MGMCMVPO13] y actualmente
continúa con esta temática, debido a su gran importancia.
   Por otra parte, en las revisiones del estado del arte del AS de Bin Liu [Liu12] y de Pang y Lee [PL08] se
muestran como desafı́os el tratamiento de la negación, de la ironı́a y del sarcasmo, la adaptación al dominio, el
análisis a nivel de aspecto, la detección de opiniones spam, etc. En este momento nos encontramos trabajando
en dos de los frentes abiertos en el análisis de opiniones, como son el tratamiento de la negación y el análisis a
nivel de aspecto o caracterı́stica.

Copyright c by the paper’s authors. Copying permitted only for private and academic purposes.
In: L. Alfonso Ureña López, Jose Antonio Troyano Jiménez, Francisco Javier Ortega Rodrı́guez, Eugenio Martı́nez Cámara (eds.):
Actas de las V Jornadas TIMM, Cazalla de la Sierra, España, 12-JUN-2014, publicadas en http://ceur-ws.org




                                                             15
             Salud M. Jiménez Zafra, Eugenio Martínez Cámara, M. Teresa Martín Valdivia y L. Alfonso Ureña López


2     Tratamiento de la negación en español
La negación es un elemento fundamental en el análisis de opiniones, que requiere un tratamiento especial, ya que
una opinión negativa puede ser expresada con términos positivos negados o, por el contrario, una opinión positiva
puede expresarse a partir de la negación de términos negativos. Las oraciones “La pelı́cula no me gustó” y “El
personaje principal no era una mala persona” son claros ejemplos de los dos casos mencionados anteriormente.
   Debido a la importancia de este fenómeno decidimos realizar una primera aproximación al estudio de la
negación en opiniones escritas en español. Este trabajo todavı́a no está publicado, ya que estamos refinando
algunos aspectos, pero esperamos ponerlo a disposición de la comunidad investigadora en un breve perı́odo de
tiempo.
   En el trabajo mencionado se propone un sistema no supervisado para la clasificación de opiniones teniendo
en cuenta la influencia de la negación. La negación es una caracterı́stica particular de cada idioma que debe
ajustarse a las singularidades de la lengua en estudio. En nuestro caso se han estudiado las partı́culas negativas
más importantes según la RAE [Esp09]: “no”, “tampoco”, “nadie”, “jamás”, “ni”, “sin”, “nada”, “nunca” y
“ninguno”. Para resolver este fenómeno es necesario, en primer lugar, identificar el ámbito de la negación y,
posteriormente, modificar la polaridad del fragmento de la oración que se ve afectado por ella.
   Para determinar el ámbito de la negación se han definido una serie de reglas que permiten generalizar el
tratamiento de las distintas partı́culas negativas. Para construir estas reglas se ha llevado a cabo un estudio de
los árboles de dependencias de diferentes oraciones en las que está presente alguna de las partı́culas abordadas.
Para ello, se ha utilizado el analizador de dependencias de Freeling [Pad12], que permite generar el árbol de
dependencias de una oración en base a su estructura sintáctica. En la Tabla 1 se muestran las reglas obtenidas
tras realizar el estudio.
                    Partı́cula                         Regla
                    no, tampoco, nadie, jamás, nin- Afecta al nodo padre y al árbol formado
                   guno                                por el hermano de la derecha (incluido).
                   ni, sin                             Afecta a todos los hijos y a todos los árbo-
                                                       les formados por ellos hasta llegar a nodos
                                                       hoja.
                   nada, nunca                         Afecta al nodo padre.

                                          Tabla 1: Reglas ámbito de la negación.

   Estas reglas permiten marcar las palabras de la oración afectadas por alguna de las partı́culas de estudio,
de manera que se tenga en cuenta esta información a la hora de calcular la polaridad de la opinión. Nuestra
propuesta consiste en invertir la polaridad de las palabras marcadas, es decir, de las palabras pertenecientes al
ámbito de la negación. Por ejemplo, en la oración “El personaje principal no era una mala persona”, la partı́cula
negativa “no”, según las reglas definidas, afecta a las palabras “era”, “mala” y “persona” (Figura 1), las cuales
llevarán la marca de la negación, pero sólo “mala” expresa opinión (-1, negativa) por lo que su polaridad se
verá invertida (-1 * -1) = (1, positiva).
   Para demostrar que la capacidad de predicción de la polaridad de un sistema de clasificación de opiniones
mejora al incluir un módulo que se encargue del tratamiento de la negación, en este trabajo, se han realizado
experimentaciones sobre un corpus en español formado por 3.878 crı́ticas de cine [CTEO08] recogidas de la web
MuchoCine1 , utilizando diferentes recursos lingüı́sticos para el cálculo de la polaridad. Las experimentaciones se
han llevado a cabo tanto sin el módulo de identificación de la negación como con él, llegando a la conclusión de
que se produce una mejora en la clasificación.
   No obstante, este trabajo ha sido una primera aproximación al desafı́o del tratamiento de la negación, en el
cual seguimos trabajando para abordar el resto de partı́culas negativas utilizadas en español.

3     Análisis a nivel de aspecto en inglés
En el AS se distinguen tres niveles de estudio de un texto: nivel de documento, de frase o de aspecto. El análisis
a nivel de documento determina el sentimiento general expresado en una opinión, mientras que el análisis a nivel
de frase especifica, para cada una de las oraciones de un texto, si expresan una opinión positiva, negativa o
neutra [Liu12]. Sin embargo, estos dos tipos de análisis no llegan al nivel de detalle que desea un usuario cuando
    1 http://www.muchocine.net




                                                             16
                                       Desafíos del Análisis de Sentimientos




Figura 1: Árbol de dependencias en el que se analiza la partı́cula “no” en la oración “El personaje principal no
era una mala persona”.
busca información sobre algún producto, ya que el hecho de que la opinión general de un producto sea positiva
no significa que el autor tenga una opinión positiva de todos los aspectos de dicho producto, ni el hecho de que
sea negativa implica que todo lo relacionado con el producto sea malo.
   La gran cantidad de fuentes y el elevado volumen de textos con opiniones hacen que resulte complicado para
el usuario seleccionar información de su interés. Por ello, es necesario desarrollar sistemas de clasificación de
opiniones a nivel de aspecto, que ayuden a los usuarios a tomar decisiones y que, por otro lado, muestren a las
empresas la opinión que los consumidores tienen acerca de sus productos, para ayudarles a decidir qué deben
mantener, qué deben eliminar o qué deben mejorar.
   Actualmente nos encontramos trabajando en este tema sobre opiniones escritas en inglés. Nuestra primera
aproximación se ha realizado para la participación en la tarea 4 (Aspect Based Sentiment Analysis) del congreso
SemEval 2014. Esta tarea se centra en la extracción de los aspectos relacionados con una entidad (ej. ordenadores,
restaurantes) y en el cálculo de la polaridad expresada sobre dichos aspectos en la opinión.
   Nuestra propuesta para identificar los aspectos relacionados con el dominio en cuestión (ordenadores, restau-
rantes) se basa en la utilización de una bolsa de palabras, construida a partir de los datos de entrenamiento
proporcionados y de los datos extraı́dos de forma automática de la base de conocimiento colaborativa Freebase2 .
Una vez extraı́dos los aspectos relacionados con la entidad de estudio, el siguiente paso es determinar qué pala-
bras modifican a cada aspecto. Para ello se ha realizado un análisis de dependencias utilizando el analizador de
Stanford [DMM08], considerando las principales formas de expresar opinión acerca de un aspecto: utilizando un
verbo (“nsubj” o “nsubjpass”), empleando un adjetivo (“amod”) o por medio de una relación de dependencia
con otra palabra (“dep”). Tras identificar los modificadores de los aspectos se ha calculado su polaridad mediante
un sistema de voto formado por tres clasificadores basados en listas de palabras: Bin Liu [HL04], SentiWordnet
[BES10] y MPQA [WWH05].
   Tras esta primera aproximación seguimos trabajando en el análisis a nivel de aspecto en inglés, considerando
otros posibles modificadores. En un futuro cercano trataremos de extrapolarlo a textos en español.

Agradecimientos
Este trabajo ha sido parcialmente financiado por una subvención del Fondo Europeo de Desarrollo Regional
(FEDER), por el proyecto ATTOS (TIN2012-38536-C03-0) del Gobierno de España, por el proyecto AORESCU
(P11-TIC-7684 MO) del Gobierno Regional de la Junta de Andalucı́a y por el proyecto CEATIC-2013-01 de la
Universidad de Jaén.

Referencias
[BES10]             Stefano Baccianella, Andrea Esuli, and Fabrizio Sebastiani. Sentiwordnet 3.0: An enhanced
                    lexical resource for sentiment analysis and opinion mining. In LREC, volume 10, pages
                    2200–2204, 2010.
  2 http://www.freebase.com/




                                                        17
           Salud M. Jiménez Zafra, Eugenio Martínez Cámara, M. Teresa Martín Valdivia y L. Alfonso Ureña López


[CTEO08]            Fermın L Cruz, Jose A Troyano, Fernando Enriquez, and Javier Ortega. Clasificacin de
                    documentos basada en la opinin: experimentos con un corpus de crticas de cine en espaol.
                    Procesamiento del Lenguaje Natural, 41(0), 2008.

[DMM08]             Marie-Catherine De Marneffe and Christopher D Manning. Stanford typed dependencies
                    manual. URL http://nlp. stanford. edu/software/dependencies manual. pdf, 2008.
[Esp09]             Real Academia Española. Nueva gramática de la lengua española, volume 1. Espasa Calpe
                    Madrid,, Spain, 2009.

[HL04]              Minqing Hu and Bing Liu. Mining and summarizing customer reviews. In Proceedings of
                    the tenth ACM SIGKDD international conference on Knowledge discovery and data mining,
                    pages 168–177. ACM, 2004.
[Liu12]             Bing Liu. Sentiment analysis and opinion mining. Synthesis Lectures on Human Language
                    Technologies, 5(1):1–167, 2012.

[MCMVPOUL11] Eugenio Martı́nez Cámara, Marı́a Teresa Martı́n Valdivia, José Manuel Perea Ortega, and
             Luis Alfonso Ureña López. Técnicas de clasificación de opiniones aplicadas a un corpus en
             español. Procesamiento del Lenguaje Natural, 47(0), 2011.
[MGMCMVPO13] M. Dolores Molina González, Eugenio Martı́nez Cámara, Marı́a Teresa Martı́n Valdivia, and
             José M Perea Ortega. Semantic orientation for polarity classification in spanish reviews.
             Expert Systems with Applications, 40(18):7250–7257, 2013.
[MVMCPOUL13] Marı́a Teresa Martı́n Valdivia, Eugenio Martı́nez Cámara, Jose M. Perea Ortega, and L. Al-
             fonso Ureña López. Sentiment polarity detection in spanish reviews combining supervised
             and unsupervised approaches. Expert Systems with Applications, 40(10):3934–3942, 2013.
[Pad12]             Lluı́s Padró. Analizadores multilingües en freeling. Linguamática, 3(2):13–20, 2012.
[PL08]              Bo Pang and Lillian Lee. Opinion mining and sentiment analysis. Foundations and trends in
                    information retrieval, 2(1-2):1–135, 2008.
[WWH05]             Theresa Wilson, Janyce Wiebe, and Paul Hoffmann. Recognizing contextual polarity in
                    phrase-level sentiment analysis. In Proceedings of the conference on human language tech-
                    nology and empirical methods in natural language processing, pages 347–354. Association for
                    Computational Linguistics, 2005.




                                                           18