=Paper=
{{Paper
|id=Vol-2251/paper5
|storemode=property
|title=
Análisis de emociones en textos en español
(Emotions analysis in spanish texts)
|pdfUrl=https://ceur-ws.org/Vol-2251/paper5.pdf
|volume=Vol-2251
|authors=Flor Miriam Plaza del Arco
}}
==
Análisis de emociones en textos en español
(Emotions analysis in spanish texts)
==
Análisis de emociones en textos en español Emotions analysis in Spanish texts Flor Miriam Plaza del Arco Departamento de Informática, Escuela Politécnica Superior de Jaén Universidad de Jaén, E-23071 - Jaén fmplaza@ujaen.es Resumen: La minerı́a de emociones es una tarea relativamente reciente que trata de identificar diferentes categorı́as emocionales en el texto. Sin embargo, debido a su complejidad y a la escasa disponibilidad de recursos léxicos anotados, todavı́a se encuentra en una primera etapa de investigación. Además, la mayorı́a de los trabajos y recursos existentes se han realizado para textos en inglés, pero la presencia en Internet de otras lenguas, como el español, es cada vez mayor. Por esta razón, se describe un proyecto de tesis que se va a centrar en el análisis de emociones en textos en español. Los sistemas de minerı́a de emociones son de gran relevancia ya que ofrecen una amplia gama de aplicaciones, desde la salud y el bienestar hasta la creación de perfiles de usuario, la educación y el marketing, entre otras. Palabras clave: Minerı́a de emociones, procesamiento del lenguaje natural, recursos léxicos afectivos, análisis de sentimientos Abstract: Emotion mining is a relatively recent task that attempts to identify different emotional categories in text. However, due to its complexity and the limited availability of annotated lexical resources, it is still in the early stages of research. In addition, most of the existing work and resources have been done for English texts, but the presence of other languages, such as Spanish, is growing in the Internet. Therefore, in this work, we describe a thesis project that will focus on the analysis of emotions in Spanish texts. Emotions mining systems are of great relevance as they offer a wide range of applications, from health and wellness to user profiling, education and marketing, among others. Keywords: Emotion mining, natural language processing, affect lexical resources, sentiment analysis 1 Justificación de la generado por los usuarios puede proporcionar investigación propuesta herramientas a los investigadores y a los ciu- dadanos en general para monitorear el pulso Las emociones son una pieza clave en el ser de la sociedad hacia temas de interés especı́fi- humano pues nos ayudan a relacionarnos y cos, una tarea que tradicionalmente solo se adaptarnos al mundo que nos rodea. Además, realizaba a través de encuestas de opinión, dirigen la mayor parte de nuestras conductas. que son costosas y lleva mucho tiempo y que, A lo largo de los años, han sido muchas las normalmente se limitan a tamaños de mues- áreas tales como la psicologı́a, la neurociencia tra pequeños. Dado el interés de analizar es- o la filosofı́a que se han dedicado al estudio y ta información subjetiva, surge un área den- el análisis de las emociones en el ser humano. tro del Procesamiento del Lenguaje Natural Recientemente, ha atraı́do la atención en el (PLN) dedicada a ello, el Análisis de Senti- campo de la Computación Afectiva (CA). mientos (AS). Uno de los medios más utilizado actual- La minerı́a de la emoción se enmarca den- mente por el ser humano para expresar las tro del AS y de la CA. Esta disciplina tra- emociones son las redes sociales. El acceso en ta de identifcar diferentes categorı́as emocio- tiempo real a la gran cantidad de contenido nales en un texto, tales como la tristeza, la Lloret, E.; Saquete, E.; Martı́nez-Barco, P.; Moreno, I. (eds.) Proceedings of the Doctoral Symposium of the XXXIV International Conference of the Spanish Society for Natural Language Processing (SEPLN 2018), p. 25–29 Sevilla, Spain, September 19th 2018. Copyright c 2018 by the paper’s authors. Copying permitted for private and academic purposes. alegrı́a, el enfado o el miedo. Tiene el poten- val) (Mohammad et al., 2018), Enfoques cial de humanizar las interacciones digitales y computacionales de subjetividad y Análisis ofrecer beneficios en una gama casi ilimitada de Sentimiento (WASSA)1 y talleres sobre de aplicaciones. Por ejemplo, en una situa- modelado computacional de las opiniones de ción de aprendizaje electrónico, un programa las personas, personalidad y emociones en las de CA podrı́a detectar cuándo un alumno se redes sociales (PEOPLE)2 . siente frustrado y ofrecer explicaciones am- Los estudios cientı́ficos sobre la clasifica- pliadas o información adicional. En la tele- ción de las emociones humanas datan de la medicina, la programación de CA puede ayu- década de 1960. Desde una perspectiva psi- dar a los médicos a comprender rápidamente cológica, una emoción es básica solo si no con- el estado de ánimo de un paciente o buscar tiene otra emoción; es decir, si representa una signos de depresión. En las redes sociales, se construcción psicológica irreducible atómica podrı́a identificar usuarios que están sufrien- (Celeghin et al., 2017). Además, los huma- do ciberbullying o incluso usuarios que pien- nos pueden reconocer las emociones en to- san en suicidarse. Otras aplicaciones comer- do el mundo, independientemente de su raza, ciales que se están explorando actualmente cultura e idioma. Muchos teóricos han pro- incluyen la gestión de relaciones con los clien- puesto conjuntos de emociones que tienden a tes, la gestión de recursos humanos, el mar- ser básicos. Si bien los psicólogos no están de keting y el entretenimiento. acuerdo sobre qué modelo describe con ma- La mayor parte de las investigaciones rea- yor precisión el conjunto de emociones bási- lizadas hasta el momento sobre el análisis de cas, el más utilizado en la investigación in- emociones se centran sobre un idioma en con- formática es el propuesto por Ekman (Ek- creto que generalmente es el inglés. No obs- man, 1992), con 6 emociones (enojo, disgus- tante, hay otros idiomas, como el español, cu- to, miedo, alegrı́a, tristeza y sorpresa) (Gho- ya presencia en Internet es cada dı́a mayor. lipour Shahraki, 2015). Además, si se desea desarrollar sistemas co- En los últimos años, las emociones han merciales, estos deben adaptarse al entorno atraı́do la atención de los investigadores en en el que serán utilizados. Por esta razón, esta las ciencias de la computación, especialmente investigación se va a centrar mayoritariamen- en el campo de la interacción con la compu- te en textos en español lo que supondrá un tadora humana, donde se han llevado a cabo gran progreso en ésta área. estudios sobre expresiones faciales (Ekman, Este proyecto de tesis se centra en el análi- 1977) o sobre el reconocimiento de emociones sis de las emociones en textos escritos en es- a través de una variedad de sensores (Picard, pañol. Analizar y comprender las emociones 1997). de los usuarios a través del texto que escriben A pesar de que la minerı́a de emociones proporciona múltiples beneficios en distintas es un área relativamente recientes y no proli- áreas. feran los artı́culos que combinan con PLN, El resto del artı́culo está organizado de la el interés es creciente y cada vez son más siguiente forma: en primer lugar, en la Sec- los trabajos relacionados con esta tarea. Uno ción 2 se mencionará el origen y trabajo rela- de los pilares fundamentales en la investiga- cionado con el proyecto de tesis. En la Sección ción relacionada con la minerı́a de la emo- 3 se describe la investigación propuesta. La ción se centra en los recursos lingüı́sticos dis- Sección 4 expone la metodologı́a y los expe- ponibles. Los recursos léxicos son indispen- rimentos que se van a desarrollar y por últi- sables y existen varios disponibles para el mo, se presentan los elementos de investifa- idioma inglés, como WordnetAffect (Strap- ción propuestos para discusión en la Sección parava y Valitutti, 2004), Emolex (Moham- 5. mad y Turney, 2013) NRC Affect Intensity Lexicon (Mohammad y Kiritchenko, 2018) y 2 Origen y trabajo relacionado LIWC (Pennebaker, Francis, y Booth, 2001). Sin embargo, con respecto a la disponibilidad La minerı́a de emociones es cada vez más im- de recursos en un idioma distinto al inglés, portante. Algunas de las conferencias prin- nos encontramos con que el número es bas- cipales que se ocupan de la minerı́a y eva- tante más reducido (Yadollahi, Shahraki, y luación de datos actualmente incluyen ta- lleres y comparten tareas relacionadas. Es- 1 https://wt-public.emm4u.eu/wassa2018/ 2 tos incluyen Evaluación Semántica (SemE- https://peopleswksh.github.io/index.html 26 Zaiane, 2017). Concretamente para español y comporar su funcionamiento en español. podemos citar el recurso Spanish Emotion Elegimos realizar el trabajo en español, ya Lexicon (SEL) de Dı́az Rangel, Sidorov, y que son escasos los recursos disponibles ac- Suárez Guerra (2014). tualmente en nuestra lengua, a pesar de ser Muchos de los estudios relacionados con la segunda lengua más hablada en el mundo el reconocimiento de emociones y la creación y la tercera lengua más usada en la Web. de recursos léxicos se centran en la evalua- Uno de nuestros primeros trabajos ha si- ción de la información de las redes sociales do el desarrollo de tres sistemas multilingües ya que son lugares apropiados para compar- con motivo de nuestra participación en tres tir las emociones de manera fácil y rápida. subtareas (EI-oc, EI-reg, E-c) de la Tarea 1 Las dos principales redes sociales en las que de SemEval: Affect in Tweets (Mohammad et se focalizan dichos estudios son Twitter y Fa- al., 2018), tanto en inglés como en español. cebook. Son tareas relacionadas con la identificación Con respecto a Twitter, encontramos al- de la intensidad de la emoción y con la clasifi- gunos trabajos como el de Purver y Battersby cación de emociones en tweets. Nuestra prin- (2012) que utilizan tanto los emoticones co- cipal contribución ha sido la implementación mo los hashtags para el reconocimiento de de un sistema para adaptar WordNet-Affect emociones. Mohammad y Kiritchenko (2015) al español (Plaza-del-Arco et al., 2018a) uti- usan hashtags para reconocer las categorı́as lizando diferentes recursos como BabelNet emocionales de los tweets. Bollen, Mao, y (Navigli y Ponzetto, 2012) o Babelfy (Moro, Zeng (2011) analizan las emociones de todos Raganato, y Navigli, 2014). Otro de los traba- los tweets en un marco de tiempo especı́fi- jos ha sido la adaptación del lexicon NRC Af- co utilizando una prueba psicométrica. En fect Intensity construyendo un nuevo lexicón cuanto a Facebook, hay pocos artı́culos cen- para el español que ha sido probado sobre trados en el reconocimiento de emociones ya el conjunto de datos liberado en la tarea 1 que hasta 2016 no se incorporó la nueva ca- de la competición SemEval 2018. Además, se racterı́stica que permite a los usuarios reac- ha comparado con el único lexicón de inten- cionar a una publicación o comentario. Al- sidades existente en español, el lexicón SEL, gunos trabajos relacionados con esta red so- y se ha demostrado la dificultad de la tarea cial se mencionan a continuación: Krebs et al. y la importancia de continuar trabajando en (2017) recopiló publicaciones y sus reacciones el desarrollo de recursos. (Plaza-del-Arco et de páginas de Facebook y construyó un con- al., 2018c). Por otra parte, se ha realizado junto de datos, para predecir la distribución un sistema de clasificación de emociones pa- de las reacciones en las publicaciones, com- ra la Tarea 4 de la competición TASS 2018 binaron las técnicas de análisis de sentimien- (Plaza-del-Arco et al., 2018b) . Nuestro sis- to y de emoción con las arquitecturas de red tema se basa en un método supervisado con neuronal. Pool y Nissim (2016) aprovechan SVM utilizando caracterı́sticas emocionales. la función de reacción de Facebook de forma Para ello, hacemos uso de distintos lexicones distante y supervisada para entrenar un clasi- emocionales y realizamos la adaptación de las ficador SVM para la detección de emociones, distintas emociones a la polaridad de las mis- usando varias combinaciones de caracterı́sti- mas (positiva o negativa). cas y combinando diferentes páginas de Fa- Por último, los sistemas se desarrollarán cebook. en un principio de manera general, pero en una segunda fase se adaptarán a un domi- 3 Descripción de la investigación nio especı́fico, puesto que consideramos que propuesta es posible extraer de redes sociales diversos Este proyecto de tesis se propone con la fi- corpus interesantes que expresen emociones. nalidad de desarrollar un sistema automático Podremos utilizar estos recursos para entre- de reconocimiento de emociones en español. nar nuestros sistemas ası́ como para validar En primer lugar, se están estudiando en el modelo propuesto. detalle los trabajos que tratan el reconoci- Los objetivos concretos que se pretenden miento de emociones en inglés y en español. alcazar con este proyecto son los siguientes: Este estudio es fundamental para obtener co- nocimiento de los enfoques más utilizados en Extraer información subjetiva de las di- inglés y reproducirlos con objeto de conocer ferentes plataformas (blogs, redes socia- 27 les, foros, etc) que dispongan de emocio- yecto de tesis son las siguientes: nes. Generar distintos recursos para recono- Estudios psicológicos muestran que las cimiento de emociones en español, tanto emociones del ser humano van ligadas a corpus como lexicones. su cultura e idioma. Por tanto, ¿es nece- sario crear recursos emocionales tenien- Procesar dicha información para desa- do en cuenta el idioma? o ¿una simple rrollar sistemas que sean capaces de traducción entre recursos es suficiente? identificar las diferentes categorı́as emo- cionales. ¿Qué caracterı́sticas se deben tener en cuenta en el proceso del análisis de emo- 4 Metodologı́a y experimentos ciones? ¿Cómo se pueden utilizar estas propuestos caracterı́sticas para mejorar los sistemas La metodologı́a que se propone para la con- de reconocimiento de emociones? secución de esta tesis se presenta a continua- ¿Qué algoritmos son los que nos propor- ción: cionan una mayor exactitud para recono- 1. Estudio y revisión del estado del arte. cer las diferentes categorı́as emocionales Se realizará un estudio de la bibliografı́a en un texto? existen sobre la minerı́a de emociones en Dado que los usuarios en las redes so- inglés y en español. ciales es donde más suelen expresar sus 2. Adaptación e integración de recursos emociones, ¿es útil esta información para existentes para poder realizar un análi- la creación de recursos léxicos? sis de los métodos propuestos. Se inten- tará adaptar ciertos recursos disponibles Agradecimientos en inglés al español, como, por ejemplo, WordNetAffect o Emolex. Este trabajo ha sido parcialmente subven- cionado por el Fondo Europeo de Desarro- 3. Desarrollo de un prototipo. Se tratará de llo Regional (FEDER) y el proyecto REDES implementar un sistema de detección de (TIN2015-65136-C2-1-R) del Gobierno de Es- emociones para el español. paña. Diseño de una arquitectura modu- lar que permita integrar nuevas fun- Bibliografı́a cionalidades a medida que se vaya Bollen, J., H. Mao, y X. Zeng. 2011. Twitter avanzando en la investigación. mood predicts the stock market. Journal Construcción de la arquitectura mo- of Computational Science, 2(1):1–8. dular diseñada. Celeghin, A., M. Diano, A. Bagnis, M. Vio- Prueba del correcto funcionamiento la, y M. Tamietto. 2017. Basic emotions del prototipo. in human neuroscience: neuroimaging and 4. Experimentación y evaluación. Se utili- beyond. Frontiers in Psychology, 8:1432. zarán los recursos generados para llevar Dı́az Rangel, I., G. Sidorov, y S. Suárez Gue- a cabo la experimentación y posterior- rra. 2014. Creación y evaluación de un mente se procederá a la evaluación del diccionario marcado con emociones y pon- prototipo, llevando a cabo una compara- derado para el español. Onomazein, 1(29). ción de los resultados obtenidos con los ya existentes. Los resultados obtenidos Ekman, P. 1977. Biological and cultural con- se pondrán a disposición de la comuni- tributions to body and facial movement. dad cientı́fica. 1977, páginas 34–84. 5 Elementos de investigación Ekman, P. 1992. An argument for basic emo- especı́ficos propuestos para tions. Cognition & emotion, 6(3-4):169– discusión 200. Las principales cuestiones de investigación a Gholipour Shahraki, A. 2015. Emotion mi- las que se pretende responder con este pro- ning from text. 28 Krebs, F., B. Lubascher, T. Moers, clasificador lineal de emociones (SINAI P. Schaap, y G. Spanakis. 2017. Social at TASS 2018: Lineal classification sys- emotion mining techniques for facebook tem with emotional external knowledge). posts reaction prediction. arXiv preprint En Proceedings of TASS 2018: Works- arXiv:1712.03249. hop on Semantic Analysis at SEPLN, TASS@SEPLN 2018, co-located with 34nd Mohammad, S. M., F. Bravo-Marquez, SEPLN Conference (SEPLN 2018), Sevi- M. Salameh, y S. Kiritchenko. 2018. lla, Spain, September 18th, 2018, páginas Semeval-2018 Task 1: Affect in tweets. 125–130. En Proceedings of International Workshop on Semantic Evaluation (SemEval-2018), Plaza-del-Arco, F. M., M. D. Molina- New Orleans, LA, USA. González, S. M. Jiménez-Zafra, y M. T. Mohammad, S. M. y S. Kiritchenko. 2015. Martı́n-Valdivia. 2018c. Lexicon adapta- Using hashtags to capture fine emotion ca- tion for spanish emotion mining. Procesa- tegories from tweets. Computational Inte- miento del Lenguaje Natural, 61:117–124. lligence, 31(2):301–326. Pool, C. y M. Nissim. 2016. Distant Mohammad, S. M. y S. Kiritchenko. 2018. supervision for emotion detection using Understanding emotions: A dataset of facebook reactions. arXiv preprint ar- tweets to study interactions between af- Xiv:1611.02988. fect categories. En Proceedings of the 11th Purver, M. y S. Battersby. 2012. Experi- Edition of the Language Resources and menting with distant supervision for emo- Evaluation Conference, Miyazaki, Japan. tion classification. En Proceedings of the Mohammad, S. M. y P. D. Turney. 2013. 13th Conference of the European Chapter Crowdsourcing a word–emotion associa- of the Association for Computational Lin- tion lexicon. Computational Intelligence, guistics, páginas 482–491. Association for 29(3):436–465. Computational Linguistics. Moro, A., A. Raganato, y R. Navigli. 2014. Strapparava, C. y A. Valitutti. 2004. Word- Entity linking meets word sense disambi- net affect: an affective extension of word- guation: a unified approach. Transactions net. En Language Resources and Evalua- of the Association for Computational Lin- tion Conference (LREC), volumen 4, pági- guistics, 2:231–244. nas 1083–1086. Navigli, R. y S. P. Ponzetto. 2012. Babel- Yadollahi, A., A. G. Shahraki, y O. R. Zaia- net: The automatic construction, evalua- ne. 2017. Current state of text senti- tion and application of a wide-coverage ment analysis from opinion to emotion mi- multilingual semantic network. Artificial ning. ACM Comput. Surv., 50(2):25:1– Intelligence, 193:217–250. 25:33, Mayo. Pennebaker, J. W., M. E. Francis, y R. J. Booth. 2001. Linguistic inquiry and word count: Liwc 2001. Mahway: Lawrence Erl- baum Associates, 71(2001):2001. Picard, R. W. 1997. Affective computing. 1997. Plaza-del-Arco, F. M., S. M. Jiménez-Zafra, M. Martin, y L. A. Ureña-Lopez. 2018a. Sinai at semeval-2018 task 1: Emotion re- cognition in tweets. En Proceedings of the 12th International Workshop on Semantic Evaluation, páginas 128–132. Plaza-del-Arco, F. M., E. Martı́nez-Cámara, M. T. M. Valdivia, y L. A. U. López. 2018b. SINAI en TASS 2018: Inserción de conocimiento emocional externo a un 29