=Paper= {{Paper |id=Vol-2251/paper5 |storemode=property |title= Análisis de emociones en textos en español (Emotions analysis in spanish texts) |pdfUrl=https://ceur-ws.org/Vol-2251/paper5.pdf |volume=Vol-2251 |authors=Flor Miriam Plaza del Arco }} == Análisis de emociones en textos en español (Emotions analysis in spanish texts) == https://ceur-ws.org/Vol-2251/paper5.pdf
           Análisis de emociones en textos en español
                          Emotions analysis in Spanish texts
                             Flor Miriam Plaza del Arco
             Departamento de Informática, Escuela Politécnica Superior de Jaén
                          Universidad de Jaén, E-23071 - Jaén
                                    fmplaza@ujaen.es

       Resumen: La minerı́a de emociones es una tarea relativamente reciente que trata
       de identificar diferentes categorı́as emocionales en el texto. Sin embargo, debido a
       su complejidad y a la escasa disponibilidad de recursos léxicos anotados, todavı́a se
       encuentra en una primera etapa de investigación. Además, la mayorı́a de los trabajos
       y recursos existentes se han realizado para textos en inglés, pero la presencia en
       Internet de otras lenguas, como el español, es cada vez mayor. Por esta razón, se
       describe un proyecto de tesis que se va a centrar en el análisis de emociones en
       textos en español. Los sistemas de minerı́a de emociones son de gran relevancia ya
       que ofrecen una amplia gama de aplicaciones, desde la salud y el bienestar hasta la
       creación de perfiles de usuario, la educación y el marketing, entre otras.
       Palabras clave: Minerı́a de emociones, procesamiento del lenguaje natural, recursos
       léxicos afectivos, análisis de sentimientos
       Abstract: Emotion mining is a relatively recent task that attempts to identify
       different emotional categories in text. However, due to its complexity and the limited
       availability of annotated lexical resources, it is still in the early stages of research. In
       addition, most of the existing work and resources have been done for English texts,
       but the presence of other languages, such as Spanish, is growing in the Internet.
       Therefore, in this work, we describe a thesis project that will focus on the analysis
       of emotions in Spanish texts. Emotions mining systems are of great relevance as
       they offer a wide range of applications, from health and wellness to user profiling,
       education and marketing, among others.
       Keywords: Emotion mining, natural language processing, affect lexical resources,
       sentiment analysis




1    Justificación de la                                      generado por los usuarios puede proporcionar
     investigación propuesta                                  herramientas a los investigadores y a los ciu-
                                                               dadanos en general para monitorear el pulso
Las emociones son una pieza clave en el ser                    de la sociedad hacia temas de interés especı́fi-
humano pues nos ayudan a relacionarnos y                       cos, una tarea que tradicionalmente solo se
adaptarnos al mundo que nos rodea. Además,                    realizaba a través de encuestas de opinión,
dirigen la mayor parte de nuestras conductas.                  que son costosas y lleva mucho tiempo y que,
    A lo largo de los años, han sido muchas las               normalmente se limitan a tamaños de mues-
áreas tales como la psicologı́a, la neurociencia              tra pequeños. Dado el interés de analizar es-
o la filosofı́a que se han dedicado al estudio y               ta información subjetiva, surge un área den-
el análisis de las emociones en el ser humano.                tro del Procesamiento del Lenguaje Natural
Recientemente, ha atraı́do la atención en el                  (PLN) dedicada a ello, el Análisis de Senti-
campo de la Computación Afectiva (CA).                        mientos (AS).
    Uno de los medios más utilizado actual-                      La minerı́a de la emoción se enmarca den-
mente por el ser humano para expresar las                      tro del AS y de la CA. Esta disciplina tra-
emociones son las redes sociales. El acceso en                 ta de identifcar diferentes categorı́as emocio-
tiempo real a la gran cantidad de contenido                    nales en un texto, tales como la tristeza, la
Lloret, E.; Saquete, E.; Martı́nez-Barco, P.; Moreno, I. (eds.) Proceedings of the Doctoral Symposium of the XXXIV
International Conference of the Spanish Society for Natural Language Processing (SEPLN 2018), p. 25–29 Sevilla, Spain,
September 19th 2018. Copyright c 2018 by the paper’s authors. Copying permitted for private and academic purposes.
alegrı́a, el enfado o el miedo. Tiene el poten-           val) (Mohammad et al., 2018), Enfoques
cial de humanizar las interacciones digitales y           computacionales de subjetividad y Análisis
ofrecer beneficios en una gama casi ilimitada             de Sentimiento (WASSA)1 y talleres sobre
de aplicaciones. Por ejemplo, en una situa-               modelado computacional de las opiniones de
ción de aprendizaje electrónico, un programa            las personas, personalidad y emociones en las
de CA podrı́a detectar cuándo un alumno se               redes sociales (PEOPLE)2 .
siente frustrado y ofrecer explicaciones am-                  Los estudios cientı́ficos sobre la clasifica-
pliadas o información adicional. En la tele-             ción de las emociones humanas datan de la
medicina, la programación de CA puede ayu-               década de 1960. Desde una perspectiva psi-
dar a los médicos a comprender rápidamente              cológica, una emoción es básica solo si no con-
el estado de ánimo de un paciente o buscar               tiene otra emoción; es decir, si representa una
signos de depresión. En las redes sociales, se           construcción psicológica irreducible atómica
podrı́a identificar usuarios que están sufrien-          (Celeghin et al., 2017). Además, los huma-
do ciberbullying o incluso usuarios que pien-             nos pueden reconocer las emociones en to-
san en suicidarse. Otras aplicaciones comer-              do el mundo, independientemente de su raza,
ciales que se están explorando actualmente               cultura e idioma. Muchos teóricos han pro-
incluyen la gestión de relaciones con los clien-         puesto conjuntos de emociones que tienden a
tes, la gestión de recursos humanos, el mar-             ser básicos. Si bien los psicólogos no están de
keting y el entretenimiento.                              acuerdo sobre qué modelo describe con ma-
    La mayor parte de las investigaciones rea-            yor precisión el conjunto de emociones bási-
lizadas hasta el momento sobre el análisis de            cas, el más utilizado en la investigación in-
emociones se centran sobre un idioma en con-              formática es el propuesto por Ekman (Ek-
creto que generalmente es el inglés. No obs-             man, 1992), con 6 emociones (enojo, disgus-
tante, hay otros idiomas, como el español, cu-           to, miedo, alegrı́a, tristeza y sorpresa) (Gho-
ya presencia en Internet es cada dı́a mayor.              lipour Shahraki, 2015).
Además, si se desea desarrollar sistemas co-                 En los últimos años, las emociones han
merciales, estos deben adaptarse al entorno               atraı́do la atención de los investigadores en
en el que serán utilizados. Por esta razón, esta        las ciencias de la computación, especialmente
investigación se va a centrar mayoritariamen-            en el campo de la interacción con la compu-
te en textos en español lo que supondrá un              tadora humana, donde se han llevado a cabo
gran progreso en ésta área.                             estudios sobre expresiones faciales (Ekman,
    Este proyecto de tesis se centra en el análi-        1977) o sobre el reconocimiento de emociones
sis de las emociones en textos escritos en es-            a través de una variedad de sensores (Picard,
pañol. Analizar y comprender las emociones               1997).
de los usuarios a través del texto que escriben              A pesar de que la minerı́a de emociones
proporciona múltiples beneficios en distintas            es un área relativamente recientes y no proli-
áreas.                                                   feran los artı́culos que combinan con PLN,
    El resto del artı́culo está organizado de la         el interés es creciente y cada vez son más
siguiente forma: en primer lugar, en la Sec-              los trabajos relacionados con esta tarea. Uno
ción 2 se mencionará el origen y trabajo rela-          de los pilares fundamentales en la investiga-
cionado con el proyecto de tesis. En la Sección          ción relacionada con la minerı́a de la emo-
3 se describe la investigación propuesta. La             ción se centra en los recursos lingüı́sticos dis-
Sección 4 expone la metodologı́a y los expe-             ponibles. Los recursos léxicos son indispen-
rimentos que se van a desarrollar y por últi-            sables y existen varios disponibles para el
mo, se presentan los elementos de investifa-              idioma inglés, como WordnetAffect (Strap-
ción propuestos para discusión en la Sección           parava y Valitutti, 2004), Emolex (Moham-
5.                                                        mad y Turney, 2013) NRC Affect Intensity
                                                          Lexicon (Mohammad y Kiritchenko, 2018) y
2   Origen y trabajo relacionado                          LIWC (Pennebaker, Francis, y Booth, 2001).
                                                          Sin embargo, con respecto a la disponibilidad
La minerı́a de emociones es cada vez más im-
                                                          de recursos en un idioma distinto al inglés,
portante. Algunas de las conferencias prin-
                                                          nos encontramos con que el número es bas-
cipales que se ocupan de la minerı́a y eva-
                                                          tante más reducido (Yadollahi, Shahraki, y
luación de datos actualmente incluyen ta-
lleres y comparten tareas relacionadas. Es-                 1
                                                                https://wt-public.emm4u.eu/wassa2018/
                                                            2
tos incluyen Evaluación Semántica (SemE-                      https://peopleswksh.github.io/index.html

                                                     26
Zaiane, 2017). Concretamente para español              y comporar su funcionamiento en español.
podemos citar el recurso Spanish Emotion                    Elegimos realizar el trabajo en español, ya
Lexicon (SEL) de Dı́az Rangel, Sidorov, y               que son escasos los recursos disponibles ac-
Suárez Guerra (2014).                                  tualmente en nuestra lengua, a pesar de ser
    Muchos de los estudios relacionados con             la segunda lengua más hablada en el mundo
el reconocimiento de emociones y la creación           y la tercera lengua más usada en la Web.
de recursos léxicos se centran en la evalua-               Uno de nuestros primeros trabajos ha si-
ción de la información de las redes sociales          do el desarrollo de tres sistemas multilingües
ya que son lugares apropiados para compar-              con motivo de nuestra participación en tres
tir las emociones de manera fácil y rápida.           subtareas (EI-oc, EI-reg, E-c) de la Tarea 1
Las dos principales redes sociales en las que           de SemEval: Affect in Tweets (Mohammad et
se focalizan dichos estudios son Twitter y Fa-          al., 2018), tanto en inglés como en español.
cebook.                                                 Son tareas relacionadas con la identificación
    Con respecto a Twitter, encontramos al-             de la intensidad de la emoción y con la clasifi-
gunos trabajos como el de Purver y Battersby            cación de emociones en tweets. Nuestra prin-
(2012) que utilizan tanto los emoticones co-            cipal contribución ha sido la implementación
mo los hashtags para el reconocimiento de               de un sistema para adaptar WordNet-Affect
emociones. Mohammad y Kiritchenko (2015)                al español (Plaza-del-Arco et al., 2018a) uti-
usan hashtags para reconocer las categorı́as            lizando diferentes recursos como BabelNet
emocionales de los tweets. Bollen, Mao, y               (Navigli y Ponzetto, 2012) o Babelfy (Moro,
Zeng (2011) analizan las emociones de todos             Raganato, y Navigli, 2014). Otro de los traba-
los tweets en un marco de tiempo especı́fi-             jos ha sido la adaptación del lexicon NRC Af-
co utilizando una prueba psicométrica. En              fect Intensity construyendo un nuevo lexicón
cuanto a Facebook, hay pocos artı́culos cen-            para el español que ha sido probado sobre
trados en el reconocimiento de emociones ya             el conjunto de datos liberado en la tarea 1
que hasta 2016 no se incorporó la nueva ca-            de la competición SemEval 2018. Además, se
racterı́stica que permite a los usuarios reac-          ha comparado con el único lexicón de inten-
cionar a una publicación o comentario. Al-             sidades existente en español, el lexicón SEL,
gunos trabajos relacionados con esta red so-            y se ha demostrado la dificultad de la tarea
cial se mencionan a continuación: Krebs et al.         y la importancia de continuar trabajando en
(2017) recopiló publicaciones y sus reacciones         el desarrollo de recursos. (Plaza-del-Arco et
de páginas de Facebook y construyó un con-            al., 2018c). Por otra parte, se ha realizado
junto de datos, para predecir la distribución          un sistema de clasificación de emociones pa-
de las reacciones en las publicaciones, com-            ra la Tarea 4 de la competición TASS 2018
binaron las técnicas de análisis de sentimien-        (Plaza-del-Arco et al., 2018b) . Nuestro sis-
to y de emoción con las arquitecturas de red           tema se basa en un método supervisado con
neuronal. Pool y Nissim (2016) aprovechan               SVM utilizando caracterı́sticas emocionales.
la función de reacción de Facebook de forma           Para ello, hacemos uso de distintos lexicones
distante y supervisada para entrenar un clasi-          emocionales y realizamos la adaptación de las
ficador SVM para la detección de emociones,            distintas emociones a la polaridad de las mis-
usando varias combinaciones de caracterı́sti-           mas (positiva o negativa).
cas y combinando diferentes páginas de Fa-                 Por último, los sistemas se desarrollarán
cebook.                                                 en un principio de manera general, pero en
                                                        una segunda fase se adaptarán a un domi-
3   Descripción de la investigación                   nio especı́fico, puesto que consideramos que
    propuesta                                           es posible extraer de redes sociales diversos
Este proyecto de tesis se propone con la fi-            corpus interesantes que expresen emociones.
nalidad de desarrollar un sistema automático           Podremos utilizar estos recursos para entre-
de reconocimiento de emociones en español.             nar nuestros sistemas ası́ como para validar
   En primer lugar, se están estudiando en             el modelo propuesto.
detalle los trabajos que tratan el reconoci-                Los objetivos concretos que se pretenden
miento de emociones en inglés y en español.           alcazar con este proyecto son los siguientes:
Este estudio es fundamental para obtener co-
nocimiento de los enfoques más utilizados en                Extraer información subjetiva de las di-
inglés y reproducirlos con objeto de conocer                ferentes plataformas (blogs, redes socia-
                                                   27
       les, foros, etc) que dispongan de emocio-           yecto de tesis son las siguientes:
       nes.
       Generar distintos recursos para recono-                 Estudios psicológicos muestran que las
       cimiento de emociones en español, tanto                emociones del ser humano van ligadas a
       corpus como lexicones.                                  su cultura e idioma. Por tanto, ¿es nece-
                                                               sario crear recursos emocionales tenien-
       Procesar dicha información para desa-                  do en cuenta el idioma? o ¿una simple
       rrollar sistemas que sean capaces de                    traducción entre recursos es suficiente?
       identificar las diferentes categorı́as emo-
       cionales.                                               ¿Qué caracterı́sticas se deben tener en
                                                               cuenta en el proceso del análisis de emo-
4     Metodologı́a y experimentos                              ciones? ¿Cómo se pueden utilizar estas
      propuestos                                               caracterı́sticas para mejorar los sistemas
La metodologı́a que se propone para la con-                    de reconocimiento de emociones?
secución de esta tesis se presenta a continua-
                                                               ¿Qué algoritmos son los que nos propor-
ción:
                                                               cionan una mayor exactitud para recono-
    1. Estudio y revisión del estado del arte.                cer las diferentes categorı́as emocionales
       Se realizará un estudio de la bibliografı́a            en un texto?
       existen sobre la minerı́a de emociones en
                                                               Dado que los usuarios en las redes so-
       inglés y en español.
                                                               ciales es donde más suelen expresar sus
    2. Adaptación e integración de recursos                  emociones, ¿es útil esta información para
       existentes para poder realizar un análi-               la creación de recursos léxicos?
       sis de los métodos propuestos. Se inten-
       tará adaptar ciertos recursos disponibles          Agradecimientos
       en inglés al español, como, por ejemplo,
       WordNetAffect o Emolex.                             Este trabajo ha sido parcialmente subven-
                                                           cionado por el Fondo Europeo de Desarro-
    3. Desarrollo de un prototipo. Se tratará de          llo Regional (FEDER) y el proyecto REDES
       implementar un sistema de detección de             (TIN2015-65136-C2-1-R) del Gobierno de Es-
       emociones para el español.                         paña.
            Diseño de una arquitectura modu-
            lar que permita integrar nuevas fun-           Bibliografı́a
            cionalidades a medida que se vaya              Bollen, J., H. Mao, y X. Zeng. 2011. Twitter
            avanzando en la investigación.                  mood predicts the stock market. Journal
            Construcción de la arquitectura mo-             of Computational Science, 2(1):1–8.
            dular diseñada.
                                                           Celeghin, A., M. Diano, A. Bagnis, M. Vio-
            Prueba del correcto funcionamiento               la, y M. Tamietto. 2017. Basic emotions
            del prototipo.                                   in human neuroscience: neuroimaging and
    4. Experimentación y evaluación. Se utili-             beyond. Frontiers in Psychology, 8:1432.
       zarán los recursos generados para llevar           Dı́az Rangel, I., G. Sidorov, y S. Suárez Gue-
       a cabo la experimentación y posterior-                 rra. 2014. Creación y evaluación de un
       mente se procederá a la evaluación del                diccionario marcado con emociones y pon-
       prototipo, llevando a cabo una compara-                 derado para el español. Onomazein, 1(29).
       ción de los resultados obtenidos con los
       ya existentes. Los resultados obtenidos             Ekman, P. 1977. Biological and cultural con-
       se pondrán a disposición de la comuni-              tributions to body and facial movement.
       dad cientı́fica.                                      1977, páginas 34–84.

5     Elementos de investigación                          Ekman, P. 1992. An argument for basic emo-
      especı́ficos propuestos para                           tions. Cognition & emotion, 6(3-4):169–
      discusión                                             200.
Las principales cuestiones de investigación a             Gholipour Shahraki, A. 2015. Emotion mi-
las que se pretende responder con este pro-                  ning from text.
                                                      28
Krebs, F., B. Lubascher, T. Moers,                      clasificador lineal de emociones (SINAI
  P. Schaap, y G. Spanakis. 2017. Social                at TASS 2018: Lineal classification sys-
  emotion mining techniques for facebook                tem with emotional external knowledge).
  posts reaction prediction. arXiv preprint             En Proceedings of TASS 2018: Works-
  arXiv:1712.03249.                                     hop on Semantic Analysis at SEPLN,
                                                        TASS@SEPLN 2018, co-located with 34nd
Mohammad, S. M., F. Bravo-Marquez,
                                                        SEPLN Conference (SEPLN 2018), Sevi-
  M. Salameh, y S. Kiritchenko. 2018.
                                                        lla, Spain, September 18th, 2018, páginas
  Semeval-2018 Task 1: Affect in tweets.
                                                        125–130.
  En Proceedings of International Workshop
  on Semantic Evaluation (SemEval-2018),             Plaza-del-Arco, F. M., M. D. Molina-
  New Orleans, LA, USA.                                 González, S. M. Jiménez-Zafra, y M. T.
Mohammad, S. M. y S. Kiritchenko. 2015.                 Martı́n-Valdivia. 2018c. Lexicon adapta-
  Using hashtags to capture fine emotion ca-            tion for spanish emotion mining. Procesa-
  tegories from tweets. Computational Inte-             miento del Lenguaje Natural, 61:117–124.
  lligence, 31(2):301–326.                           Pool, C. y M. Nissim.     2016.   Distant
Mohammad, S. M. y S. Kiritchenko. 2018.                supervision for emotion detection using
  Understanding emotions: A dataset of                 facebook reactions. arXiv preprint ar-
  tweets to study interactions between af-             Xiv:1611.02988.
  fect categories. En Proceedings of the 11th        Purver, M. y S. Battersby. 2012. Experi-
  Edition of the Language Resources and                menting with distant supervision for emo-
  Evaluation Conference, Miyazaki, Japan.              tion classification. En Proceedings of the
Mohammad, S. M. y P. D. Turney. 2013.                  13th Conference of the European Chapter
  Crowdsourcing a word–emotion associa-                of the Association for Computational Lin-
  tion lexicon. Computational Intelligence,            guistics, páginas 482–491. Association for
  29(3):436–465.                                       Computational Linguistics.

Moro, A., A. Raganato, y R. Navigli. 2014.           Strapparava, C. y A. Valitutti. 2004. Word-
  Entity linking meets word sense disambi-              net affect: an affective extension of word-
  guation: a unified approach. Transactions             net. En Language Resources and Evalua-
  of the Association for Computational Lin-             tion Conference (LREC), volumen 4, pági-
  guistics, 2:231–244.                                  nas 1083–1086.

Navigli, R. y S. P. Ponzetto. 2012. Babel-           Yadollahi, A., A. G. Shahraki, y O. R. Zaia-
  net: The automatic construction, evalua-             ne. 2017. Current state of text senti-
  tion and application of a wide-coverage              ment analysis from opinion to emotion mi-
  multilingual semantic network. Artificial            ning. ACM Comput. Surv., 50(2):25:1–
  Intelligence, 193:217–250.                           25:33, Mayo.
Pennebaker, J. W., M. E. Francis, y R. J.
  Booth. 2001. Linguistic inquiry and word
  count: Liwc 2001. Mahway: Lawrence Erl-
  baum Associates, 71(2001):2001.
Picard, R. W. 1997. Affective computing.
   1997.
Plaza-del-Arco, F. M., S. M. Jiménez-Zafra,
   M. Martin, y L. A. Ureña-Lopez. 2018a.
   Sinai at semeval-2018 task 1: Emotion re-
   cognition in tweets. En Proceedings of the
   12th International Workshop on Semantic
   Evaluation, páginas 128–132.
Plaza-del-Arco, F. M., E. Martı́nez-Cámara,
   M. T. M. Valdivia, y L. A. U. López.
   2018b. SINAI en TASS 2018: Inserción
   de conocimiento emocional externo a un
                                                29