<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta>
      <issn pub-type="ppub">1613-0073</issn>
    </journal-meta>
    <article-meta>
      <title-group>
        <article-title>RETUYT en TASS 2017: Analisis de Sentimiento de Tweets en Espan~ol utilizando SVM y CNN</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Aiala Rosa</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Santiago Castro</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Luis Chiruzzo Mathias Etcheverry Facultad de Ingenier a, Universidad de la Republica Montevideo</institution>
          ,
          <country country="UY">Uruguay</country>
        </aff>
      </contrib-group>
      <pub-date>
        <year>2017</year>
      </pub-date>
      <fpage>77</fpage>
      <lpage>83</lpage>
      <abstract>
        <p>This article presents classi ers based on SVM and Convolutional Neural Networks (CNN) for the TASS 2017 challenge on tweets sentiment analysis. The classi er with the best performance in general uses a combination of SVM and CNN. The use of word embeddings was particularly useful for improving the classi ers performance.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>Dentro del area analisis de sentimiento, el
analisis de tweets resulta especialmente
interesante debido al gran volumen de
informacion que se genera diariamente, la naturaleza
subjetiva de la mayor a de los mensajes, y
el facil acceso a este material para su
analisis y procesamiento. La existencia de tareas
espec cas vinculadas a este problema
desde hace ya varios an~os evidencia el interes de
la comunidad del Procesamiento de Lenguaje
Natural en trabajar en este tema.</p>
      <p>Desde el an~o 2012 se viene realizando el
Taller de Analisis de Semantico de la SEPLN
(TASS)1, que esta centrado en la clasi cacion
de tweets. Tambien en el marco de la
SemEval2, desde el an~o 2013 se incluye una tarea
sobre analisis de sentimiento en tweets,
abordando el problema para el idioma ingles, y
a partir de este an~o tambien para el arabe.</p>
      <p>
        Los resultados reportados en las ultimas
ediciones de estas tareas
        <xref ref-type="bibr" rid="ref11 ref12 ref7">(Garc a-Cumbreras et
al., 2016; Rosenthal, Farra, y Nakov, 2017)</xref>
        no
alcanzan aun niveles satisfactorios,
principalmente para el espan~ol, por lo que el problema
sigue resultando desa ante y se hace
necesa1http://www.sepln.org/workshops/tass
2https://aclweb.org/aclwiki/SemEval_Portal
      </p>
      <p>
        Los trabajos que obtuvieron los mejores
resultados en la clasi cacion de tweets en
espan~ol en la edicion 2016 del TASS se
basaron en la de nicion de atributos para
entrenar varios clasi cadores y luego
combinarlos. En (Ceron-Guzman, 2016) se describe
la construccion de un conjunto de clasi
cadores de tipo Regresion Log stica que
combinan diferentes atributos, entre los cuales
se incluyen pertenencia a un lexico
subjetivo, procesamiento de la negacion,
informacion morfo-sintactica y atributos basados en
n-gramas. En
        <xref ref-type="bibr" rid="ref1 ref7">(Hurtado y Pla, 2016)</xref>
        se
entrena un conjunto de clasi cadores de tipo SVM
utilizando atributos morfo-sintacticos y
atributos basados en n-gramas. Otros trabajos
presentados incluyen el uso de word
embeddings
        <xref ref-type="bibr" rid="ref1 ref1 ref11 ref7 ref7">(Montejo-Raez y D az-Galiano, 2016;
Quiros, Segura-Bedmar, y Mart nez, 2016)</xref>
        ,
alcanzando resultados un poco mas bajos.
      </p>
      <p>Por otro lado, la mayor a de los enfoques
presentados en la tarea 4 de la SemEval 2017,
aplicados para el idioma ingles, se basan en
redes neuronales profundas.</p>
      <p>
        En este art culo se describen los
sistemas presentados al TASS 2017
        <xref ref-type="bibr" rid="ref5">(Mart
nezCamara et al., 2017)</xref>
        por el grupo RETUYT.
      </p>
      <p>Copyright © 2017 by the paper's authors. Copying permitted for private and academic purposes.
Se abordo la problematica principalmente
mediante el uso de word embeddings,
considerando dos enfoques independientes. Por
un lado, se utilizo Support Vector Machines
(SVM) sobre un conjunto de atributos de
nidos manualmente, incluyendo informacion
proveniente de los embeddings y de un lexico
subjetivo. Por otro lado, se utilizo
Convolutional Neural Networks (CNN) consumiendo
como entrada los embeddings del tweet.
Finalmente se utilizo un enfoque h brido basado en
la combinacion de los dos metodos anteriores,
fundado en sus cualidades probabil sticas.</p>
      <p>Los resultados muestran que los dos
enfoques, SVM y CNN, dieron resultados
interesantes en los diferentes corpus de evaluacion,
y que la combinacion de los metodos aporto
mejoras en casi todos los casos.
2</p>
    </sec>
    <sec id="sec-2">
      <title>Preprocesamiento</title>
      <p>La organizacion del TASS genero dos corpus
de tweets anotados con su polaridad (P, N,
NEU o NONE) para utilizar durante el
entrenamiento: InterTASS y General TASS, de 1008
y 7219 tweets respectivamente. Mas
adelante se proveyo un nuevo corpus de desarrollo
con caracter sticas similares a InterTASS de
506 tweets. En nuestro trabajo decidimos
utilizar ambos corpus combinados, y realizamos
nuestra propia particion de los corpus en
entrenamiento y desarrollo (validacion),
intentando mantener las mismas proporciones de
tweets de cada categor a. Se separo el corpus
General TASS en dos particiones: 85 %
para entrenamiento y 15 % para desarrollo, y se
unieron esos datos con las particiones de
InterTass. El taman~o total de los corpus y las
cantidades por categor a pueden verse en la
tabla 1.</p>
      <p>P
N
NEU
NONE</p>
      <sec id="sec-2-1">
        <title>Total</title>
      </sec>
      <sec id="sec-2-2">
        <title>Entrenamiento</title>
        <p>2782 (39 %)
2295 (32 %)
721 (10 %)
1346 (19 %)
7144</p>
        <p>Desarrollo
576 (36 %)
524 (33 %)
151 (10 %)
338 (21 %)
1589
Tabla 1: Taman~o de los corpus utilizados</p>
        <p>Cada corpus fue preprocesado de la
siguiente manera:</p>
        <p>Se eliminan caracteres de espacio
redundantes, referencias a URLs y elipsis.</p>
        <p>Todas las referencias a usuarios de
Twitter se sustituyen por el token \@user".
Se buscan repeticiones de un mismo
caracter que aparezcan tres o mas
veces seguidas y se las sustituye por una
sola instancia del caracter. Por ejemplo,
sustituir \holaaaa" por \hola".</p>
        <p>Se sustituyen todas las interjecciones que
denotan risa (por ejemplo \jajajaja",
\jejeje", \jajaj") por el token \jaja".</p>
      </sec>
      <sec id="sec-2-3">
        <title>Se pasa todo el texto a minusculas.</title>
        <p>No se considero informacion gramatical,
como lema, categor a lexica, informacion
morfologica o informacion sintactica.
3
3.1</p>
      </sec>
    </sec>
    <sec id="sec-3">
      <title>Recursos utilizados</title>
      <sec id="sec-3-1">
        <title>Lexicos de palabras positivas y negativas</title>
        <p>
          Se tomaron como punto de partida tres
lexicos subjetivos disponibles para el espan~ol
          <xref ref-type="bibr" rid="ref13">(Cruz et al., 2014; Saralegi y San Vicente,
2013; Brooke, To loski, y Taboada, 2009)</xref>
          , a
partir de los cuales de genero un nuevo lexico,
constituido por los elementos de la
interseccion de los tres lexicos originales, con un total
de 312 lemas negativos y 301 lemas positivos.
Este lexico fue expandido con las formas
exivas de cada lema, alcanzando un total de 4730
palabras. Esto permite paliar la decision de
no lematizar los tweets para su
procesamiento. Para la expansion del lexico se utilizo el
diccionario de FreeLing
          <xref ref-type="bibr" rid="ref8">(Padro y Stanilovsky,
2012)</xref>
          .
3.2
        </p>
      </sec>
      <sec id="sec-3-2">
        <title>Colecciones de word</title>
        <p>
          embeddings
Se utilizaron los word embeddings
entrenados por
          <xref ref-type="bibr" rid="ref1 ref7">(Azzinnari y Mart nez, 2016)</xref>
          . Fueron
obtenidos mediante la tecnica word2vec
          <xref ref-type="bibr" rid="ref6">(Mikolov et al., 2013)</xref>
          y tienen dimension 300.
Estan basados en un conjunto de datos de
casi seis mil millones de palabras. Su
procedencia es en mayor a texto de prensa extra do
de Internet.
        </p>
        <p>
          Tambien se utilizaron word embeddings
entrenados a partir de la Wikipedia
utilizando la tecnica GloVe
          <xref ref-type="bibr" rid="ref10 ref2 ref3">(Pennington, Socher, y
Manning, 2014)</xref>
          , presentadas en
          <xref ref-type="bibr" rid="ref1 ref7">(Etcheverry
y Wonsever, 2016)</xref>
          . Esta coleccion de
vectores tuvo menor desempen~o en nuestros
experimentos, lo cual probablemente se deba a
una menor cobertura lexica.
Finalmente se experimento con el uso
de fastText (Bojanowski et al., 2016)
entrenandolo con la Wikipedia en espan~ol junto
con 400,000 tweets en espan~ol provenientes de
la API de Streaming de Twitter sample para
construir los embeddings. Estos vectores
fueron posteriormente descartados ya que no se
obtuvo una mejora en los resultados para las
pruebas realizadas.
3.3
        </p>
      </sec>
      <sec id="sec-3-3">
        <title>Predictor de polaridad por palabra</title>
        <p>Se construyo un algoritmo de regresion
basado en SVM utilizando los lexicos de palabras
positivas y negativas como conjunto de
entrenamiento. El objetivo es que este modelo
sea capaz de obtener un valor real que
represente la polaridad para cualquier palabra del
lenguaje. El modelo toma como entrada los
300 valores reales del vector que representa
la palabra y devuelve un valor real. Para el
entrenamiento se considero que las palabras
positivas deb an tener un valor positivo (1),
y las negativas un valor negativo (-1).
3.4</p>
      </sec>
      <sec id="sec-3-4">
        <title>Marcadores de categor a</title>
        <p>Se obtuvo una lista de todas las palabras del
corpus de entrenamiento y para cada palabra
se calculo la distribucion de las categor as de
todos los tweets en que aparece.
Consideramos que una palabra es un marcador de
categor a si la proporcion de veces que dicha
palabra aparece en la categor a es mayor o
igual a 75 %. Utilizando esta informacion, se
confeccionaron listas de marcadores para las
cuatro categor as: 429 positivas, 438
negativas, 12 neutras, y 33 marcadores de no
opinion.</p>
      </sec>
    </sec>
    <sec id="sec-4">
      <title>Clasi cadores 4</title>
      <p>4.1</p>
      <sec id="sec-4-1">
        <title>Enfoque basado en SVM</title>
        <p>
          Para la tarea 1, que consiste en evaluar la
polaridad de un tweet, se construyo un
clasi cador SVM (Support Vector Machine)
entrenado con los siguientes atributos:
Centroide de los embeddings de las
palabras del tweet. Trabajos anteriores han
mostrado que el uso del centroide, o
promedio de los embeddings, si bien es una
tecnica muy simple, para algunos
problemas da buenos resultados, en particular
para el analisis de sentimiento
          <xref ref-type="bibr" rid="ref14">(White et
al., 2015)</xref>
          . (300 valores reales)
Polaridad de las nueve palabras
principales del tweet segun el clasi cador de
polaridad. La cantidad de palabras es el
largo promedio de los tweets del corpus
de entrenamiento, ltrando stopwords.
Se toma como mas relevantes los valores
de mayor valor absoluto. Si el tweet tiene
menos de nueve palabras se completan
los nueve valores repitiendo las
polaridades de las palabras del mismo tweet.
(9 valores reales)
Cantidad de palabras que pertenecen a
los lexicos positivo y negativo. (2 valores
naturales)
Cantidad de palabras cuyas
representaciones vectoriales estan cercanas a los
vectores promedio del lexico positivo y
el lexico negativo. (2 valores naturales)
Cantidad de palabras que pertenecen a
las listas de marcadores de categor a. (4
valores naturales)
Atributos que indican si el tweet
original contiene repeticion de caracteres o
alguna palabra escrita completamente en
mayusculas. (2 valores booleanos)
Calculo de polaridad tentativa (P, N,
NEU, NONE) en base a cantidad de
palabras positivas y negativas, teniendo en
cuenta el alcance de las negaciones. Se
considera una lista de negadores que
invierten la polaridad de las palabras, su
alcance va desde el negador hasta algun
signo de puntuacion. (4 categor as)
Cinco palabras mas relevantes en el
corpus de entrenamiento segun bag of
words. El valor cinco se de nio de
manera heur stica, ltrando las palabras
pertenecientes a una lista de stopwords,
adaptada a la tarea de analisis de
sentimientos (se elimino de la lista de
stopwords un conjunto de palabras
consideradas relevantes para el calculo de la
polaridad como \no", \pero", \aunque",
etc.). Es interesante destacar que, en los
experimentos realizados sobre el corpus
de entrenamiento que utilizamos durante
el desarrollo del trabajo, la lista de
cinco palabras mas relevantes obtenida fue:
\feliz", \gracias", \no", \pero",
\portada" (5 valores booleanos).
        </p>
        <p>Este conjunto nal de atributos utilizado
para el entrenamiento del modelo se obtuvo
a partir de varios experimentos, evaluando su
desempen~o sobre el corpus de desarrollo. Se
comenzo utilizando solamente atributos de
tipo bag of words, comprobandose que el nivel
de acierto y M-F1 aumentaba utilizando una
mayor cantidad de palabras, estancandose al
llegar al entorno de las mil palabras mas
relevantes. Luego se entreno un clasi cador que
utiliza el centroide de los embeddings,
obteniendo un mejor desempen~o. Pero se
comprobo que combinar ambos tipos de atributos
(centroide y bag of words) permit a obtener
aun mejores resultados, aumentando el
acierto hasta en 13 puntos y la M-F1 hasta en
12 puntos. La combinacion optima
encontrada utiliza los atributos del centroide mas las
cinco palabras mas relevantes segun bag of
words.</p>
        <p>Los demas atributos considerados fueron
aportando pequen~os aumentos en los
resultados a medida que se fueron incorporando. Si
bien ninguno de estos atributos en particular
aporta una mejora sustancial, la inclusion de
todos ellos permite una aumento
aproximado de 2 puntos en acierto y M-F1, respecto a
los resultados que se obtienen utilizando
solamente el centroide y las cinco palabras mas
relevantes. En particular, se observa que el
aporte del lexico subjetivo es poco relevante.</p>
        <p>
          Para todos los experimentos con el
modelo SVM se utilizo la librer a scikit-learn
          <xref ref-type="bibr" rid="ref9">(Pedregosa et al., 2011)</xref>
          de Python. Los
modelos SVM de scikit-learn se entrenan de
manera diferente dependiendo de si se habilita
o no la salida con probabilidades por
categor a. El calculo de probabilidades para una
salida multiclase se realiza utilizando el
metodo de
          <xref ref-type="bibr" rid="ref15">(Wu, Lin, y Weng, 2004)</xref>
          , el cual es un
proceso mas lento y puede dar salidas
diferentes a las obtenidas entrenando el modelo
sin probabilidades. Para nuestros datos, en
particular, se constato una mejora
importante (2.5 %) en los valores de M-F1 utilizando
el entrenamiento con probabilidades, por lo
que optamos por utilizar este modelo.
        </p>
        <p>La tarea 2 consiste en clasi car la
polaridad de tweets segmentada por aspectos.
Para esta tarea se entrenaron dos clasi
cadores tipo SVM utilizando atributos similares a
los utilizados para la tarea 1. El clasi cador
svm1 utiliza atributos tipo bag of words para
los tweets, si el tweet original conten a
repeticion de caracteres o palabras en
completamente en mayusculas, cantidades de palabras
que pertenecen a las listas de marcadores de
categor a, y el aspecto sobre el que se esta
clasi cando. El clasi cador svm2 utiliza
solamente los 300 atributos reales que
corresponden al centroide de los word embeddings del
texto del tweet y el aspecto sobre el que se
esta clasi cando.
4.2</p>
      </sec>
      <sec id="sec-4-2">
        <title>Enfoque basado en CNN</title>
        <p>Se realizaron experimentos con redes
neuronales para la tarea 1 tomando como entrada
representaciones distribuidas de las palabras.</p>
        <p>
          Con el objetivo de obtener una
representacion de la oracion a partir de las
representaciones vectoriales de las palabras, se
consideraron dos enfoques. Por un lado, se
considero como l nea base la concatenacion de una
ventana de palabras, enfoque similar a
Etcheverry y Wonsever (2017), aunque en una
problematica distinta. Por otro lado se considero
la representacion provista por convoluciones
unidimensionales de las palabras del tweet,
basados en el trabajo de
          <xref ref-type="bibr" rid="ref2">Kim (2014)</xref>
          ,
presentando este ultimo resultados ampliamente
superiores.
        </p>
        <p>Se consideraron dos variantes
estructurales de modelos de redes neuronales
convolucionales (CNN). Por un lado, modelos con
una unica capa convolucional y, por otro,
modelos con varias capas convolucionales que
reciben la entrada de forma independiente y
sus salidas son concatenadas (ver g. 1). En
ambos casos, luego de la representacion
provista por las convoluciones (o de la
concatenacion en el caso de varias ramas), se utilizo
max pooling 3, capas completamente
conectadas, dropout y softmax en la salida.</p>
        <p>
          Se utilizo la misma particion de
entrenamiento y evaluacion mencionada
anteriormente, separando 783 tweets del corpus de
entrenamiento para validacion. Todos los
modelos fueron entrenados con adam
          <xref ref-type="bibr" rid="ref10 ref2 ref3">(Kingma y
Ba, 2014)</xref>
          , considerando un learning rate de
1 10 4, beta1 = 9 10 1, beta2 = 0;999,
epsilon = 1 10 8 y decay = 0. Para
evitar el sobreajuste de los modelos se utilizo
dropout (ver g. 1) y early stopping.
        </p>
        <p>Para la codi cacion se utilizo Keras
(Chollet, 2015). La codi cacion del modelo de una
rama fue inspirada en el codigo provisto por
Francois Chollet4 y el de multiples ramas en
3 Alternativamente, average pooling fue
considerado sin obtener mejores resultados.</p>
        <p>4https://github.com/fchollet/keras/blob/
master/examples/imdb_cnn.py
Figura 1: Arquitectura de red con varias
ramas convolucionales.
el de Chang-Uk Shin5.</p>
        <p>
          En las variantes estructurales
consideradas para los modelos convolucionales, se
observo mayor poder de generalizacion en la
variante de multiples ramas, por este motivo
fue la utilizada para los resultados
reportados (cnn1, ..., cnn4). El modelo nal
(denominado cnn4) consiste en 3 ramas
convolucionales, con 2, 3 y 4 palabras en la
convolucion, 56 ltros y desplazamiento de a una
palabra; una capa completamente conectada de
dimension 200; 0;2 de probabilidad de
perdida para dropout ; y funcion de activacion selu
          <xref ref-type="bibr" rid="ref4">(Klambauer et al., 2017)</xref>
          .
4.3
        </p>
      </sec>
      <sec id="sec-4-3">
        <title>Enfoque h brido</title>
        <p>Dado que tanto en el enfoque de SVM
como en el de CNN entrenamos modelos que
devuelven una distribucion de probabilidades
sobre las categor as predichas, utilizamos esta
caracter stica para entrenar un nuevo clasi
cador que combina las salidas de los dos
clasi cadores anteriores para la tarea 1. El
nuevo clasi cador devuelve la categor a C para
el tweet T que maximice el promedio de las
probabilidades de los clasi cadores
anteriores, como se muestra en la formula 1.
argmax</p>
        <p>C</p>
        <p>PSV M (CjT ) + PCNN (CjT )
2
(1)
5https://github.com/tflearn/tflearn/
blob/master/examples/nlp/cnn_sentence_
classification.py</p>
      </sec>
    </sec>
    <sec id="sec-5">
      <title>Analisis de resultados</title>
      <p>Los resultados para los experimentos
realizados sobre el corpus de validacion para la tarea
1 se muestran en la tabla 2. Como se puede
observar, el modelo h brido fue el que obtuvo
mejores resultados. Se muestra la matriz de
confusion para este modelo en la tabla 3.</p>
      <sec id="sec-5-1">
        <title>Clasif. svm cnn4 svm cnn</title>
        <p>Tabla 3: Matriz de confusion para svm cnn.
Las las representan las clases reales,
mientras que las columnas representan las clases
predichas.</p>
        <p>El modelo muestra buenos resultados para
las clases P, N y NONE, pero no alcanza
resultados aceptables para la clase NEU. Los tres
modelos, y en particular este, fallan al
intentar predecir los tweets neutros. Esto se puede
deber a que hay pocas instancias
pertenecientes a esta clase, siendo dif cil poder aprender
a partir de ellas. Otra particularidad que
presentan los tweets neutros es el hecho de
contener tanto elementos positivos como
negativos, esto explicar a la tendencia del clasi
cador a confundirlos con esas dos clases, como
muestra la matriz. Notar que para lograr
mejorar los resultados de M-F1 es fundamental
mejorar la medida F1 en los tweets neutros,
ya que es la clase que da el numero mas bajo.</p>
        <p>Los resultados para los experimentos
realizados sobre los corpus de evaluacion de la
competencia se muestran en la tabla 4. A
diferencia de lo constatado sobre el corpus
de validacion, el clasi cador CNN obtuvo un
desempen~o menor que el SVM sobre los
corpus de evaluacion, lo cual puede indicar que
la red se sobreajusto al corpus utilizado
para entrenar. Por otra parte, en casi todas
las evaluaciones la combinacion entre SVM
y CNN se desempen~o mejor que cada uno de
los clasi cadores independientes en los tres
corpus.</p>
      </sec>
      <sec id="sec-5-2">
        <title>Corpus</title>
      </sec>
      <sec id="sec-5-3">
        <title>InterTASS InterTASS InterTASS</title>
      </sec>
      <sec id="sec-5-4">
        <title>Gral. TASS Gral. TASS Gral. TASS</title>
      </sec>
      <sec id="sec-5-5">
        <title>Gral. TASS 1k Gral. TASS 1k Gral. TASS 1k Clasif.</title>
        <p>Se observa que los resultados sobre el
corpus InterTASS son notoriamente mas bajos
que los obtenidos sobre los otros corpus. Esto
puede deberse a que entrenamos nuestros
sistemas con un conjunto unico de tweets,
provenientes en su mayor a del corpus General
TASS, que contiene tweets con caracter sticas
diferentes a los contenidos en el InterTASS.</p>
        <p>Los resultados de los clasi cadores svm1 y
svm2 para la tarea 2 se muestran en la tabla
5. El clasi cador svm2, basado
principalmente en el centroide de los tweets, es el que
obtiene mejor desempen~o en los dos corpus de
evaluacion.</p>
      </sec>
      <sec id="sec-5-6">
        <title>Corpus</title>
        <p>social-TV
social-TV
stompol
stompol</p>
        <p>Clasif.
svm1
svm2
svm1
svm2</p>
        <p>M-F1
Este trabajo muestra tres enfoques para la
tarea 1 del TASS 2017 sobre analisis de
sentimiento de tweets en espan~ol: SVM con
atributos elaborados a mano, que incluyen
informacion proveniente de los vectores de
palabras; redes neuronales con un fuerte uso de
vectores de palabras; y un enfoque h brido,
que combina los dos enfoques anteriores. El
enfoque que funciono mejor fue el h brido. En
cuanto a la tarea 2, que trata sobre la clasi
cacion de la polaridad de los tweets
segmentados por aspectos, el enfoque SVM utilizando
embeddings mostro tener buenos resultados,
aunque aun queda mucho espacio de mejora.</p>
        <p>En base al analisis experimental se
observa que el sistema es poco efectivo en la
deteccion de los tweets clasi cados como neutros.
El hecho de que esta clase tenga pocos
representantes en los corpus y su similitud tanto
con los tweets negativos como con los
positivos podr an ser las causas del bajo desempen~o
en su deteccion.</p>
      </sec>
    </sec>
    <sec id="sec-6">
      <title>Bibliograf a</title>
      <p>Azzinnari, A. y A. Mart nez. 2016.
Representacion de Palabras en Espacios de
Vectores. Proyecto de grado, Universidad de
la Republica, Uruguay.</p>
      <p>Bojanowski, P., E. Grave, A. Joulin, y T.
Mikolov. 2016. Enriching word vectors with
subword information. arXiv preprint
arXiv:1607.04606.</p>
      <p>Brooke, J., M. To loski, y M. Taboada. 2009.</p>
      <p>Cross-linguistic sentiment analysis: From
english to spanish. En RANLP, paginas
50{54.</p>
      <p>Ceron-Guzman, J. A. 2016. Jacerong at
tass 2016: An ensemble classi er for
sentiment tweets at global level. En
Proceedings of TASS 2016: Workshop on
Sentiment Analysis at SEPLN co-located with
32nd SEPLN Conference (SEPLN 2016),
Salamanca, Spain.</p>
      <p>Chollet, F. 2015. Keras. https://github.</p>
      <p>com/fchollet/keras.</p>
      <p>Cruz, F. L., J. A. Troyano, B. Pontes, y F. J.</p>
      <p>Ortega. 2014. Building layered,
multilingual sentiment lexicons at synset and
lemma levels. Expert Systems with
Applications, 41(13):5984{5994.</p>
      <p>Etcheverry, M. y D. Wonsever. 2016.
Spanish word vectors from wikipedia.
Language Resource Conference (LREC 2016).
Etcheverry, M. y D. Wonsever. 2017.
Time expressions recognition with word
vectors and neural networks. 24th
International Symposium on Temporal
Representation and Reasoning (TIME 2017),
forthcoming.</p>
      <p>Garc a-Cumbreras, M., J. Villena-Roman,
E. Mart nez-Camara, M. D az-Galiano,
M. Mart n-Valdivia, y L. na Lopez. 2016.
Overview of tass 2016. En Proceedings
of TASS 2016: Workshop on Sentiment
Analysis at SEPLN co-located with the
32nd SEPLN Conference (SEPLN 2016),
Salamanca, Spain, September.</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          <string-name>
            <surname>Hurtado</surname>
            ,
            <given-names>L. F. y F.</given-names>
          </string-name>
          <string-name>
            <surname>Pla</surname>
          </string-name>
          .
          <year>2016</year>
          .
          <article-title>Elirfupv en tass 2016: Analisis de sentimientos en twitter</article-title>
          .
          <source>En Proceedings of TASS 2016: Workshop on Sentiment Analysis at SEPLN co-located with 32nd SEPLN Conference (SEPLN</source>
          <year>2016</year>
          ), Salamanca, Spain.
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          <string-name>
            <surname>Kim</surname>
            ,
            <given-names>Y.</given-names>
          </string-name>
          <year>2014</year>
          .
          <article-title>Convolutional neural networks for sentence classi cation</article-title>
          .
          <source>CoRR, abs/1408</source>
          .5882.
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          <string-name>
            <surname>Kingma</surname>
            ,
            <given-names>D. P. y J.</given-names>
          </string-name>
          <string-name>
            <surname>Ba</surname>
          </string-name>
          .
          <year>2014</year>
          .
          <article-title>Adam: A method for stochastic optimization</article-title>
          .
          <source>CoRR, abs/1412</source>
          .6980.
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          <string-name>
            <surname>Klambauer</surname>
            , G.,
            <given-names>T.</given-names>
          </string-name>
          <string-name>
            <surname>Unterthiner</surname>
            ,
            <given-names>A</given-names>
          </string-name>
          . Mayr, y
          <string-name>
            <given-names>S.</given-names>
            <surname>Hochreiter</surname>
          </string-name>
          .
          <year>2017</year>
          .
          <string-name>
            <surname>Self-Normalizing Neural Networks. ArXiv</surname>
          </string-name>
          e-prints, Junio.
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          <string-name>
            <surname>Mart</surname>
            nez-Camara,
            <given-names>E.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>M. C.</surname>
          </string-name>
          <article-title>D az-</article-title>
          <string-name>
            <surname>Galiano</surname>
            ,
            <given-names>M. A.</given-names>
          </string-name>
          <string-name>
            <surname>Garc</surname>
          </string-name>
          a-Cumbreras, M. Garc aVega, y J.
          <string-name>
            <surname>Villena-Roman</surname>
          </string-name>
          .
          <year>2017</year>
          .
          <article-title>Overview of tass 2017</article-title>
          .
          <string-name>
            <surname>En J. Villena Roman M. A. Garc a Cumbreras D. G. M. C. Mart</surname>
          </string-name>
          nez-Camara, Eugenio, y M.
          <article-title>Garc a Vega, editores</article-title>
          ,
          <source>Proceedings of TASS 2017: Workshop on Semantic Analysis at SEPLN (TASS</source>
          <year>2017</year>
          ), volumen 1896 de CEUR Workshop Proceedings, Murcia, Spain, September. CEURWS.
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          <string-name>
            <surname>Mikolov</surname>
            ,
            <given-names>T.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>K.</given-names>
            <surname>Chen</surname>
          </string-name>
          , G. Corrado,
          <string-name>
            <given-names>y J.</given-names>
            <surname>Dean</surname>
          </string-name>
          .
          <year>2013</year>
          .
          <article-title>E cient estimation of word representations in vector space</article-title>
          .
          <source>arXiv preprint arXiv:1301</source>
          .
          <fpage>3781</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          <string-name>
            <surname>Montejo-Raez</surname>
          </string-name>
          , A.
          <string-name>
            <surname>y M. C. D</surname>
          </string-name>
          az-Galiano.
          <year>2016</year>
          .
          <article-title>Participacion de SINAI en TASS 2016</article-title>
          .
          <source>En Proceedings of TASS 2016: Workshop on Sentiment Analysis at SEPLN co-located with 32nd SEPLN Conference (SEPLN</source>
          <year>2016</year>
          ), Salamanca, Spain.
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          <string-name>
            <surname>Padro</surname>
            , L. y
            <given-names>E.</given-names>
          </string-name>
          <string-name>
            <surname>Stanilovsky</surname>
          </string-name>
          .
          <year>2012</year>
          .
          <article-title>Freeling 3.0: Towards wider multilinguality</article-title>
          .
          <source>En Proceedings of the Language Resources and Evaluation Conference (LREC</source>
          <year>2012</year>
          ), Istanbul, Turkey, May. ELRA.
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          <string-name>
            <surname>Pedregosa</surname>
            ,
            <given-names>F.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>G.</given-names>
            <surname>Varoquaux</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Gramfort</surname>
          </string-name>
          ,
          <string-name>
            <given-names>V.</given-names>
            <surname>Michel</surname>
          </string-name>
          ,
          <string-name>
            <given-names>B.</given-names>
            <surname>Thirion</surname>
          </string-name>
          ,
          <string-name>
            <given-names>O.</given-names>
            <surname>Grisel</surname>
          </string-name>
          ,
          <string-name>
            <given-names>M.</given-names>
            <surname>Blondel</surname>
          </string-name>
          ,
          <string-name>
            <given-names>P.</given-names>
            <surname>Prettenhofer</surname>
          </string-name>
          ,
          <string-name>
            <given-names>R.</given-names>
            <surname>Weiss</surname>
          </string-name>
          ,
          <string-name>
            <given-names>V.</given-names>
            <surname>Dubourg</surname>
          </string-name>
          ,
          <string-name>
            <given-names>J.</given-names>
            <surname>Vanderplas</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Passos</surname>
          </string-name>
          ,
          <string-name>
            <given-names>D.</given-names>
            <surname>Cournapeau</surname>
          </string-name>
          ,
          <string-name>
            <given-names>M.</given-names>
            <surname>Brucher</surname>
          </string-name>
          , M. Perrot,
          <string-name>
            <given-names>y E.</given-names>
            <surname>Duchesnay</surname>
          </string-name>
          .
          <year>2011</year>
          .
          <article-title>Scikit-learn: Machine learning in Python</article-title>
          .
          <source>Journal of Machine Learning Research</source>
          ,
          <volume>12</volume>
          :
          <fpage>2825</fpage>
          {
          <fpage>2830</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          <string-name>
            <surname>Pennington</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          , R. Socher, y
          <string-name>
            <given-names>C. D.</given-names>
            <surname>Manning</surname>
          </string-name>
          .
          <year>2014</year>
          .
          <article-title>Glove: Global vectors for word representation</article-title>
          .
          <source>Conference on Empirical Methods in Natural Language Processing (EMNLP).</source>
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          <string-name>
            <surname>Quiros</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>I.</surname>
          </string-name>
          Segura-Bedmar, y P. Mart nez.
          <year>2016</year>
          .
          <article-title>LABDA at the 2016 TASS challenge task: Using word embeddings for the sentiment analysis task</article-title>
          .
          <source>En Proceedings of TASS 2016: Workshop on Sentiment Analysis at SEPLN co-located with 32nd SEPLN Conference (SEPLN</source>
          <year>2016</year>
          ), Salamanca, Spain.
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          <string-name>
            <surname>Rosenthal</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          , N. Farra,
          <string-name>
            <given-names>y P.</given-names>
            <surname>Nakov</surname>
          </string-name>
          .
          <year>2017</year>
          . SemEval
          <article-title>-2017 task 4: Sentiment analysis in Twitter</article-title>
          .
          <source>En Proceedings of the 11th International Workshop on Semantic Evaluation, SemEval '17</source>
          , Vancouver, Canada, August. Association for Computational Linguistics.
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          <string-name>
            <surname>Saralegi</surname>
            ,
            <given-names>X. y I. San</given-names>
          </string-name>
          <string-name>
            <surname>Vicente</surname>
          </string-name>
          .
          <year>2013</year>
          . Elhuyar at tass
          <year>2013</year>
          . XXIX Congreso de la Sociedad Espaola de Procesamiento de lenguaje natural,
          <source>Workshop on Sentiment Analysis at SEPLN (TASS2013)</source>
          , paginas
          <volume>143</volume>
          {
          <fpage>150</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          <string-name>
            <surname>White</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>R.</given-names>
            <surname>Togneri</surname>
          </string-name>
          , W. Liu, y
          <string-name>
            <given-names>M.</given-names>
            <surname>Bennamoun</surname>
          </string-name>
          .
          <year>2015</year>
          .
          <article-title>How well sentence embeddings capture meaning</article-title>
          .
          <source>En Proceedings of the 20th Australasian Document Computing Symposium, pagina 9</source>
          . ACM.
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          <string-name>
            <surname>Wu</surname>
          </string-name>
          , T.-F.,
          <string-name>
            <surname>C.-J. Lin</surname>
            , y
            <given-names>R. C.</given-names>
          </string-name>
          <string-name>
            <surname>Weng</surname>
          </string-name>
          .
          <year>2004</year>
          .
          <article-title>Probability estimates for multi-class classi cation by pairwise coupling</article-title>
          .
          <source>Journal of Machine Learning Research</source>
          ,
          <volume>5</volume>
          (Aug):
          <volume>975</volume>
          {
          <fpage>1005</fpage>
          .
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>