<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Efectos de la Negacion, Modi cadores, Jergas, Abreviaturas y Emoticonos en el Analisis de Sentimiento</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Mario Amores</string-name>
          <email>marioamores89@gmail.com</email>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Leticia Arco</string-name>
          <email>leticiaa@uclv.edu.cu</email>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Abel Barrera</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Departamento de Ciencia de la Computacion, Universidad Central \Marta Abreu" de Las Villas</institution>
          ,
          <addr-line>Carretera a Camajuan Km 5 1=2 Santa Clara, Villa Clara</addr-line>
          ,
          <country country="CU">Cuba</country>
        </aff>
      </contrib-group>
      <fpage>43</fpage>
      <lpage>53</lpage>
      <abstract>
        <p>Some problems present in the treatment of opinions are: the use of informal, ironic and sarcastic language, abbreviations, orthographic and typographic mistakes, semantic compositionality, the cultural level and knowledge of language. These problems impose greater di culty on opinion mining than on text mining in general. Therefore, the aim of our research is to develop computational solutions to solve some of these problems, contributing to improve the processing of opinions and consequently to obtain more e ective polarity detection. As a result of this research some resources were developed to manage jargons, emoticons, valence shifters and negations. These resources are applicable in any opinion mining system that requires them for mining opinions in Spanish or English. The experimental study from the application of the proposed resources showed values of accuracy and F1 higher than those obtained by calculating the polarity without incorporating those resources.</p>
      </abstract>
      <kwd-group>
        <kwd>Palabras Claves</kwd>
        <kwd>Miner a de opinion</kwd>
        <kwd>Recursos lexicos</kwd>
        <kwd>Negacion</kwd>
        <kwd>Emoticonos</kwd>
      </kwd-group>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>Introduccion</title>
      <p>Las personas al prepararse para tomar alguna decision siempre tienen en
cuenta, ademas de su propia experiencia, lo que otras personas puedan aportar,
por lo que las opiniones son una parte importante en la vida de los seres humanos.
La creciente popularidad de sitios ricos en opiniones abre nuevas oportunidades
y retos al poderse usar diferentes tecnicas para entender y extraer las opiniones
de otros.</p>
      <p>
        Las opiniones son los estados subjetivos que re ejan los sentimientos y la
percepcion de una persona sobre un suceso o un objeto [
        <xref ref-type="bibr" rid="ref10">10</xref>
        ]. Segun Liu [
        <xref ref-type="bibr" rid="ref13">13</xref>
        ], una
opinion es una emocion sobre una entidad o un aspecto de la entidad
expresada por un usuario. El sentimiento asociado a una opinion puede ser positivo,
negativo o neutro, o expresarse con distinta fuerza o niveles de intensidad.
      </p>
      <p>Con la llegada de la web 2.0, enormes volumenes de textos con opiniones
estan disponibles. Para extraer el sentimiento acerca de un objeto, producto o
servicio de esta enorme red, se necesitan sistemas de miner a de opinion
automatizados. El procesamiento automatico de opiniones no es una tarea sencilla.
Algunos de los problemas presentes en el tratamiento de las opiniones son: el uso
de lenguaje informal, las abreviaturas, los errores ortogra cos y tipogra cos, el
lenguaje ironico y sarcastico, la semantica composicional, el nivel de
conocimiento del lenguaje, el nivel cultural, entre otros. Estos problemas, en comparacion
con el procesamiento de documentos en otras tareas de la miner a de textos,
imponen una mayor di cultad a la miner a de opiniones. Por tanto, el objetivo
de nuestra investigacion es desarrollar soluciones computacionales que permitan
resolver varias de las problematicas existentes en las opiniones, contribuyendo
a un mejor procesamiento de las mismas y consecuentemente mayor efectividad
en el calculo de la polaridad.
2</p>
    </sec>
    <sec id="sec-2">
      <title>Recursos para manejar problemas presentes en las opiniones</title>
      <p>
        Algunos de los problemas presentes en las opiniones se pueden manejar con
la miner a de opinion basada en aspectos y entidades; por ejemplo, identi car
las entidades y aspectos y los valores de polaridad asociados a cada uno de ellos,
o analizar aquellos textos que contienen otra entidad para referirse a una
entidad [
        <xref ref-type="bibr" rid="ref13">13</xref>
        ]. Otros problemas requieren realizar analisis sintactico y desambiguacion
semantica en aquellos casos donde sea necesario identi car la polaridad de las
palabras dependiendo del contexto y de la etiqueta POS (Part Of Speech) [
        <xref ref-type="bibr" rid="ref13">13</xref>
        ].
El manejo de algunos problemas requiere la aplicacion de tecnicas de miner a
de opinion dependientes del dominio, por ejemplo, para manejar aquellos
terminos que en determinado dominio son considerados positivos y en otros pueden
ser considerados negativos. El manejo de estos problemas no es objetivo de este
trabajo, ya que requieren la aplicacion de tecnicas muy espec cas del
procesamiento del lenguaje natural, desambiguacion semantica y miner a de opinion
basada en aspectos embebidas en el sistema de miner a de opinion que se disen~e.
En este ep grafe presentaremos recursos generales para manejar la negacion, las
palabras modi cadoras, las jergas, las abreviaturas y los emoticonos, con
independencia del sistema de miner a de opinion que se desee aplicar a la coleccion
de opiniones.
2.1
      </p>
      <sec id="sec-2-1">
        <title>Manejo de la negacion</title>
        <p>
          El tratamiento de la negacion es un problema abierto dentro del
procesamiento del lenguaje natural, y la miner a de opinion en particular. Son muy
abundantes las opiniones negativas expresadas con terminos positivos negados y
viceversa [
          <xref ref-type="bibr" rid="ref9">9</xref>
          ].
        </p>
        <p>
          La negacion es un elemento lingu stico muy particular de cada lengua, por
lo que para un tratamiento efectivo se debe realizar un estudio pormenorizado
de los distintos elementos lingu sticos que intervienen en el proceso de negacion
de un enunciado. La investigacion existente sobre la in uencia de la negacion es
escasa, no estudia en profundidad estos aspectos lingu sticos y se centra casi en
exclusividad en textos escritos en Ingles [
          <xref ref-type="bibr" rid="ref21">21</xref>
          ], aunque existen algunas propuestas
para otros idiomas.
        </p>
        <p>
          Las primeras para manejar las negaciones comenzaron en el an~o 2001 [
          <xref ref-type="bibr" rid="ref11 ref16 ref17 ref22 ref6">6,16,17,11,22</xref>
          ].
Entre los trabajos mas recientes cabe destacar el sistema basado en reglas
propuesto en [
          <xref ref-type="bibr" rid="ref8">8</xref>
          ]. En [
          <xref ref-type="bibr" rid="ref18">18</xref>
          ] marcan como negadas todas aquellas palabras que se
encuentren despues de una part cula negativa hasta llegar a un signo de
puntuacion, un conector o ciertas palabras pertenecientes a una determinada categor a
gramatical, e introducen una nueva forma de tratar la negacion que consiste en
reducir el valor de polaridad de las palabras negadas en lugar de invertirlo. En [
          <xref ref-type="bibr" rid="ref7">7</xref>
          ]
se presenta un sistema para el tratamiento de la negacion y de la especulacion,
y el primer corpus de opiniones etiquetado a nivel de negacion y especulacion
[
          <xref ref-type="bibr" rid="ref12">12</xref>
          ]. El primer trabajo que conocemos para el Espan~ol es el propuesto en [
          <xref ref-type="bibr" rid="ref4">4</xref>
          ] que
consiste en la adaptacion al Espan~ol del sistema SO-CAL [
          <xref ref-type="bibr" rid="ref19">19</xref>
          ]. En [
          <xref ref-type="bibr" rid="ref20">20</xref>
          ]
manejan la negacion teniendo en cuenta la estructura sintactica del texto, obteniendo
as mejores resultados que los sistemas puramente lexicos.
        </p>
        <p>
          Nuestra propuesta para manejar la negacion se basa en la union de varios de
los enfoques antes descritos. Primeramente tomamos las reglas presentadas en
[
          <xref ref-type="bibr" rid="ref15">15</xref>
          ] para la negacion en el idioma Ingles y las modi camos descartando aquellos
terminos que no aportan en el calculo de la polaridad y que pudieran ser
eliminados en una aplicacion de miner a de opinion en la etapa de preprocesamiento.
El rango de la negacion esta de nido por las reglas. Por ejemplo, dada la oracion
\I don't like this laptop" la rama de la regla que se muestra en la Fig. 1 se aplica
como se explicara a continuacion. Cuando se detecta el verbo \do" seguido del
termino \not" se activa el arbol de reglas para el termino \not". El siguiente
termino que aparece en la oracion es un verbo, por tanto, se recorre el arbol
buscando esta entrada. Si aparece la entrada, como es el caso de este ejemplo
que se muestra en la rama derecha que sale del termino \not" en la Fig. 1, la
polaridad de este termino tambien se niega. A continuacion, el proximo termino
a analizar es un sustantivo, por tanto, se busca en la rama del arbol esta entrada,
como no existe, se termina la negacion. De manera general, la activacion de una
regla consiste en identi car la regla a aplicar y para cada termino buscar su clase
gramatical e ir moviendose por las ramas de la regla identi cada. Cada termino
con la clase gramatical de la rami cacion correspondiente sera negado. Negar un
termino consiste en consultar su polaridad e invertirla.
        </p>
        <p>Figura 1. Rama de la regla de negacion para el termino \not".</p>
        <p>
          Estas reglas estan creadas para los terminos \not", \never" y \no" del
idioma Ingles. Para el idioma Espan~ol adaptamos las reglas descritas en [
          <xref ref-type="bibr" rid="ref20">20</xref>
          ] para
los terminos \no", \nunca" y \sin". Las reglas solamente involucran los tres
terminos mas utilizados para negar (not, never y no); sin embargo, existen otros
terminos que expresan negacion, de ah la necesidad de utilizar otros enfoques
para manejar la negacion. Por ello, se crearon listas de palabras negadoras en
ambos idiomas a partir de diversas listas ya publicadas. El rango de negacion
que consideramos para estas palabras se obtuvo a traves de la experimentacion
con rangos de uno, dos y tres terminos despues de la palabra negadora, siendo
el de mejores resultados el rango que considera negar los proximos dos terminos.
Tambien se tuvo en cuenta el uso de su jos y pre jos para ambos idiomas, un
ejemplo para el Ingles lo constituye el pre jo dis- (dislike) y para el Espan~ol el
pre jo in- (incomible). Para evitar que el analisis de los pre jos y su jos
produjera falsos positivos, se tuvo en cuenta que el termino modi cado tuviera un alto
valor de polaridad positiva. En todos los casos la negacion se trata invirtiendo
los valores de polaridad de cada termino negado.
        </p>
        <p>La aplicacion de nuestra propuesta para manejar la negacion considera el uso
de uno u otro enfoque dependiendo del termino que se presente en el
procesamiento textual. Por ejemplo, si aparece la palabra \no" directamente se activa
el enfoque basado en reglas, si el termino a analizar presenta un pre jo que
expresa negacion entonces seguimos el enfoque basado en pre jos y si aparece otro
termino que expresa negacion y que no es manejado desde las reglas, entonces
se consulta la lista de palabras negadoras.
2.2</p>
      </sec>
      <sec id="sec-2-2">
        <title>Manejo de las palabras modi cadoras</title>
        <p>Las palabras modi cadoras son aquellas que pueden incrementar, reducir o
cambiar la polaridad de otro termino dentro de la oracion. Especial atencion
tienen las palabras intensi cadoras las cuales aumentan la fuerza de otros terminos
y las atenuadoras que reducen la fuerza de otros terminos.</p>
        <p>En gramatica, un intensi cador es una palabra que hace hincapie en otra
palabra o frase. Tambien conocido como un refuerzo o un ampli cador. Por ejemplo,
algo no solo es bueno, sino muy bueno, o incluso, terriblemente bueno. Los
adjetivos intensi cadores modi can a los sustantivos; los adverbios de intensi cacion
modi can comunmente verbos, adjetivos graduables, y otros adverbios.</p>
        <p>Hasta cierto punto, un intensi cador actua como una sen~al: anuncia que
la siguiente palabra que se lleva a cabo debe ser entendida como insu ciente.
Algunos ejemplos de palabras intensi cadoras en el idioma Ingles aparecen en las
siguientes oraciones: \The woodwind has a slightly greater scope than the violin",
\A really good detective never gets married" y \Maggy knew that something
surpassingly important had happened to him".</p>
        <p>
          Otras palabras modi cadoras son las palabras atenuadoras, como por
ejemplo, el termino \less" en Ingles o \poco" en Espan~ol. Los atenuadores (tambien
mitigadores) han sido descriptos como elementos que se utilizan para mitigar
o relativizar el impacto de las a rmaciones, en una estrategia propia de la
cortes a [
          <xref ref-type="bibr" rid="ref5">5</xref>
          ]. Se dice tambien que \desactivan" la fuerza elocutiva de un acto [
          <xref ref-type="bibr" rid="ref14">14</xref>
          ].
Pragmaticamente, la atenuacion sirve para regular la relacion interpersonal y
social entre interlocutores.
        </p>
        <p>
          Los diversos autores que estudian en forma sistematica este tipo de
fenomenos se re eren alternativamente a estrategias, recursos, operadores, formas o
estructuras de atenuacion [
          <xref ref-type="bibr" rid="ref19">19</xref>
          ]. Desde el punto de vista semantico-pragmatico,
la atenuacion se opone a la intensi cacion. En ambos casos los recursos
pueden corresponder a ambitos categoriales diferentes, como adverbios, adjetivos y
frases.
        </p>
        <p>Para tratar estas palabras modi cadoras, como resultado de esta
investigacion, se construyeron dos listas (una para el idioma Ingles y otra para el Espan~ol)
de terminos intensi cadores y atenuadores a partir de las consultas manuales a
diccionarios, analisis de listas de palabras modi cadoras ya existentes y consultas
a expertos linguistas. Como estas palabras pueden in uir tanto en los terminos
precedentes como en los posteriores, se les agrego a cada uno una etiqueta para
identi car donde ejerc a este su in uencia. El formato consiste en la frase o el
termino modi cador seguido de un valor entero en el dominio f1, 2g, donde uno
signi cada que es una palabra intensi cadora y dos que es una palabra
atenuadora. A continuacion aparece un segundo valor entero en el dominio f1, 2, 3g
que sen~ala a que termino afecta siendo uno el termino antecesor, dos el sucesor
y tres para ambos casos. Un fragmento de una lista de palabras modi cadoras
en Ingles se muestra en la Fig. 2. Sugerimos que aquellos sistemas que utilicen
nuestra propuesta para el manejo de palabras modi cadoras de la polaridad, le
agreguen uno al valor de polaridad predominante del termino predecesor o
sucesor segun sea la etiqueta que porte la palabra intensi cadora, y reduzcan en un
50 % el valor de polaridad predominante del termino predecesor o sucesor en el
caso de las palabras atenuadoras. Por tanto, ante la presencia de intensi cadores
le asignamos a las palabras modi cadas el mayor valor de polaridad, mientras
que a aquellas modi cadas por atenuadoras lo que se pretende es reducir su
valor de polaridad de forma tal que si era medianamente fuerte, sera debil y si era
fuerte, sera medianamente fuerte.</p>
        <p>Figura 2. Fragmento de lista de palabras modi cadoras.
2.3</p>
      </sec>
      <sec id="sec-2-3">
        <title>Manejo de jergas, abreviaturas y emoticonos</title>
        <p>
          Las jergas de internet son una variedad de lenguajes cotidianos y
abreviaciones en la escritura utilizadas por las diferentes comunidades en el ambito de
Internet [
          <xref ref-type="bibr" rid="ref23">23</xref>
          ]. Esos nuevos terminos o formas de escritura a menudo se han
originado con el proposito de abreviar pulsaciones de teclado, sobre todo por la
di cultad y/o rapidez que a veces trae aparejado el uso de algunos dispositivos
portatiles. Muchas personas utilizan las mismas abreviaturas en los mensajes
de textos y en la mensajer a instantanea, as como en las redes sociales [
          <xref ref-type="bibr" rid="ref6">6</xref>
          ]. Por
ejemplo \u" para \you", \cam" para \camera", \pic" para \picture", \f9" para
\ ne", \b4" para \before", \gud" para \good", etc.
        </p>
        <p>De igual forma, los acronimos, s mbolos del teclado, y abreviaturas, tambien
son de uso frecuente y mas o menos normalizado, y por tanto, integran lo que
puede llamarse jerga de Internet. Por ejemplo \gr8" es una palabra del argot
usado para \great", \5n" o \fyn" para \ ne". Estas palabras no son una parte
de los diccionarios tradicionales, pero se encuentran ampliamente en los textos
en l nea. Si estas jergas se pueden asignar a las palabras originales, los resultados
de rendimiento de los analizadores de los sentimientos pueden ser mejorados.</p>
        <p>Otro elemento que encontramos dentro de las jergas de internet son los
emoticonos (emoticon) que son una secuencia de caracteres ASCII que, en un principio,
representaba una cara humana y expresaba una emocion. Posteriormente, fueron
creandose otros emoticonos con signi cados muy diversos.</p>
        <p>
          Existen varias listas que incluyen jergas y emoticonos; sin embargo, cada
una adolece de terminos que presentan otras, sobre todo debido a la velocidad
y dinamica con que surgen nuevos emoticonos y jergas. De ah que para
tratar con estos dos temas creamos dos listas, una para las jergas, y otra para los
emoticonos, construidas a partir de varias listas previamente publicadas1. Cada
emoticon o jerga tiene asignados sus correspondientes valores de polaridad
positiva y negativa. Para obtener estos valores de polaridad de las jergas utilizamos
1 www.netlingo.com, www.noslang.com, es.wikipedia.org/wiki/Anexo:Emoticonos
su correspondiente signi cado en el idioma y sumamos los valores de polaridad
de sus terminos. Los valores de polaridad de los terminos pueden obtenerse a
partir de listas2 o recursos lexicos como por ejemplo SentiWordNet [
          <xref ref-type="bibr" rid="ref3">3</xref>
          ] o
PosNeg Lexicon [
          <xref ref-type="bibr" rid="ref1 ref2">1,2</xref>
          ]. En la Fig. 3 se muestra un fragmento de la lista de jergas y
los valores de polaridad positiva y negativa asignados. Para los emoticonos es
similar, solo que se le asigna a cada emoticon el valor de polaridad de la
emocion que expresan. En ambos casos se sugiere que los valores de polaridad sean
agregados al valor nal de toda la opinion, pues estos elementos la mayor a de
las veces no afectan directamente a un termino sino al contexto en general.
        </p>
        <p>Figura 3. Fragmento de lista de jergas y los valores de polaridad asignados.</p>
        <p>Nuestra propuesta sugiere que despues de cargar el corpus textual es
necesario localizar los emoticonos y las jergas para pre-procesarlos y determinar su
in uencia en el calculo de la polaridad. Este es un paso que distingue la miner a
de opinion de otros enfoques de miner a de textos donde en la etapa de
preprocesamiento son eliminados inicialmente los emoticonos y las jergas. Despues
de calcular los valores de polaridad asociados a las jergas y los emoticonos, estos
deben ser eliminados, ya que no apareceran directamente en los recursos lexicos
a consultar, en el caso que estemos usando un enfoque no supervisado basado
en recursos lexicos. El analisis de las palabras intensi cadoras y atenuadoras
debe realizarse cuando estemos asignando los valores de polaridad a los
terminos, al concluir este proceso es posible aplicar la estrategia h brida de nida para
manejar la negacion.
3</p>
      </sec>
    </sec>
    <sec id="sec-3">
      <title>Evaluacion de los recursos desarrollados</title>
      <p>
        En este ep grafe se desea mostrar las potencialidades que ofrecen los
recursos desarrollados para el manejo de jergas, emoticonos, negaciones y el uso de
palabras modi cadoras en el calculo de la polaridad de las opiniones. Para ello,
utilizamos el sistema PosNeg Opinion que permite detectar la polaridad de
opiniones en Espan~ol y en Ingles siguiendo un esquema general que consta de seis
etapas para el calculo de la polaridad [
        <xref ref-type="bibr" rid="ref1">1</xref>
        ]. Ya seleccionado el sistema a utilizar, fue
necesario conformar tres casos de estudios que permitan ilustrar la efectividad
de nuestra propuesta. Los dos primeros estan conformados por subconjuntos de
opiniones del corpus Amazon3 y el tercero coincide con el corpus Sentiment1404.
2 http://www.cs.uic.edu/~liub/FBS/sentiment-analysis.html
3 http://times.cs.uiuc.edu/~wang296/Data/
4 http://cs.stanford.edu/people/alecmgo/trainingandtestdata.zip
      </p>
      <p>El corpus Amazon contiene comentarios sobre seis productos (camaras,
telefonos moviles, TV, laptop, tablet y sistemas de video vigilancia) en Amazon.com.
Cada producto contiene los siguientes atributos: ID del producto (unico),
nombre, caracter sticas del producto, precio y el URL de la imagen. Cada
comentario tambien contiene ademas los siguientes atributos: ID del comentario (unico),
autor, t tulo, contenido, puntuacion global y fecha. La puntuacion global es
brindada por el usuario quien le da una puntuacion de cero a cinco estrellas, para
este trabajo solo tomamos las puntuaciones de cero a dos como negativas, de
cuatro a cinco como positivas, dejando fuera las puntuaciones de tres estrellas
pues estas muestran indecision de los usuarios al clasi car sus opiniones, lo cual
no asegura que sea una clasi cacion con able. El otro corpus utilizado es
Sentiment140 que incluye 800 000 tweets que contienen emoticonos positivos y 800
000 tweets que incluyen emoticonos negativos, aquellos mensajes que conten an
ambos no fueron tomados en cuenta.</p>
      <p>El calculo de la polaridad de las opiniones puede ser analizado como un
proceso de clasi cacion, donde se determina si la opinion pertenece a la clase
positiva o negativa. Las medidas para evaluar el desempen~o de los clasi cadores
pueden ser utilizadas para evaluar la calidad de la deteccion de la polaridad de
las opiniones. Las medidas de evaluacion utilizadas en la experimentacion son:
Exactitud (Accuracy ; Ac) que calcula la proporcion del numero total de
predicciones correctas; la Razon de Verdaderos Positivos (True Positive Rate; TPR)
o Recall que calcula la proporcion de casos positivos que fueron correctamente
identi cados; la Razon de Falsos Positivos (False Positive Rate; FPR) que
calcula la proporcion de casos negativos que han sido incorrectamente clasi cados;
la Razon de Verdaderos Negativos (True Negative Rate; TNR) que calcula la
proporcion de casos negativos que han sido correctamente clasi cados; la Razon
de Falsos Negativos (False Negative Rate; FNR) que calcula la proporcion de
casos positivos que fueron incorrectamente clasi cados; la Precision (Precision; P)
que calcula la proporcion de casos predichos positivos que fueron correctos y la
medida-F (F-measure) que determina un valor unico ponderado de la precision
y la exactitud.</p>
      <p>Para veri car el impacto que tienen las palabras intensi cadoras y
atenuadoras en la clasi cacion de la polaridad tomamos del corpus Amazon aquellas
opiniones que contuviesen dichas palabras quedando as una coleccion de 99 148
opiniones negativas y 645 678 opiniones positivas. En la Tabla 1 se muestra como
al realizar el analisis de dichas palabras se logran mejores medidas de Precision,
Recall, Exactitud y F1, respecto al procesamiento omitiendo dichas palabras.</p>
      <p>Tabla 1. Impacto de las palabras intensi cadoras y atenuadoras.</p>
      <p>PosNeg Opinion Precision Recall Exactitud F1
Sin intensi cadores y atenuadores 89 % 83 % 82 % 86 %
Con intensi cadores y atenuadores 92 % 87 % 83 % 90 %</p>
      <p>Para mostrar el impacto que tiene la negacion en la clasi cacion de la
polaridad utilizamos del corpus Amazon aquellas opiniones que utilizan palabras
negadoras quedando as una coleccion de 65 578 opiniones negativas y 225 758
opiniones positivas. En la Tabla 2 se muestra como al realizar el analisis de la
negacion se logran mejores medidas de Precision, Recall, Exactitud y F1.</p>
      <p>Tabla 2. Impacto del manejo de las negaciones en la deteccion de la polaridad.
PosNeg Opinion Precision Recall Exactitud F1 TPR FPR TNR FNR
Sin negacion 88 % 86 % 80 % 87 % 86 % 51 % 49 % 14 %
Con negacion 90 % 88 % 83 % 89 % 88 % 42 % 58 % 12 %
Tambien es posible notar en la Tabla 2 que al realizar este analisis se logra
una mayor proporcion de casos positivos y negativos que fueron correctamente
identi cados (TPR y TNR) y una disminucion de la proporcion de casos
negativos que han sido incorrectamente clasi cados como positivos (FPR), as como
una disminucion de casos positivos que han sido incorrectamente clasi cados
como negativos (FNR).</p>
      <p>Para veri car el impacto que tienen los emoticonos en la clasi cacion de la
polaridad tomamos el corpus Sentiment140 ya que parte de este fue construido
a partir de la busqueda de diferentes emoticonos. En la Tabla 3 se muestra como
al realizar el analisis de este corpus se obtienen mejores resultados de Precision,
Recall, Exactitud y F1 al incluir el analisis de los emoticonos.</p>
      <p>Tabla 3. Impacto del manejo de los emoticonos en la deteccion de la polaridad.</p>
      <p>PosNeg Opinion Precision Recall Exactitud F1
Sin emoticonos 83 % 90 % 77 % 86 %</p>
      <p>Con emoticonos 88 % 92 % 83 % 90 %</p>
      <p>Para el analisis del impacto de las jergas tambien utilizamos el corpus
Sentiment140 ya que este se encuentra construido sobre la red social Twitter donde es
comun la utilizacion de estos elementos. En la Tabla 4 se muestra como realizar
el analisis de las jergas ayuda a la obtencion de mejores resultados de Precision,
Exactitud y F1, y el valor de Recall se mantiene. El manejo de las jergas es
complejo, ya que la jerga en s puede generar otros de los problemas presentes
en las opiniones.</p>
      <p>Tabla 4. Impacto del manejo de las jergas en la deteccion de la polaridad.</p>
      <p>PosNeg Opinion Precision Recall Exactitud F1
Sin jergas 83 % 90 % 77 % 86 %</p>
      <p>Con jergas 87 % 90 % 80 % 88 %</p>
    </sec>
    <sec id="sec-4">
      <title>Conclusiones y recomendaciones</title>
      <p>
        Como resultado de esta investigacion se desarrollaron recursos para tratar
algunos problemas presentes en las opiniones. Estos recursos son aplicables en
cualquier sistema para la deteccion de la polaridad de las opiniones en Ingles y
Espan~ol, incluso, no solo para detectar la polaridad, sino para otras tareas de
la miner a de opinion que as lo requieran. Estos recursos fueron incorporados
al sistema PosNeg Opinion 3.0 [
        <xref ref-type="bibr" rid="ref1">1</xref>
        ] para ilustrar las ventajas que ofrecen estos
recursos en el calculo de la polaridad de las opiniones de manera no supervisada.
Al incorporar el manejo de jergas, emoticonos, palabras modi cadoras y
negaciones a PosNeg Opinion se obtuvieron valores promedios de 82 % de exactitud y
89 % de F1, superandose de esta forma los valores de calidad de la deteccion de
la polaridad de las opiniones que ofrec a PosNeg Opinion antes de incorporarle
estos recursos. De esta forma se mostro el impacto positivo que tiene el manejo
de las palabras modi cadoras, las negaciones, los emoticonos y las jergas en el
calculo de la polaridad mediante el uso de los recursos disen~ados como resultado
de esta investigacion a tales efectos. Se recomienda continuar actualizando los
recursos desarrollados a partir de la retroalimentacion de los resultados de la
experimentacion y proponer soluciones para otros problemas como el sarcasmo
y la iron a.
      </p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          1.
          <string-name>
            <surname>Amores</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          :
          <article-title>Deteccion de la polaridad de las opiniones basada en nuevos recursos lexicos</article-title>
          . Master en ciencia de la computacion,
          <source>Universidad Central "Marta Abreu"de Las Villas</source>
          (
          <year>2016</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          2.
          <string-name>
            <surname>Amores</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Arco</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Borroto</surname>
            ,
            <given-names>C.</given-names>
          </string-name>
          :
          <source>Unsupervised Opinion Polarity Detection based on New Lexical Resources. Computacion y Sistemas</source>
          <volume>20</volume>
          (
          <issue>2</issue>
          ) (
          <year>2016</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          3.
          <string-name>
            <surname>Baccianella</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Esuli</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Sebastiani</surname>
            ,
            <given-names>F.</given-names>
          </string-name>
          :
          <article-title>SentiWordNet 3.0: An Enhanced Lexical Resource for Sentiment Analysis and Opinion Mining</article-title>
          .
          <source>In: LREC</source>
          . vol.
          <volume>10</volume>
          , pp.
          <volume>2200</volume>
          {
          <issue>2204</issue>
          (
          <year>2010</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          4.
          <string-name>
            <surname>Brooke</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          , To loski, M.,
          <string-name>
            <surname>Taboada</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          :
          <string-name>
            <surname>Cross-Linguistic Sentiment</surname>
          </string-name>
          <article-title>Analysis: From English to Spanish</article-title>
          . In: RANLP. pp.
          <volume>50</volume>
          {
          <issue>54</issue>
          (
          <year>2009</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          5. Ca ,
          <string-name>
            <surname>C.</surname>
          </string-name>
          :
          <article-title>On mitigation</article-title>
          .
          <source>Journal of pragmatics 31(7)</source>
          ,
          <volume>881</volume>
          {
          <fpage>909</fpage>
          (
          <year>1999</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          6.
          <string-name>
            <surname>Das</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Chen</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          :
          <article-title>Yahoo! for amazon: Extracting market sentiment from stock message boards</article-title>
          .
          <source>In: Proceedings of the Asia Paci c nance association annual conference (APFA)</source>
          . vol.
          <volume>35</volume>
          , p.
          <fpage>43</fpage>
          . Bangkok, Thailand (
          <year>2001</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          7.
          <string-name>
            <given-names>D</given-names>
            <surname>az</surname>
          </string-name>
          ,
          <string-name>
            <surname>N.P.C.</surname>
          </string-name>
          : Deteccion de la Negacion y la Especulacion en Textos Medicos y de Opinion.
          <source>Phd</source>
          , Universidad de Huelva (
          <year>2014</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          8.
          <string-name>
            <surname>Jia</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Yu</surname>
            ,
            <given-names>C.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Meng</surname>
            ,
            <given-names>W.:</given-names>
          </string-name>
          <article-title>The e ect of negation on sentiment analysis and retrieval e ectiveness</article-title>
          .
          <source>In: Proceedings of the 18th ACM conference on Information and knowledge management</source>
          . pp.
          <year>1827</year>
          {
          <year>1830</year>
          . ACM (
          <year>2009</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          9.
          <string-name>
            <given-names>Jimenez</given-names>
            <surname>Zafra</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S.M.</given-names>
            ,
            <surname>Mart nez Camara</surname>
          </string-name>
          ,
          <string-name>
            <given-names>E.</given-names>
            ,
            <surname>Mart</surname>
          </string-name>
          n Valdivia, M.T.,
          <string-name>
            <surname>Molina</surname>
            <given-names>Gonzalez</given-names>
          </string-name>
          , M.D.:
          <article-title>Tratamiento de la negacion en el analisis de opiniones en espan~ol</article-title>
          .
          <source>Procesamiento del Lenguaje Natural (54)</source>
          ,
          <volume>37</volume>
          {
          <fpage>44</fpage>
          (
          <year>2015</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          10.
          <string-name>
            <surname>Kaur</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Duhan</surname>
          </string-name>
          , N.:
          <article-title>A survey on sentiment analysis and opinion mining</article-title>
          .
          <source>International Journal of Innovations &amp; Advancement in Computer Science IJIACS</source>
          <volume>4</volume>
          (
          <year>2015</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          11.
          <string-name>
            <surname>Kennedy</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Inkpen</surname>
            ,
            <given-names>D.</given-names>
          </string-name>
          :
          <article-title>Sentiment classi cation of movie reviews using contextual valence shifters</article-title>
          .
          <source>Computational intelligence</source>
          <volume>22</volume>
          (
          <issue>2</issue>
          ),
          <volume>110</volume>
          {
          <fpage>125</fpage>
          (
          <year>2006</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          12.
          <string-name>
            <surname>Konstantinova</surname>
            ,
            <given-names>N.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>De Sousa</surname>
            ,
            <given-names>S.C.M.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>D</given-names>
            <surname>az</surname>
          </string-name>
          ,
          <string-name>
            <given-names>N.P.C.</given-names>
            ,
            <surname>Lopez</surname>
          </string-name>
          ,
          <string-name>
            <given-names>M.J.M.</given-names>
            ,
            <surname>Taboada</surname>
          </string-name>
          ,
          <string-name>
            <given-names>M.</given-names>
            ,
            <surname>Mitkov</surname>
          </string-name>
          ,
          <string-name>
            <surname>R.:</surname>
          </string-name>
          <article-title>A review corpus annotated for negation, speculation and their scope</article-title>
          .
          <source>In: LREC</source>
          . pp.
          <volume>3190</volume>
          {
          <issue>3195</issue>
          (
          <year>2012</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          13.
          <string-name>
            <surname>Liu</surname>
            ,
            <given-names>B.</given-names>
          </string-name>
          :
          <article-title>Sentiment analysis and opinion mining</article-title>
          .
          <source>Synthesis lectures on human language technologies 5(1)</source>
          ,
          <volume>1</volume>
          {
          <fpage>167</fpage>
          (
          <year>2012</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          14.
          <string-name>
            <surname>Mallarino</surname>
          </string-name>
          , M.d.R.U.:
          <article-title>Los marcadores del discurso y la cortes a verbal en espan~ol</article-title>
          .
          <source>Tintas. Quaderni di Letterature iberiche e iberoamericane (1)</source>
          ,
          <volume>300</volume>
          {
          <fpage>303</fpage>
          (
          <year>2012</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          15.
          <string-name>
            <surname>Na</surname>
            ,
            <given-names>J.C.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Khoo</surname>
            ,
            <given-names>C.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Wu</surname>
            ,
            <given-names>P.H.J.</given-names>
          </string-name>
          :
          <article-title>Use of negation phrases in automatic sentiment classi cation of product reviews</article-title>
          .
          <source>Library Collections, Acquisitions, and Technical Services</source>
          <volume>29</volume>
          (
          <issue>2</issue>
          ),
          <volume>180</volume>
          {
          <fpage>191</fpage>
          (
          <year>2005</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref16">
        <mixed-citation>
          16.
          <string-name>
            <surname>Pang</surname>
            ,
            <given-names>B.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Lee</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Vaithyanathan</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          :
          <article-title>Thumbs up?: sentiment classi cation using machine learning techniques</article-title>
          .
          <source>In: Proceedings of the ACL-02 conference on Empirical methods in natural language processing-</source>
          Volume
          <volume>10</volume>
          . pp.
          <volume>79</volume>
          {
          <fpage>86</fpage>
          .
          <article-title>Association for Computational Linguistics (</article-title>
          <year>2002</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref17">
        <mixed-citation>
          17.
          <string-name>
            <surname>Polanyi</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Zaenen</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          :
          <article-title>Contextual valence shifters</article-title>
          . In:
          <article-title>Computing attitude and a ect in text: Theory and applications</article-title>
          , pp.
          <volume>1</volume>
          {
          <fpage>10</fpage>
          . Springer (
          <year>2006</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref18">
        <mixed-citation>
          18.
          <string-name>
            <surname>Taboada</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Brooke</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          , To loski, M.,
          <string-name>
            <surname>Voll</surname>
            ,
            <given-names>K.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Stede</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          :
          <article-title>Lexicon-based methods for sentiment analysis</article-title>
          .
          <source>Computational linguistics 37(2)</source>
          ,
          <volume>267</volume>
          {
          <fpage>307</fpage>
          (
          <year>2011</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref19">
        <mixed-citation>
          19.
          <string-name>
            <surname>Taboada</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Voll</surname>
            ,
            <given-names>K.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Brooke</surname>
          </string-name>
          , J.:
          <article-title>Extracting sentiment as a function of discourse structure and topicality</article-title>
          .
          <source>Simon Fraser Univeristy School of Computing Science Technical Report</source>
          (
          <year>2008</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref20">
        <mixed-citation>
          20.
          <string-name>
            <surname>Vilares</surname>
            ,
            <given-names>D.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Alonso</surname>
            ,
            <given-names>M.A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Gomez-Rodr guez</surname>
          </string-name>
          , C.:
          <article-title>Clasi cacion de polaridad en textos con opiniones en espan~ol mediante analisis sintactico de dependencias</article-title>
          .
          <source>Procesamiento del lenguaje natural 50</source>
          ,
          <volume>13</volume>
          {
          <fpage>20</fpage>
          (
          <year>2013</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref21">
        <mixed-citation>
          21.
          <string-name>
            <surname>Wiegand</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Balahur</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Roth</surname>
            ,
            <given-names>B.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Klakow</surname>
            ,
            <given-names>D.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Montoyo</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          :
          <article-title>A survey on the role of negation in sentiment analysis</article-title>
          .
          <source>In: Proceedings of the workshop on negation and speculation in natural language processing</source>
          . pp.
          <volume>60</volume>
          {
          <fpage>68</fpage>
          .
          <article-title>Association for Computational Linguistics (</article-title>
          <year>2010</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref22">
        <mixed-citation>
          22. Wilson,
          <string-name>
            <given-names>T.</given-names>
            ,
            <surname>Wiebe</surname>
          </string-name>
          ,
          <string-name>
            <surname>J.</surname>
          </string-name>
          , Ho mann, P.:
          <article-title>Recognizing contextual polarity in phraselevel sentiment analysis</article-title>
          .
          <source>In: Proceedings of the conference on human language technology and empirical methods in natural language processing</source>
          . pp.
          <volume>347</volume>
          {
          <fpage>354</fpage>
          .
          <article-title>Association for Computational Linguistics (</article-title>
          <year>2005</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref23">
        <mixed-citation>
          23.
          <string-name>
            <surname>Yin</surname>
            ,
            <given-names>Y.</given-names>
          </string-name>
          :
          <article-title>World Wide Web and the Formation of the Chinese and English \Internet Slang Union"</article-title>
          .
          <source>Computer-Assisted Foreign Language Education</source>
          <volume>1</volume>
          (
          <year>2006</year>
          )
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>