Avances en el modelado del ciberbullying desde la perspectiva de las Tecnologı́as del Lenguaje Humano Progress in the modeling of cyberbullying from the perspective of the human language technologies Beatriz Botella Gil Departamento de Lenguajes y Sistemas Informáticos Universidad de Alicante E-03080 Alicante beatriz.botella@ua.es Resumen: Según el INE, el 98,8 % de jóvenes y menores tienen teléfono móvil con acceso a Internet. Con mirar estas cifras podemos ser conscientes de la cercanı́a que hay entre las TIC (Teorı́as de la información y de la comunicación) y los menores. En esta investigación se quiere reflejar la gravedad del asunto del ciberbullying y centrar el trabajo en la búsqueda de toda la información posible para delimitar el problema y poder crear una herramienta a través de Machine Learning que permita la detección automática del ciberbullying. El fin es encontrar posibles soluciones a la problemática tan grave que existe actualmente sobre el acoso en la red entre menores. Palabras clave: Ciberbullying, acoso en Internet, violencia en la red, tecnologı́as de la información y de la comunicación, tecnologı́as del lenguaje humano, modelado del comportamiento. Abstract: According to the INE, 98.8 % young people and children have a mobile phone with Internet access. By looking at these figures we can be aware of the close relation between ICTs and minors. This research wants to reflect the seriousness of the issue of cyberbullying. We want to focus the work on the search of all the possible information to delimit the problem and to be able to create a tool through Machine Learning that allows the automatic detection of cyberbullying. The aim is to find possible solutions to the serious problem that currently exists on harassment in the network amongs youngsters. Keywords: Cyberbullying, Internet harassment, violence in the network, technology of the information and communication, human language technologies, behavioral modeling. 1 Motivación de la investigación en número y duración (Povedano et al., 2015; Sádaba Chalezquer, Charo and Bringué Sala, Vivimos en una sociedad conectada digital- 2010; Álvarez-Garcı́a et al., 2011). mente. Nuestra forma de vida ha evoluciona- do de la de hace 10 años con la aparición de Según el Instituto Nacional de Estadı́stica las nuevas tecnologı́as y el uso inmediato de (INE), de 16.029.823 viviendas que existen, el Internet. Esto nos ha facilitado una mayor re- 96,7 % tiene teléfono móvil y un 81,9 % dispo- lación con el mundo y un acercamiento a la nen de acceso a Internet. Y en el caso de los información de manera rápida. jóvenes y menores cuya edad está compren- Nuestras formas de comunicar han cam- dida entre los 16 y los 24 años encontramos biado y las redes sociales cobran fuerza y que el 98,8 % tienen teléfono móvil. se implantan en nuestra sociedad, en parte Uno de los objetivos prioritarios a solucio- ayudándonos a relacionarnos con las perso- nar es la problemática del llamado ciberbull- nas, y en otra parte propiciando algunos ti- ying o acoso en la red. Este problema que pos de violencia que cada año va aumentando crece cada año en todo el mundo, es una evo- Lloret, E.; Saquete, E.; Martı́nez-Barco, P.; Moreno, I. (eds.) Proceedings of the Doctoral Symposium of the XXXIV International Conference of the Spanish Society for Natural Language Processing (SEPLN 2018), p. 49–53 Sevilla, Spain, September 19th 2018. Copyright c 2018 by the paper’s authors. Copying permitted for private and academic purposes. lución del acoso escolar que vienen sufrien- 2 Antecedentes y trabajos do muchos menores en los colegios e institu- relacionados tos desde hace muchos años (Garaigordobil, El interés por esta materia viene dado por 2011). el alarmante crecimiento de casos de ciber- El principal motivo de que el acoso en la bullying en la sociedad actual. En 2016 se ha red esté aumentando y el número de casos sea incrementado este suceso en un 87,7 % con mucho más elevado que el bullying se debe 1.207 casos registrados, además de estas ci- principalmente al anonimato de los acosado- fras, llama la atención que la edad de menores res, que pueden ejercer su violencia sobre el que lo sufren a disminuido considerablemen- acosado sin tener rerpesalias, ya que a través te. de Internet pueden hacerlo sin dar a conocer El término ciberbullying nace con la apa- su identidad. (Chóliz y Chóliz, 2009) rición de las TIC (Tecnologı́as de la infor- mación y de la comunicación) en nuestra so- Además, no pueden ver cómo ha afectado ciedad. El primer paso fue crear un área de a la vı́ctima el acto realizado ya que, al no investigación nueva y separarlo del llamado hacerlo de manera presencial, no se ve fı́sica- bullying o acoso escolar. mente a la vı́ctima, lo que hubiera facilitado Mientras que el bullying se ciñe exclusiva- la empatı́a del acosador. mente al ámbito escolar, el ciberbullying es un problema de acoso entre menores a través Como punto importante a tener en cuenta de las TIC. es el grado de urgencia de este caso, ya que en el caso de acoso escolar la violencia im- Cada año aumentan las cifras del acoso en partida solo se creaba en el centro educativo la red, y es por ello que se ha incrementado el o en sus alrededores, pero en el caso de ci- número de artı́culos en referencia a este tema, berbullying pueden ser las veinticuatro horas vistos siempre desde la perspectiva de reflejar del dı́a, desde cualquier lugar y sin vigilancia cuales son los porcentajes de casos existentes adulta, lo que dificulta su seguimiento. en nuestra sociedad. Algunos trabajos utilizados en esta inves- A través de los medios de los que dispo- tigación y que se han relacionado con las in- nemos hoy en dı́a es muy fácil poder seguir vestigaciones de ciberbullying son : acosando y persiguiendo al acosado en cual- quier parte del mundo (Álvarez-Garcı́a et al., - Libro Cyber Bullying , el acoso en la era 2011; Calvete et al., 2010). digital. Robin Kowalski, Susan Limber, Patricia Agatston (Kowalski, Limber, y El problema del ciberbullying aumenta ca- Agatston, 2008). da año, y desde 2014 se ha incrementado en En este libro que trata de acoso ci- un 240 %, según ha publicado la fundación bernético podemos encontrar desde la ANAR en su II Estudio sobre el ciberbull- definición del problema hasta posibles ying, dato muy elevado que debemos investi- soluciones. También incluye la norma- gar. tiva legal y polı́ticas especı́ficas. Reco- Como punto de partida, debemos definir ge datos de entrevistas reales con los es- qué es el ciberbullying de una manera veraz tudiantes y con los padres. Se basan en (Sádaba Chalezquer, Charo and Bringué Sa- cuestiones y preguntas para recabar in- la, 2010). Lo definen como el uso malévolo y formación y reflejar los datos más rele- cruel de las tecnologı́as por parte de un agre- vantes. sor o agresores para humillar y vejar a una - II Estudio sobre acoso escolar y ciber- vı́ctima, considerada como débil e indefensa, bullying según los afectados. Fundación ante una audiencia amplia de espectadores. Anar (Fundación ANAR, 2017). El ciberbullying supone un nuevo reto pa- Con este informe quieren dar a conocer ra las escuelas por su peligrosa extensión (von la evolución del acoso escolar y del ci- Marées y Petermann, 2012). Y las formas berbullying entre las vı́ctimas y los cam- en que sucede y las terribles consecuencias bios producidos en sus entornos detec- que afectan al bienestar psicológico de todos tados en el último año. Se basa en casos sus implicados, provocando desajustes psico- reales que conocen gracias a las llamadas sociales y psicopatológicos. que se han producido a esta fundación, 50 tanto de vı́ctimas como de sus familiares. de ciberbullying (formas de violencia, ex- Nos da información real de porcentajes y posición a la violencia, aceptación y re- datos estadı́sticos de como se encuentra chazo por los compañeros). En este cues- en la actualidad el problema. tionario recogieron información de la jus- tificación del uso de la violencia, las me- - Artı́culo Usos problemáticos y agresi- didas de agresión y la exposición a la vio- vos de las TIC por parte de ado- lencia. lescentes implicados en cyberbullying (Giménez Gualdo, Maquilón Sánchez, y - Artı́culo Cyberbullying detection and Arnaiz Sánchez, 2015). prevention: Data mining and psycholo- El siguiente estudio examina la exten- gical perspective (Parime y Suri, 2014). sión y caracterı́sticas del ciberbullying En este trabajo se centran en la minerı́a en una muestra de escolares. Su objeti- de datos y técnicas de aprendizaje au- vo es saber que situaciones ocurren en tomático para detectar y prevenir el ci- el ámbito escolar ası́ como el uso pro- berbullying. También se discute sobre los blemático de Internet en menores y la factores psicosociales relacionados con el posible adicción que los menores (cibera- acoso cibernético y como abordar este cosadores y cibervı́ctimas) hacen de las problema. Plantean algunas propuestas TIC. para los futuros algorı́tmos que puedan detectar y prevenir el ciberbullying. - Common Sense Reasoning for Detec- tion, Prevention, and Mitigation of Cy- - Artı́culo Factores de riesgo en el ci- berbullying KARTHIK (Dinakar, Pi- berbullying. Frecuencia y exposición de card, y Lieberman, 2015). los datos personales en Internet (Saba- ter Fernández, Carmen y Lara López, Trabajan en la detección de intimidación Hernández, 2015). basado en el procesamiento del lengua- je natural. Analizan la apariencia, inteli- El artı́culo expone el aumento del ciber- gencia, insultos raciales y étnicos, acep- bullying debido a la expansión de las tación social y rechazo; y una vez ana- nuevas tecnologı́as. Nos habla del con- lizado estos procesos crean una base de cepto, sus diferencias con el acoso y los conocimiento de ”sentido común”que co- principales factores de riesgo. El objetivo difica conocimientos particulares sobre principal en su investigación es el análi- situaciones de intimidación. Además en- sis de la relación entre sufrir ciberacoso y señan a las vı́ctimas a hacer frente a este realizar ciberacoso. Utiliza variables co- problema y los conecta entre sı́ en lo que mo el perfil demográfico, la frecuencia, la llaman “apoyo emocional”. intensisdad y el tipo de uso de las TIC en los jóvenes. Toda esta información es ex- - Automatic Detection of Cyberbullying on traida de las encuestas realizadas a 400 Social Networks based on Bullying Fea- jóvenes de 14 a 20 años. tures (Zhao, Zhou, y Mao, 2016). Proponen un programa para la detec- ción del acoso cibernético. Usan una lis- 3 Actualidad ta con palabras e insultos para determi- A través de la investigación de artı́culos nar el nivel de intimidación existente en cientı́ficos, informes, libros y material relacio- cada mensaje. Trabajan con la red so- nado con el ciberbullying se pretende escla- cial Twitter cuya finalidad es la creación recer los aspectos más importantes del acoso de un sistema automático de detección en la red en menores para poder aportar so- cibernética para categorizar la informa- luciones a este problema. cion y detectar los casos de ciberbull- Para poder llegar a una solución, primero ying. debemos estudiar y recopilar todos los da- tos pertenecientes a los casos de ciberbull- - Artı́culo Cyberbullying in adolescents: ying, cuáles son sus inicios, quién los crea, Modalitites and aggressors’s profile (Cal- por qué motivos, quien los sufre y cuál es su vete et al., 2010). fin. En esta investigación se pretende estudiar Realizan un cuestionario para evaluar la el estado de la cuestión del problema y plan- prevalencia de numerosas modalidades tear un modelador del ciberbullying orienta- 51 do a las TLH que nos ayude a conocer de- 3.2 Hipótesis talladamente el problema, determinando su 1. El ciberbullying es el acoso más frecuen- aparición según: te entre los jóvenes. 1. La edad y el género de la victima. 2. Cada año incrementa el número de casos de ciberbullying en menores, cada vez 2. Su entorno y los lugares donde ocurre el con edades mas pequeñas. ciberbullying. 3. Se pueden crear fases de ciberbullying 3. Cuáles son los medios y el motivo de que según los comportamientos reiterados. ocurra este acoso. 4. Posibilidad de que pueda crearse un pro- 4. Cuándo empieza y su duración y frecuen- grama que detecte automáticamente la cia. presencia de ciberbullying. 5. Qué lenguaje se utiliza en el acoso y si se siguen las mismas pautas en la mayorı́a 3.3 Experimentos propuestos de los casos. Como experimentos para esta investigación se encuentran los siguientes: 6. Cuáles son las diferentes fases del proce- so. - Recogida y búsqueda exhaustiva de in- 7. Cómo se relacionan las fases con su len- formación en referencia al problema a guaje violento o acción. tratar. - Debemos delimitar cuales son las fases Una vez obtengamos la información nece- del ciberbullying y se procederá a reali- saria y aprendidas todas las formas y varian- zar una recopilación de un corpus de en- tes que envuelven al ciberbullying, se traba- trenamiento y evaluación para el apren- jará en: dizaje del modelo de comportamiento. a) Creación de un modelado del ciberbull- - Se programaran pruebas preliminares de ying. su aplicación utilizando un sistema de aprendizaje automático. b) La recopilación de un corpus de entrena- miento y evaluación para el aprendizaje - Conseguir poner en marcha el programa del modelo de comportamiento. y que éste sea capaz de detectar y señalar la presencia de ciberbullying en las redes c) La realización de pruebas preliminares sociales y en que fase se encuentra. de su aplicación utilizando un sistema de aprendizaje automático. 4 Cuestiones especı́ficas de Con la finalidad de que sea capaz de detec- investigación tar los mensajes que estén relacionados con el 1. Es posible la detección del ciberbullying ciberbullying. a través del Machine Learning para fre- nar la problemática del ciberbullying. 3.1 Objetivos 1. Definir las fases que ocurren para saber 2. Se puede definir distintas fases que tie- la secuencia de este problema. ne el acoso entre menores en la red para saber cual es el nivel de gravedad que 2. Identificación de mensajes violentos con encontramos en el ciberbullying. el ciberbullying, relacionando palabras claves o comportamientos que nos ayu- 3. Se podrı́a crear una alerta automática den a etiquetarlo en el ciberbullying. capaz de avisarnos de que se está gene- rando ciberbullying a un menor. 3. Saber reconocer cada mensaje que se mande en internet con la fase de ciber- Agradecimientos bullying que le corresponde. Esta investigación ha sido financiada par- 4. Creación de un programa de detección cialmente por la Universidad de Alicante, la automática del ciberbullying. Generalitat Valenciana, el Gobierno Español 52 (Ministerio de Educación, Cultura y Depor- Parime, S. y V. Suri. 2014. Cyberbull- te) y las Ayudas Fundación BBVA a equi- ying detection and prevention: Data mi- pos de investigación cientı́fica 2016 median- ning and psychological perspective. En te los proyectos: TIN2015-65100-R, TIN2015- 2014 International Conference on Cir- 65136-C2-2-R, GRE16-01 y Análisis de Senti- cuits, Power and Computing Technolo- mientos Aplicado a la Prevención del Suicidio gies, ICCPCT 2014, páginas 1541–1547. en las Redes Sociales (ASAP). Povedano, A., M.-J. Cava, M.-C. Monreal, Especial agradecimiento a Patricio R. Varela, y G. Musitu. 2015. Internatio- Martı́nez Barco y al Departamento de nal Journal of Clinical and Health Psycho- Lenguajes y Sistemas Informáticos de la logy Victimization, loneliness, overt and Universidad de Alicante (DLSI) y en particu- relational violence at the school from a lar a Maria Ángeles Herrero Herrero, Isabel gender perspective. International Journal Moreno Agulló y Lea Canales Zaragoza. of Clinical and Health Psychology, 15:44– Bibliografı́a 51. Álvarez-Garcı́a, D., J. C. Núñez, L. Álvarez, Sabater Fernández, Carmen y Lara López, A. Dobarro, C. Rodrı́guez, y P. González- Hernández. 2015. Factores de riesgo en el Castro. 2011. Violencia a través de ciberbullying. Frecuencia y exposición de las tecnologı́as de la información y la co- los datos personales en internet. Revista municación en estudiantes de secundaria. Internacional de Sociologı́a de la Educa- Anales de psicologı́a, 27(1):221–231. ción, 4(1):1–25. Calvete, E., I. Orue, A. Estevez, L. Vi- Sádaba Chalezquer, Charo and Bringué Sala, llard, y P. Padilla. 2010. Cyberbull1ying X. 2010. Niños y adolescentes españoles in adolescents: Modalities and aggressors’ ante las pantallas: rasgos configuradores profile. Computers in Human Behavior, de una generación interactiva. CEE Par- 26(5):1128–1135. ticipacion Educativa, 15(June 2009):86– Chóliz, M. y M. C. Chóliz. 2009. Ellas, ellos 104. y su movil: Uso, abuso(¿y dependencia?) von Marées, N. y F. Petermann. 2012. Cy- del telefono movil en la adolescencia. Ori- berbullying: An increasing challenge for ginales, 34(1):74–88. schools. School Psychology International, Dinakar, K., R. Picard, y H. Lieberman. 33(5):467–476, oct. 2015. Common sense reasoning for detec- Zhao, R., A. Zhou, y K. Mao. 2016. Au- tion, prevention, and mitigation of cyber- tomatic detection of cyberbullying on so- bullying. En IJCAI International Joint cial networks based on bullying features. Conference on Artificial Intelligence, vo- En Proceedings of the 17th International lumen 2015-Janua, páginas 4168–4172. Conference on Distributed Computing and Fundación ANAR, F. M. 2017. II Estudio Networking - ICDCN ’16, páginas 1–6. sobre acoso escolar y ciberbulling según los afectados. Fundación ANAR, páginas 1–96. Garaigordobil, M. 2011. Prevalencia y con- secuencias del cyberbullying: una revisión. Journal of Psychology and Psychological Therapy, 11(2):233–254. Giménez Gualdo, A. M., J. J. Maquilón Sánchez, y P. Arnaiz Sánchez. 2015. Usos problemáticos y agresivos de las TIC por parte de adolescentes implicados en cyber- bullying. Revista de Investigación Educa- tiva, 33(2):335. Kowalski, R. M., S. P. Limber, y P. W. Agats- ton. 2008. Cyber Bullying: The New Mo- ral Frontier. 53