Aproximación al modelado del ciberbullying desde las Tecnologı́as del Lenguaje Humano Approach to modeling of cyberbullying from the perspective of the human language technologies Beatriz Botella Gil Dpt. Leng. y Sist. Inf. Univ. de Alicante E-03080 Alicante Beatriz.botella@ua.es Resumen: Según el INE, el 98,8 % de jóvenes y menores tienen teléfono móvil con acceso a Internet. Con mirar estas cifras podemos ser conscientes de la cercanı́a que hay entre las TIC (Teorı́as de la información y de la comunicación) y los menores. En esta investigación se quiere reflejar la gravedad del asunto del ciberbullying y centrar el trabajo en la búsqueda de toda la información posible para delimitar el problema y poder crear una herramienta a través de Machine Learning que permita la detección automática del ciberbullying. El fin es encontrar posibles soluciones a la problemática tan grave que existe actualmente sobre el acoso en la red entre menores. Palabras clave: ciberbullying, acoso en Internet, violencia en la red, tecnologı́as de la información y de la comunicación, TLH, modelado del comportamiento. Abstract: According to the INE, 98.8 % young people and children have a mobile phone with Internet access. By looking at these figures we can be aware of the close relation between ICTs and minors. This research wants to reflect the seriousness of the issue of cyberbullying. We want to focus the work on the search of all the possible information to delimit the problem and to be able to create a tool through Machine Learning that allows the automatic detection of cyberbullying. The aim is to find possible solutions to the serious problem that currently exists on harassment in the network amongs youngsters. Keywords: cyberbullying, Internet harassment,Violence in the network, Technology of the information and communication, HLT, behavioral modeling. 1 Motivación de la investigación Según el INE, de 16.029.823 viviendas que existen, el 96,7 % tiene teléfono móvil y un Vivimos en una sociedad conectada digital- 81,9 % disponen de acceso a Internet. Y en el mente. Nuestra forma de vida ha evoluciona- caso de los jóvenes y menores cuya edad está do de la de hace 10 años con la aparición de comprendida entre los 16 y los 24 años encon- las nuevas tecnologı́as y el uso inmediato de tramos que el 98,8 % tienen teléfono móvil. Internet. Esto nos ha facilitado una mayor re- Uno de los objetivos prioritarios a solucio- lación con el mundo y un acercamiento a la nar es la problemática del llamado ciberbull- información de manera rápida. ying o acoso en la red. Este problema que Nuestras formas de comunicar han cam- crece cada año en todo el mundo, es una evo- biado y las redes sociales cobran fuerza y lución del acoso escolar que vienen sufrien- se implantan en nuestra sociedad, en parte do muchos menores en los colegios e institu- ayudándonos a relacionarnos con las perso- tos desde hace muchos años (Garaigordobil, nas, y en otra parte propiciando algunos ti- 2011). pos de violencia que cada año va aumentando El principal motivo de que el acoso en la en número y duración (Povedano et al., 2015; red esté aumentando y el número de casos sea Sádaba Chalezquer, Charo and Bringué Sala, mucho más elevado que el bullying se debe 2010; Álvarez-Garcı́a et al., 2011). principalmente al anonimato de los acosado- res, que pueden ejercer su violencia sobre el investigación nueva y separarlo del llamado acosado sin tener repesalias, ya que a través bullying o acoso escolar. de Internet pueden hacerlo sin dar a conocer Mientras que el bullying se ciñe exclusiva- su identidad. mente al ámbito escolar, el ciberbullying es Además, no pueden ver cómo ha afectado un problema de acoso entre menores a través a la vı́ctima el acto realizado ya que al no de las TIC. hacerlo de manera presencial no se ve fı́sica- Cada año aumentan las cifras del acoso en mente a la vı́ctima lo que hubiera facilitado la red, y es por ello que se ha incrementado el la empatı́a del acosador. número de artı́culos en referencia a este tema, Como punto importante a tener en cuenta vistos siempre desde la perspectiva de reflejar es el grado de urgencia de este caso, ya que en cuales son los porcentajes de casos existentes el caso de acoso escolar la violencia impartida en nuestra sociedad. solo se creaba en el centro educativo o en sus Algunos trabajos utilizados en esta inves- alrededores, pero en el caso de ciberbullying tigación y que se han relacionado con las in- pueden ser las 24 horas del dı́a. vestigaciones de ciberbullying son : A través de los medios de los que dispo- nemos hoy en dı́a es muy fácil poder seguir - Libro Cyber Bullying , el acoso en la era acosando y persiguiendo al acosado en cual- digital. Robin Kowalski, Susan Limber, quier parte del mundo (Álvarez-Garcı́a et al., Patricia Agatston (Kowalski, Limber, y 2011; Calvete et al., 2010). Agatston, 2008). El problema del ciberbullying aumenta ca- En este libro que trata de acoso ci- da año, y desde 2014 se ha incrementado en bernético podemos encontrar desde la un 240 %, según ha publicado la fundación definición del problema hasta posibles ANAR en su II Estudio sobre el ciberbull- soluciones. También incluye la normati- ying, dato muy elevado que debemos investi- va legal y polı́ticas especı́ficas. Recoge gar. datos de entrevistas reales con los estu- Como punto de partida, debemos definir diantes y con los padres. qué es el ciberbullying de una manera veraz - II Estudio sobre acoso escolar y ciber- (Sádaba Chalezquer, Charo and Bringué Sa- bullying según los afectados. Fundación la, 2010). Lo definen como el uso malévolo y Anar. (Fundación ANAR, 2017). cruel de las tecnologı́as por parte de un agre- Con este informe quieren dar a conocer sor o agresores para humillar y vejar a una la evolución del acoso escolar y del ci- vı́ctima, considerada como débil e indefensa, berbullying entre las vı́ctimas y los cam- ante una audiencia amplia de espectadores. bios producidos en sus entornos detec- El ciberbullying supone un nuevo reto pa- tados en el último año. Se basa en casos ra las escuelas por su peligrosa extensión (von reales que conocen gracias a las llamadas Marées y Petermann, 2012). Y las formas que se han producido a esta fundación, en que sucede y las terribles consecuencias tanto de vı́ctimas como de sus familiares. que afectan al bienestar psicológico de todos Nos da información real de porcentajes y sus implicados, provocando desajustes psico- datos estadı́sticos de como se encuentra sociales y psicopatológicos. en la actualidad el problema. 2 Antecedentes y trabajos - Artı́culo Usos problemáticos y agresi- relacionados vos de las TIC por parte de ado- lescentes implicados en cyberbullying El interés por esta materia viene dado por (Giménez Gualdo, Maquilón Sánchez, y el alarmante crecimiento de casos de ciber- Arnaiz Sánchez, 2015). bullying en la sociedad actual. En 2016 se ha incrementado este suceso en un 87,7 % con El siguiente estudio examina la exten- 1.207 casos registrados, además de estas ci- sión y caracterı́sticas del cyberbullying fras, llama la atención que la edad de menores en una muestra de escolares y el uso pro- que lo sufren a disminuido. blemático y de posible adicción de los El término ciberbullying nace con la apa- implicados (ciberacosadores y cibervı́cti- rición de las TIC (Tecnologı́as de la infor- mas) que hacen de las TIC. mación y de la comunicación) en nuestra so- - Common Sense Reasoning for Detec- ciedad. El primer paso fue crear un área de tion, Prevention, and Mitigation of Cy- berbullying KARTHIK (Dinakar, Pi- los datos personales en Internet (Saba- card, y Lieberman, 2015). ter Fernández, Carmen y Lara López, Trabajan en la detección de intimidación Hernández, 2015). basado en el procesamiento del lengua- El artı́culo expone el aumento del ciber- je natural. Analizan la apariencia, inteli- bullying debido a la expansión de las gencia, insultos raciales y étnicos, acep- nuevas tecnologı́as. Nos habla del con- tación social y rechazo; y una vez ana- cepto, sus diferencias con el acoso y los lizado estos procesos crean una base de principales factores de riesgo. El objetivo conocimiento de ”sentido común”que co- principal en su investigación es el análi- difica conocimientos particulares sobre sis de la relación entre sufrir ciberacoso y situaciones de intimidación. Además en- realizar ciberacoso. Utiliza variables co- señan a las vı́ctimas a hacer frente a este mo el perfil demográfico, la frecuencia, la problema y los conecta entre sı́ en lo que intensisdad y el tipo de uso de las TIC en llaman “apoyo emocional”. los jóvenes. Toda esta información es ex- - Automatic Detection of Cyberbullying on traida de las encuestas realizadas a 400 Social Networks based on Bullying Fea- jóvenes de 14 a 20 años. tures (Zhao, Zhou, y Mao, 2016). Proponen un programa para la detec- 3 Metodologı́a de investigación ción del acoso cibernético. Usan una lis- ta con palabras e insultos para determi- A través de la investigación de artı́culos nar el nivel de intimidación existente en cientı́ficos, informes, libros y material relacio- cada mensaje. Trabajan con la red so- nado con el ciberbullying se pretende escla- cial Twitter cuya finalidad es la creación recer los aspectos más importantes del acoso de un sistema automático de detección en la red en menores para poder aportar so- cibernética para categorizar la informa- luciones a este problema. cion y detectar los casos de ciberbull- Para poder llegar a una solución, primero ying. debemos estudiar y recopilar todos los datos pertenecientes a los casos de ciberbullying, - Artı́culo Cyberbullying in adolescents: cuáles son sus inicios, quién los crea, por qué Modalitites and aggressors’s profile (Cal- motivos, quien los sufre y cuál es su fin. En vete et al., 2010). esta investigación se pretende estudiar el es- Realizan un cuestionario para evaluar la tado de la cuestión del problema y plantear prevalencia de numerosas modalidades un modelador del ciberbullying orientado a de ciberbullying (formas de violencia, ex- las TLH que nos ayude a conocer detallada- posición a la violencia, aceptación y re- mente el problema, determinando su apari- chazo por los compañeros). En este cues- ción según: tionario recogieron información de la jus- tificación del uso de la violencia, las me- 1. La edad y el género de la victima. didas de agresión y la exposición a la vio- lencia). 2. Su entorno y los lugares donde ocurre el - Artı́culo Cyberbullying detection and ciberbullying. prevention: Data mining and psycholo- 3. Cuáles son los medios y el motivo de que gical perspective (Parime y Suri, 2014). ocurra este acoso. En este trabajo se centran en la minerı́a de datos y técnicas de aprendizaje au- 4. Cuándo empieza y su duración y frecuen- tomático para detectar y prevenir el ci- cia. berbullying. También se discute sobre los 5. Qué lenguaje se utiliza en el acoso y si se factores psicosociales relacionados con el siguen las mismas pautas en la mayorı́a acoso cibernético y como abordar este de los casos. problema. Plantean algunas propuestas para los futuros algorı́tmos que puedan 6. Cuáles son las diferentes fases del proce- detectar y prevenir el ciberbullying. so. - Artı́culo Factores de riesgo en el ci- 7. Cómo se relacionan las fases con su len- berbullying. Frecuencia y exposición de guaje violento o acción. Una vez obtengamos la información nece- - Recogida y búsqueda exhaustiva de in- saria y aprendidas todas las formas y varian- formación en referencia al problema a tes que envuelven al ciberbullying, se traba- tratar. jará en: - Una vez se ha recogido la información a) La construcción de una ontologı́a que de- suficiente, crear una Ontologı́a que nos fina el modelo del comportamiento de es- ayude a tener ordenada nuestra informa- ta problemática. ción y nos facilite el trabajo de investi- gación. b) La recopilación de un corpus de entrena- miento y evaluación para el aprendizaje - Una vez tengamos terminada nuestra on- del modelo de comportamiento. tologı́a, debemos delimitar cuales son las fases del ciberbullying y se procederá c) La realización de pruebas preliminares a realizar una recopilación de un cor- de su aplicación utilizando un sistema de pus de entrenamiento y evaluación para aprendizaje automático. el aprendizaje del modelo de comporta- Con la finalidad de que sea capaz de detec- miento. tar los mensajes que estén relacionados con el - Se programaran pruebas preliminares de ciberbullying. su aplicación utilizando un sistema de 3.1 Objetivos aprendizaje automático. 1. Delimitar los aspectos del ciberbullying - Conseguir poner en marcha el programa con la creación de una Ontologı́a que nos y que éste sea capaz de detectar y señalar facilite nuestra investigación. la presencia de ciberbullying en las redes sociales y en que fase se encuentra. 2. Definir las fases existentes de este pro- blema, necesitamos saber la secuencia de 4 Cuestiones especı́ficas de este problema. investigación 3. Identificación de mensajes violentos con 1. Es posible la detección del ciberbullying el ciberbullying, relacionando palabras a través del Machine Learning para fre- claves o comportamientos que nos ayu- nar la problemática del ciberbullying. den a etiquetarlo en el ciberbullying. 2. Se puede definir con fiabilidad distintas 4. Saber reconocer cada mensaje lanzado fases tiene el acoso entre menores en la en la red con la fase de ciberbullying que red para saber cual es el nivel de grave- corresponde. dad que encontramos en el ciberbullying. 5. Creación de un programa de detección automática del ciberbullying. 3. Se podrı́a crear una alerta automática capaz de avisarnos de que se está gene- rando ciberbullying a un menor. 3.2 Hipótesis 1. El ciberbullying es el acoso más frecuen- Agradecimientos te entre los jóvenes. Esta investigación ha sido financiada par- 2. Cada año incrementa el número de ca- cialmente por la Universidad de Alican- sos de ciberbullying en menores de corta te, la Generalitat Valenciana, el Gobierno edad. Español (Ministerio de Educación, Cultu- 3. Se pueden crear fases de ciberbullying ra y Deporte) y las Ayudas Fundación según los comportamientos reiterados. BBVA a equipos de investigación cientı́fi- ca 2016 mediante los proyectos: TIN2015- 4. Posibilidad de que pueda crearse un pro- 65100-R, TIN2015-65136-C2-2-R, PROME- grama que detecte automáticamente la TEOII/2014/001, GRE16-01 y Análisis de presencia de ciberbullying. Sentimientos Aplicado a la Prevención del Suicidio en las Redes Sociales (ASAP). 3.3 Experimentos propuestos Especial agradecimiento a Patricio Como experimentos para esta investigación Martı́nez Barco y al Departamento de se encuentran los siguientes: Lenguajes y Sistemas Informáticos de la Universidad de Alicante (DLSI) y en parti- gender perspective. International Journal cular a Begoña Almarcha Guillén, Sandra of Clinical and Health Psychology, 15:44– Huedo Martı́nez, Maria Ángeles Herrero 51. Herrero, Saray Zafra e Isabel Moreno Agulló. Sabater Fernández, Carmen y Lara López, Bibliografı́a Hernández. 2015. Factores de riesgo en el ciberbullying. Frecuencia y exposición de Álvarez-Garcı́a, D., J. C. Núñez, L. Álvarez, los datos personales en internet. Revista A. Dobarro, C. Rodrı́guez, y P. González- Internacional de Sociologı́a de la Educa- Castro. 2011. Violencia a través de ción, 4(1):1–25. las tecnologı́as de la información y la co- municación en estudiantes de secundaria. Sádaba Chalezquer, Charo and Bringué Sala, Anales de psicologı́a, 27(1):221–231. X. 2010. Niños y adolescentes españoles ante las pantallas: rasgos configuradores Calvete, E., I. Orue, A. Est??vez, L. Vi- de una generación interactiva. CEE Par- llard??n, y P. Padilla. 2010. Cyber- ticipacion Educativa, 15(June 2009):86– bull1ying in adolescents: Modalities and 104. aggressors’ profile. Computers in Human Behavior, 26(5):1128–1135. von Marées, N. y F. Petermann. 2012. Cy- berbullying: An increasing challenge for Dinakar, K., R. Picard, y H. Lieberman. schools. School Psychology International, 2015. Common sense reasoning for detec- 33(5):467–476, oct. tion, prevention, and mitigation of cyber- Zhao, R., A. Zhou, y K. Mao. 2016. Au- bullying. En IJCAI International Joint tomatic detection of cyberbullying on so- Conference on Artificial Intelligence, vo- cial networks based on bullying features. lumen 2015-Janua, páginas 4168–4172. En Proceedings of the 17th International Fundación ANAR, F. M. 2017. II ESTUDIO Conference on Distributed Computing and SOBRE ACOSO ESCOLAR Y CIBER- Networking - ICDCN ’16, páginas 1–6. BULLYING SEGÚN LOS AFECTADOS. Fundación ANAR, páginas 1–96. Garaigordobil, M. 2011. Prevalencia y con- secuencias del cyberbullying: una revisión. Journal of Psychology and Psychological Therapy, 11(2):233–254. Giménez Gualdo, A. M., J. J. Maquilón Sánchez, y P. Arnaiz Sánchez. 2015. Usos problemáticos y agresivos de las TIC por parte de adolescentes implicados en cyber- bullying. Revista de Investigación Educa- tiva, 33(2):335. Kowalski, R. M., S. P. Limber, y P. W. Agats- ton. 2008. Cyber Bullying: The New Mo- ral Frontier. Parime, S. y V. Suri. 2014. Cyberbull- ying detection and prevention: Data mi- ning and psychological perspective. En 2014 International Conference on Cir- cuits, Power and Computing Technolo- gies, ICCPCT 2014, páginas 1541–1547. Povedano, A., M.-J. Cava, M.-C. Monreal, R. Varela, y G. Musitu. 2015. Internatio- nal Journal of Clinical and Health Psycho- logy Victimization, loneliness, overt and relational violence at the school from a