=Paper= {{Paper |id=Vol-2968/paper7 |storemode=property |title=Learnary: Herramienta para el Aprendizaje de Idiomas mediante Datos Enlazados |pdfUrl=https://ceur-ws.org/Vol-2968/paper7.pdf |volume=Vol-2968 |authors=Salud Marı́a Jiménez-Zafra,Marı́a Teresa Martı́n-Valdivia,Carolina Cubillo-Garcı́a,Miguel Ángel Garcı́a-Cumbreras,Daniel Garcı́a-Baena |dblpUrl=https://dblp.org/rec/conf/sepln/ZafraMCCG21 }} ==Learnary: Herramienta para el Aprendizaje de Idiomas mediante Datos Enlazados== https://ceur-ws.org/Vol-2968/paper7.pdf
       Learnary: Herramienta para el Aprendizaje de
            Idiomas mediante Datos Enlazados
        Learnary: Language Learning Tool using Linked Data
            Salud Marı́a Jiménez-Zafra1 , Marı́a Teresa Martı́n-Valdivia1 ,
            Carolina Cubillo-Garcı́a2 , Miguel Ángel Garcı́a-Cumbreras1 ,
                                  Daniel Garcı́a-Baena3
    1
      Departamento de Informática, SINAI, CEATIC, Universidad de Jaén, Jaén, España
                             {sjzafra, maite, magc}@ujaen.es
                                   2
                                     Renfe, Madrid, España
                             carolinacubillogarcia@gmail.com
                    3
                      I.E.S. San Juan de la Cruz, Úbeda (Jaén), España
                                 daniel.gbaena@gmail.com

       Resumen: Learnary es una herramienta web para facilitar el aprendizaje de idio-
       mas, en concreto inglés y español, que hace uso de distintas fuentes de datos enlaza-
       dos, como BabelNet, Wikipedia o WordNet. Por medio de los datos enlazados, este
       sistema proporciona más información de la que se puede obtener en un traductor
       sobre una palabra, como por ejemplo imágenes, descripciones, sinónimos, antónimos,
       etc., con el objetivo de ayudar a los usuarios en su compresión.
       Palabras clave: Datos enlazados, aprendizaje de idiomas, BabelNet, Wikipedia,
       WordNet, Babelfy, Yandex.
       Abstract: Learnary is a web tool to facilitate language learning, specifically En-
       glish and Spanish, that makes use of different linked data sources, such as BabelNet,
       Wikipedia or WordNet. By means of linked data, this system provides more informa-
       tion about a word than can be obtained in a translator, such as images, descriptions,
       synonyms, antonyms, etc., in order to help users understand it.
       Keywords: Linked data, language learning, BabelNet, Wikipedia, WordNet, Ba-
       belfy, Yandex.
1     Introducción                                                                             aparición del alzhéimer.
El aprendizaje de idiomas es fundamental en                                                 • Aumenta nuestra capacidad de reacción
la sociedad actual. Cada vez son más los es-                                                 a la hora de tomar decisiones.
cenarios en los que resulta imprescindible do-
minar diferentes lenguas. Las ventajas de co-                                               • Mejora la agilidad mental.
nocer más de un idioma son muy diversas,                                                 ¿Cómo pueden ayudar los datos enlazados
desde incrementar la posibilidad de conseguir                                          en el aprendizaje de un idioma? En primer lu-
un trabajo hasta enriquecer la vida social y                                           gar, definiremos qué son los datos enlazados
cultural. Según el Instituto Nacional de Eva-                                         (Bizer, Heath, y Berners-Lee, 2011). Los da-
luación y Calidad del Sistema Educativo, en                                           tos enlazados son datos estructurados que se
España, más de cinco millones de alumnos es-                                         interrelacionan con otros datos para facilitar
tudian idiomas, el 82 % de los mismos, inglés.                                        el acceso a la información, de manera que se
Además, cientı́ficamente se ha estudiado el                                           pueda ir navegando entre datos relacionados
impacto en nuestro cerebro cuando decidi-                                              de diferentes fuentes.
mos aprender idiomas distintos al materno                                                 Los datos enlazados permiten que se mues-
y se ha demostrado que (Craik, Bialystok,                                              tre mucha más información de una palabra
y Freedman, 2010; Bialystok, Craik, y Luk,                                             que la que se puede obtener en un dicciona-
2012; Yang et al., 2015):                                                              rio o traductor, como por ejemplo acceder a
    • Mejora nuestra capacidad de concentra-                                           más de una definición de una palabra, con-
      ción y nuestra memoria.                                                         sultar la transcripción u obtener sinónimos y
                                                                                       antónimos.
    • Retrasa al menos cinco años la posible                                             En este trabajo presentamos Learnary,
            Copyright © 2021 for this paper by its authors. Use permitted under Creative Commons License Attribution 4.0 International (CC BY 4.0).



                                                                               25
una demo cuyo objetivo es facilitar el apren-                   contiene todos los sinónimos que expre-
dizaje de idiomas, en concreto español e                       san ese significado en diferentes idiomas.
inglés, haciendo uso de distintas fuentes de                   Cada Babel synset se identifica por un
datos enlazados, como BabelNet (Navigli y                       id.
Ponzetto, 2012), Wikipedia (Völkel et al.,
2006) o WordNet (Miller, 1995).                            • Babelfy (Moro, Raganato, y Navigli,
                                                             2014): algoritmo que vinvula entidades
2     Motivación                                            y desambigua el sentido de las palabras
Aprender un idioma no es fácil y es una ta-                 seleccionando interpretaciones semánti-
rea cuya dificultad aumenta sobre todo con la                cas de alta coherencia. Se basa en la red
edad. Esto se debe a que los lenguajes son sis-              semántica multilingüe de BabelNet.
temas extensos y complejos de simbolización.
Sus fonemas, vocabulario y sus reglas grama-               • Wikipedia (Völkel et al., 2006): enciclo-
ticales difieren de los de la lengua materna.                pedia libre, polı́glota y editada de mane-
Además, cuando se aprende un idioma y se                    ra colaborativa.
lee un texto a menudo cuesta entender su vo-
cabulario. En este punto los datos enlazados               • WordNet (Miller, 1995): base de datos
pueden ofrecer una gran ayuda, permitiendo                   léxica que agrupa palabras en conjuntos
que un usuario que no entiende una palabra                   de sinónimos llamados synsets, propor-
o un conjunto de ellas, pueda obtener más in-               cionando definiciones cortas y generales
formación de las mismas (imágenes, descrip-                y almacenando la relaciones semánticas
ciones, sinónimos, antónimos, traducciones,                entre las palabras (sinónimos, hipónimos
etc.).                                                       y merónimos).

3     Descripción del sistema                             • Yandex1 : servicio gratuito multilingüe
                                                             de traducción automática, desarrollado
Learnary es una aplicación web capaz de pro-
                                                             y proporcionado por Yandex, para tra-
cesar textos en inglés y en español, ofrecien-
                                                             ducir texto, voz, imágenes o vı́deos en
do un análisis detallado de las palabras de
                                                             tiempo real de un idioma a otro.
estos textos para facilitar el aprendizaje de
idiomas. Esta herramienta se ha construido
                                                            En la parte izquierda, aparece una caja
haciendo uso de los lenguajes de programa-
                                                         de texto donde el usuario puede escribir, o
ción Python, HTML, CSS, y JavaScript, y de
                                                         copiar y pegar, el texto que desea analizar.
los frameworks Flask, Boostrap y JQuery. La
plantilla de colores de la misma se ha selec-
cionado realizando un estudio de anomalı́as
                                                         3.2      Procesamiento inicial del texto
visuales (protanopia, deuteranopia, tritano-             Una vez que el usuario ha introducido el texto
pia, acromatopsia, protanomalı́a, deuterano-             y ha pulsado el botón “Analizar”, el sistema
malı́a, tritanomalı́a y acromatomalı́a) para             se encarga de procesarlo.
asegurar que cualquier persona pueda ver co-                 En primer lugar, se realiza una desambi-
rrectamente el contenido de la página.                  guación de los términos haciendo uso de la
3.1     Entrada del texto                                API HTTP de Babelfy2 para obtener el iden-
                                                         tificador asociado a cada término (synset id ).
En la Figura 1 se muestra la página principal           Este procesamiento inicial permite identificar
de Learnary. Está disponible en dos idiomas,            los términos sobre los cuales hay información
inglés y español (por defecto en español). En         en las fuentes de datos enlazados.
la parte derecha de la misma se describen las
                                                             Tras procesar el texto, en la parte izquier-
fuentes de datos enlazados y los recursos uti-
                                                         da de la herramienta, aparecerá dicho texto
lizados:
                                                         con algunas palabras marcadas en color azul
    • BabelNet (Navigli y Ponzetto, 2012): red           y con otras palabras en color negro. Las pala-
      semántica multilingüe que integra cono-          bras marcadas en azul son las que se podrán
      cimiento lexicográfico y enciclopédico de        consultar, es decir, aquellas para las cuales se
      WordNet y Wikipedia. Está compuesta               ha obtenido información (Figura 2).
      por unos 15 millones de Babel synsets.
      Cada Babel synset es una entrada de Ba-              1
                                                               https://translate.yandex.com/
                                                           2
      belNet que representa un significado y                   http://babelfy.org/guide




                                                    26
                                   Figura 1: Learnary - Página principal.

                                                         id asociado a la palabra, obtenido en el proce-
                                                         samiento inicial con Babelfy. Además, el lema
                                                         obtenido se utiliza para consultar la API Me-
                                                         diaWiki4 de Wikipedia, para ofrecer al usua-
                                                         rio otras definiciones de la palabra diferentes
                                                         a la obtenida con BabelNet. Los sinónimos
                                                         y antónimos se extraen consultando la base
                                                         de datos WordNet con el synset id de la pa-
                                                         labra. Por último, la traducción se ofrece en
                                                         español/inglés, francés, italiano y alemán por
                                                         medio de la API del traductor Yandex5 .




 Figura 2: Learnary - Procesamiento inicial.

3.3      Consulta de una palabra y
         recuperación de información
Para consultar las palabras sobre las que exis-
te información (palabras azules), se deberá
hacer clic encima de ellas. Cuando el usua-
rio pulse sobre una palabra azul, se recupe-             Figura 3: Información extraı́da y relación en-
rará toda la información disponible sobre ella         tre las fuentes de datos.
en las distintas fuentes de datos (BabelNet,                 Finalizado este proceso, en la parte dere-
WordNet, Wikipedia y Yandex). A continua-                cha de la pantalla, se mostrará toda la infor-
ción, se especifica qué información se extrae         mación disponible para la palabra seleccio-
de cada fuente y cómo se relacionan entre               nada: nombre, categorı́a gramatical, descrip-
ellas (Figura 3). El lema de la palabra, la              ción, imagen, sinónimos, antónimos, trans-
imagen, la categorı́a gramatical, la descrip-            cripción, traducción y otras definiciones. En
ción y la transcripción se obtienen consultan-         la Figura 4 se puede ver el resultado de con-
do la API HTTP de BabelNet3 con el synset
                                                           4
                                                               https://www.mediawiki.org/wiki/API:Main page/es
  3                                                        5
      https://babelnet.org/guide                               https://yandex.com/dev/translate/




                                                    27
                           Figura 4: Learnary - Consulta de una palabra.

sultar la palabra “casa”. Para visualizar la                brain.    Trends in cognitive sciences,
información de un tipo concreto de informa-                16(4):240–250.
ción, ej. sinónimos, se deberá hacer clic en el        Bizer, C., T. Heath, y T. Berners-Lee. 2011.
elemento azul con este nombre y se desple-                   Linked data: The story so far. En Seman-
gará toda la información relacionada.                      tic services, interoperability and web ap-
                                                             plications: emerging concepts. IGI global,
4     Conclusiones y trabajo futuro
                                                             páginas 205–227.
En este trabajo se ha presentado Learnary,
un prototipo para facilitar el aprendizaje de             Craik, F. I., E. Bialystok, y M. Freedman.
idiomas, en concreto inglés y español, me-                2010. Delaying the onset of alzheimer di-
diante el uso de datos enlazados.                           sease: Bilingualism as a form of cognitive
   Como posible trabajo futuro nos plantea-                 reserve. Neurology, 75(19):1726–1729.
mos algunos aspectos en los que podrı́a me-               Miller, G. A. 1995. Wordnet: a lexical data-
jorarse la aplicación:                                     base for english. Communications of the
                                                            ACM, 38(11):39–41.
    • Ampliación a más idiomas.
                                                          Moro, A., A. Raganato, y R. Navigli. 2014.
    • Tratamiento de la coherencia léxica para             Entity Linking meets Word Sense Disam-
      ofrecer definiciones más acordes al con-             biguation: a Unified Approach. Transac-
      texto.                                                tions of the Association for Computational
    • Inclusión de más información sobre la              Linguistics (TACL), 2:231–244.
      palabra buscada, por ejemplo, su pro-               Navigli, R. y S. P. Ponzetto. 2012. Babel-
      nunciación.                                          net: The automatic construction, evalua-
    • Introducción de texto por voz.                       tion and application of a wide-coverage
                                                            multilingual semantic network. Artificial
Agradecimientos                                             intelligence, 193:217–250.
Este trabajo ha sido parcialmente financiado              Völkel, M., M. Krötzsch, D. Vrandecic,
por el Fondo Social Europeo, la Administra-                  H. Haller, y R. Studer. 2006. Semantic wi-
ción de la Junta de Andalucı́a (DOC 01073),                 kipedia. En Proceedings of the 15th inter-
el Fondo Europeo de Desarrollo Regio-                        national conference on World Wide Web,
nal (FEDER) y el proyecto LIVING-LANG                        páginas 585–594.
(RTI2018-094653-B-C21) del Gobierno de                    Yang, J., K. M. Gates, P. Molenaar, y P. Li.
España.                                                    2015. Neural changes underlying success-
Bibliografı́a                                               ful second language word learning: An
                                                            fmri study. Journal of Neurolinguistics,
Bialystok, E., F. I. Craik, y G. Luk. 2012.                 33:29–49.
   Bilingualism: consequences for mind and



                                                     28