=Paper=
{{Paper
|id=Vol-2968/paper7
|storemode=property
|title=Learnary: Herramienta para el Aprendizaje de Idiomas mediante Datos Enlazados
|pdfUrl=https://ceur-ws.org/Vol-2968/paper7.pdf
|volume=Vol-2968
|authors=Salud Marı́a Jiménez-Zafra,Marı́a Teresa Martı́n-Valdivia,Carolina Cubillo-Garcı́a,Miguel Ángel Garcı́a-Cumbreras,Daniel Garcı́a-Baena
|dblpUrl=https://dblp.org/rec/conf/sepln/ZafraMCCG21
}}
==Learnary: Herramienta para el Aprendizaje de Idiomas mediante Datos Enlazados==
Learnary: Herramienta para el Aprendizaje de
Idiomas mediante Datos Enlazados
Learnary: Language Learning Tool using Linked Data
Salud Marı́a Jiménez-Zafra1 , Marı́a Teresa Martı́n-Valdivia1 ,
Carolina Cubillo-Garcı́a2 , Miguel Ángel Garcı́a-Cumbreras1 ,
Daniel Garcı́a-Baena3
1
Departamento de Informática, SINAI, CEATIC, Universidad de Jaén, Jaén, España
{sjzafra, maite, magc}@ujaen.es
2
Renfe, Madrid, España
carolinacubillogarcia@gmail.com
3
I.E.S. San Juan de la Cruz, Úbeda (Jaén), España
daniel.gbaena@gmail.com
Resumen: Learnary es una herramienta web para facilitar el aprendizaje de idio-
mas, en concreto inglés y español, que hace uso de distintas fuentes de datos enlaza-
dos, como BabelNet, Wikipedia o WordNet. Por medio de los datos enlazados, este
sistema proporciona más información de la que se puede obtener en un traductor
sobre una palabra, como por ejemplo imágenes, descripciones, sinónimos, antónimos,
etc., con el objetivo de ayudar a los usuarios en su compresión.
Palabras clave: Datos enlazados, aprendizaje de idiomas, BabelNet, Wikipedia,
WordNet, Babelfy, Yandex.
Abstract: Learnary is a web tool to facilitate language learning, specifically En-
glish and Spanish, that makes use of different linked data sources, such as BabelNet,
Wikipedia or WordNet. By means of linked data, this system provides more informa-
tion about a word than can be obtained in a translator, such as images, descriptions,
synonyms, antonyms, etc., in order to help users understand it.
Keywords: Linked data, language learning, BabelNet, Wikipedia, WordNet, Ba-
belfy, Yandex.
1 Introducción aparición del alzhéimer.
El aprendizaje de idiomas es fundamental en • Aumenta nuestra capacidad de reacción
la sociedad actual. Cada vez son más los es- a la hora de tomar decisiones.
cenarios en los que resulta imprescindible do-
minar diferentes lenguas. Las ventajas de co- • Mejora la agilidad mental.
nocer más de un idioma son muy diversas, ¿Cómo pueden ayudar los datos enlazados
desde incrementar la posibilidad de conseguir en el aprendizaje de un idioma? En primer lu-
un trabajo hasta enriquecer la vida social y gar, definiremos qué son los datos enlazados
cultural. Según el Instituto Nacional de Eva- (Bizer, Heath, y Berners-Lee, 2011). Los da-
luación y Calidad del Sistema Educativo, en tos enlazados son datos estructurados que se
España, más de cinco millones de alumnos es- interrelacionan con otros datos para facilitar
tudian idiomas, el 82 % de los mismos, inglés. el acceso a la información, de manera que se
Además, cientı́ficamente se ha estudiado el pueda ir navegando entre datos relacionados
impacto en nuestro cerebro cuando decidi- de diferentes fuentes.
mos aprender idiomas distintos al materno Los datos enlazados permiten que se mues-
y se ha demostrado que (Craik, Bialystok, tre mucha más información de una palabra
y Freedman, 2010; Bialystok, Craik, y Luk, que la que se puede obtener en un dicciona-
2012; Yang et al., 2015): rio o traductor, como por ejemplo acceder a
• Mejora nuestra capacidad de concentra- más de una definición de una palabra, con-
ción y nuestra memoria. sultar la transcripción u obtener sinónimos y
antónimos.
• Retrasa al menos cinco años la posible En este trabajo presentamos Learnary,
Copyright © 2021 for this paper by its authors. Use permitted under Creative Commons License Attribution 4.0 International (CC BY 4.0).
25
una demo cuyo objetivo es facilitar el apren- contiene todos los sinónimos que expre-
dizaje de idiomas, en concreto español e san ese significado en diferentes idiomas.
inglés, haciendo uso de distintas fuentes de Cada Babel synset se identifica por un
datos enlazados, como BabelNet (Navigli y id.
Ponzetto, 2012), Wikipedia (Völkel et al.,
2006) o WordNet (Miller, 1995). • Babelfy (Moro, Raganato, y Navigli,
2014): algoritmo que vinvula entidades
2 Motivación y desambigua el sentido de las palabras
Aprender un idioma no es fácil y es una ta- seleccionando interpretaciones semánti-
rea cuya dificultad aumenta sobre todo con la cas de alta coherencia. Se basa en la red
edad. Esto se debe a que los lenguajes son sis- semántica multilingüe de BabelNet.
temas extensos y complejos de simbolización.
Sus fonemas, vocabulario y sus reglas grama- • Wikipedia (Völkel et al., 2006): enciclo-
ticales difieren de los de la lengua materna. pedia libre, polı́glota y editada de mane-
Además, cuando se aprende un idioma y se ra colaborativa.
lee un texto a menudo cuesta entender su vo-
cabulario. En este punto los datos enlazados • WordNet (Miller, 1995): base de datos
pueden ofrecer una gran ayuda, permitiendo léxica que agrupa palabras en conjuntos
que un usuario que no entiende una palabra de sinónimos llamados synsets, propor-
o un conjunto de ellas, pueda obtener más in- cionando definiciones cortas y generales
formación de las mismas (imágenes, descrip- y almacenando la relaciones semánticas
ciones, sinónimos, antónimos, traducciones, entre las palabras (sinónimos, hipónimos
etc.). y merónimos).
3 Descripción del sistema • Yandex1 : servicio gratuito multilingüe
de traducción automática, desarrollado
Learnary es una aplicación web capaz de pro-
y proporcionado por Yandex, para tra-
cesar textos en inglés y en español, ofrecien-
ducir texto, voz, imágenes o vı́deos en
do un análisis detallado de las palabras de
tiempo real de un idioma a otro.
estos textos para facilitar el aprendizaje de
idiomas. Esta herramienta se ha construido
En la parte izquierda, aparece una caja
haciendo uso de los lenguajes de programa-
de texto donde el usuario puede escribir, o
ción Python, HTML, CSS, y JavaScript, y de
copiar y pegar, el texto que desea analizar.
los frameworks Flask, Boostrap y JQuery. La
plantilla de colores de la misma se ha selec-
cionado realizando un estudio de anomalı́as
3.2 Procesamiento inicial del texto
visuales (protanopia, deuteranopia, tritano- Una vez que el usuario ha introducido el texto
pia, acromatopsia, protanomalı́a, deuterano- y ha pulsado el botón “Analizar”, el sistema
malı́a, tritanomalı́a y acromatomalı́a) para se encarga de procesarlo.
asegurar que cualquier persona pueda ver co- En primer lugar, se realiza una desambi-
rrectamente el contenido de la página. guación de los términos haciendo uso de la
3.1 Entrada del texto API HTTP de Babelfy2 para obtener el iden-
tificador asociado a cada término (synset id ).
En la Figura 1 se muestra la página principal Este procesamiento inicial permite identificar
de Learnary. Está disponible en dos idiomas, los términos sobre los cuales hay información
inglés y español (por defecto en español). En en las fuentes de datos enlazados.
la parte derecha de la misma se describen las
Tras procesar el texto, en la parte izquier-
fuentes de datos enlazados y los recursos uti-
da de la herramienta, aparecerá dicho texto
lizados:
con algunas palabras marcadas en color azul
• BabelNet (Navigli y Ponzetto, 2012): red y con otras palabras en color negro. Las pala-
semántica multilingüe que integra cono- bras marcadas en azul son las que se podrán
cimiento lexicográfico y enciclopédico de consultar, es decir, aquellas para las cuales se
WordNet y Wikipedia. Está compuesta ha obtenido información (Figura 2).
por unos 15 millones de Babel synsets.
Cada Babel synset es una entrada de Ba- 1
https://translate.yandex.com/
2
belNet que representa un significado y http://babelfy.org/guide
26
Figura 1: Learnary - Página principal.
id asociado a la palabra, obtenido en el proce-
samiento inicial con Babelfy. Además, el lema
obtenido se utiliza para consultar la API Me-
diaWiki4 de Wikipedia, para ofrecer al usua-
rio otras definiciones de la palabra diferentes
a la obtenida con BabelNet. Los sinónimos
y antónimos se extraen consultando la base
de datos WordNet con el synset id de la pa-
labra. Por último, la traducción se ofrece en
español/inglés, francés, italiano y alemán por
medio de la API del traductor Yandex5 .
Figura 2: Learnary - Procesamiento inicial.
3.3 Consulta de una palabra y
recuperación de información
Para consultar las palabras sobre las que exis-
te información (palabras azules), se deberá
hacer clic encima de ellas. Cuando el usua-
rio pulse sobre una palabra azul, se recupe- Figura 3: Información extraı́da y relación en-
rará toda la información disponible sobre ella tre las fuentes de datos.
en las distintas fuentes de datos (BabelNet, Finalizado este proceso, en la parte dere-
WordNet, Wikipedia y Yandex). A continua- cha de la pantalla, se mostrará toda la infor-
ción, se especifica qué información se extrae mación disponible para la palabra seleccio-
de cada fuente y cómo se relacionan entre nada: nombre, categorı́a gramatical, descrip-
ellas (Figura 3). El lema de la palabra, la ción, imagen, sinónimos, antónimos, trans-
imagen, la categorı́a gramatical, la descrip- cripción, traducción y otras definiciones. En
ción y la transcripción se obtienen consultan- la Figura 4 se puede ver el resultado de con-
do la API HTTP de BabelNet3 con el synset
4
https://www.mediawiki.org/wiki/API:Main page/es
3 5
https://babelnet.org/guide https://yandex.com/dev/translate/
27
Figura 4: Learnary - Consulta de una palabra.
sultar la palabra “casa”. Para visualizar la brain. Trends in cognitive sciences,
información de un tipo concreto de informa- 16(4):240–250.
ción, ej. sinónimos, se deberá hacer clic en el Bizer, C., T. Heath, y T. Berners-Lee. 2011.
elemento azul con este nombre y se desple- Linked data: The story so far. En Seman-
gará toda la información relacionada. tic services, interoperability and web ap-
plications: emerging concepts. IGI global,
4 Conclusiones y trabajo futuro
páginas 205–227.
En este trabajo se ha presentado Learnary,
un prototipo para facilitar el aprendizaje de Craik, F. I., E. Bialystok, y M. Freedman.
idiomas, en concreto inglés y español, me- 2010. Delaying the onset of alzheimer di-
diante el uso de datos enlazados. sease: Bilingualism as a form of cognitive
Como posible trabajo futuro nos plantea- reserve. Neurology, 75(19):1726–1729.
mos algunos aspectos en los que podrı́a me- Miller, G. A. 1995. Wordnet: a lexical data-
jorarse la aplicación: base for english. Communications of the
ACM, 38(11):39–41.
• Ampliación a más idiomas.
Moro, A., A. Raganato, y R. Navigli. 2014.
• Tratamiento de la coherencia léxica para Entity Linking meets Word Sense Disam-
ofrecer definiciones más acordes al con- biguation: a Unified Approach. Transac-
texto. tions of the Association for Computational
• Inclusión de más información sobre la Linguistics (TACL), 2:231–244.
palabra buscada, por ejemplo, su pro- Navigli, R. y S. P. Ponzetto. 2012. Babel-
nunciación. net: The automatic construction, evalua-
• Introducción de texto por voz. tion and application of a wide-coverage
multilingual semantic network. Artificial
Agradecimientos intelligence, 193:217–250.
Este trabajo ha sido parcialmente financiado Völkel, M., M. Krötzsch, D. Vrandecic,
por el Fondo Social Europeo, la Administra- H. Haller, y R. Studer. 2006. Semantic wi-
ción de la Junta de Andalucı́a (DOC 01073), kipedia. En Proceedings of the 15th inter-
el Fondo Europeo de Desarrollo Regio- national conference on World Wide Web,
nal (FEDER) y el proyecto LIVING-LANG páginas 585–594.
(RTI2018-094653-B-C21) del Gobierno de Yang, J., K. M. Gates, P. Molenaar, y P. Li.
España. 2015. Neural changes underlying success-
Bibliografı́a ful second language word learning: An
fmri study. Journal of Neurolinguistics,
Bialystok, E., F. I. Craik, y G. Luk. 2012. 33:29–49.
Bilingualism: consequences for mind and
28