Arquitetura de Integração e Ontologia de Suporte para Recomendação de Objetos Educacionais em Ambientes Virtuais de Aprendizagem Jorão Gomes Jr.1,2 , Jairo Francisco de Souza1,2 , Fabrício Martins Mendonça1,2 , Regina Braga2 1 Laboratório de Aplicações e Inovação em Computação (LApIC) 2 Programa de Pós-Graduação em Ciência da Computação Universidade Federal de Juiz de Fora (UFJF) 36.360-900 – Juiz de Fora – MG – Brasil {joraojunior, jairo.souza, fabricio.mendonca} @ice.ufjf.br regina.braga@ufjf.edu.br Abstract. The growing current adherence to e-learning and the more recurrent use of Virtual Learning Environments (VLE) has generated a large volume of digital educational data and, consequently, problems in the representation, or- ganization and recovery of information in this context. As a solution in this sce- nario, this research presents an integration architecture that uses an ontology, called Prov4LA, to standardize the generation of learning analytics data and provide support for educational recommendation systems. As partial results, a scenario of application of the proposed architecture is described through a course taught in VLE Moodle with students who participate in the same course and where recommendation events are triggered. Resumo. A crescente adesão pela educação a distância e o uso mais recorrente dos Ambientes Virtuais de Aprendizagem (AVA) tem gerado um grande volume de dados educacionais digitais e, consequentemente, problemas na representa- ção, organização e recuperação de informação nesse contexto. Como uma so- lução, a presente pesquisa apresenta uma arquitetura de integração que utiliza uma ontologia, denominada Prov4LA, para padronizar a geração de dados de learning analytics e prover suporte a sistemas de recomendação educacionais. Como resultados parciais, é descrito um cenário de aplicação da arquitetura proposta através de um curso ministrado no AVA Moodle com alunos que parti- cipam de um mesmo curso e onde são disparados eventos de recomendação. 1. Introdução A crescente adesão pela educação a distância fomenta o uso de Ambientes Virtuais de Aprendizagem (AVA). Consequentemente, o aumento da utilização de recursos educaci- onais virtuais leva a uma grande produção de dados, o que gera problemas e desafios para sua representação e organização. Como uma solução alternativa para tais problemas, o presente trabalho apoia-se na utilização de ontologias e em técnicas de learning analy- tics (LA) [Chatti et al. 2013] para representação e organização do conhecimento da área educacional. Copyright © 2020 for this paper by its authors. Use permitted under Creative Commons License Attribution 4.0 International (CC BY 4.0). O contexto educacional envolve a abrangência de diversos conteúdos informaci- onais. Em geral, a preparação, seleção e divulgação desses conteúdos ficam a cargo do professor [Costa et al. 2013]. Selecionar conteúdos e adaptar-se às necessidades de cada aluno em AVAs é uma tarefa bastante onerosa e complexa para ser feita de manualmente por professores. Nesse contexto, a utilização dos metadados gerados através de técnicas de LA apresentam-se como uma alternativa para resolver tais problemas. Já as ontologias podem ser vistas como modelos de anotação [Uren et al. 2006, Burger et al. 2010, da Silva Lemos and Souza 2020] em uma visão de tratamento semân- tico destinado a dados e metadados envolvidos no processo de representação. Como cada AVA possui uma geração de dados diferente, ainda não existem soluções que padroni- zem, integrem e comuniquem esses diversos tipos de dados com aplicações inteligentes, tornando-se essencial o uso de ontologia para a manutenção e disponibilização de dados de proveniência relacionados aos metadados educacionais [Rosa et al. 2019]. Nesse sentido, a utilização conjunta de ontologias e técnicas de learning analytics possibilita transformar o conteúdo coletado dentro dos AVAs em informações relevantes para o aperfeiçoamento do ensino [Chatti et al. 2013]. Tais conteúdos podem ser usados por aplicações inteligentes, como por exemplo, sistemas de recomendação educacionais [Dwivedi and Roshni 2017], que consomem os metadados e aplicam-nos dentro de um cenário de e-learning. Nesse contexto, o uso de ontologias torna-se uma ótima alternativa [Oliveira et al. 2017]. Sendo assim, esse trabalho propõem uma arquitetura de integração que utiliza uma ontologia desenvolvida para esse cenário, denominada Prov4LA, para padronizar a geração de dados de LA e prover suporte a sistemas de recomendação de conteúdos educacionais. 2. Fundamentação Teórica 2.1. Learning Analytics Learning Analytics (LA) é um estudo voltado para análise de informações extraídas de dados educacionais, a fim de converter o conteúdo coletado em metadados válidos para melhoria dos processos de ensino e aprendizagem [Chatti et al. 2013]. O fluxo de de- senvolvimento do LA tem como fonte primária a coleta dos dados educacionais, o pré- processamento, a aplicação de técnicas de mineração de dados para entendimentos dos mesmo e, por último, a aplicação de métodos computacionais para visualização do conhe- cimento extraído. O objetivo desse processo é, através do conhecimento gerado, discutir tomadas de decisão estratégicas pelos usuários desses sistemas [Dyckhoff et al. 2012]. Dentro de LA, diversos ambientes educacionais podem ser fomentados como é o caso de sistemas de recomendação educacionais [Dwivedi and Roshni 2017]. 2.2. Uso de Ontologias para Representação de Dados na Web Sendo a web um ambiente volátil, onde a produção de conteúdo é livre e dependente apenas do domínio de cada repositório, as publicações ficam inerentes à forma com que cada um dos repositórios de dados produzem e divulgam seus dados. Considerando ainda que a parte da geração de informação é realizada por meios manuais através de anota- ções realizadas por humanos, torna-se um processo de classificação de dados exaustivo e de alto custo, devido as demandas de tempo para produção das tags e as dependên- cias vinculadas ao conhecimento de cada especialista sobre a área trabalhada em questão [Baeza-Yates et al. 2011]. Nesse cenário, o uso de ontologias torna-se essencial para pa- dronizar e interoperar a forma com que esses metadados são gerados [Horrocks 2008]. Com o passar dos anos, diversos padrões para publicação de dados foram propos- tos para o melhoramento da qualidade das informações produzidas, fundamentando o que é chamado de Web Semântica [Berners-Lee et al. 2001]. Dentro da Web Semântica, o termo Dados Ligados ( do inglês, Linked Data) é utilizado para descrever um conjunto de práticas para publicar, conectar, compartilhar e divulgar dados estruturados na Web sobre diversos domínios através do uso de ontologias [Rautenberg et al. 2019]. Seguindo os padrões de dados ligados no cenário educacional, a Onto4LA[Carchedi et al. 2018] é uma ontologia que utiliza conceitos de Dados ligados abertos. Sua utilização é recomen- dada para facilitar e padronizar a integração de dados entre diversos tipos de informações gerados por frameworks voltados para LA. Por meio da Onto4LA é possível modelar a troca de informação através de uma estrutura baseada em eventos. Cada evento apresenta como classes mínimas: um agente, um local, uma duração, uma produção e uma fonte. 2.3. Ontologias para Proveniência de Dados Outra questão importante a ser discutida sobre publicação de dados, tanto na Web quanto em outros contextos, é a manutenção dos dados. Como cada nova informação pode ser gerada de diversas formas em uma mesma aplicação, é importante rastrear a maneira com que cada novo dado é produzido a fim de entender porque, por quem e onde esses dados foram gerados [Cheney et al. 2009]. Com esse objetivo, surgiu a proveniência de dados. Proveniência pode ser compreendida como a informação que pode ser coletada de diversas formas e em diversos níveis de detalhamento [Simmhan et al. 2005]. Proveniên- cia de dados também pode ser compreendida como dados que falam sobre outros dados trazendo, como informações adicionais, a origem e o histórico de modificações do dado original. Para formalizar e padronizar as formas de captura de proveniência de dados, a W3C criou um modelo semântico PROV [Missier et al. 2013, Moreau and Groth 2013].O PROV é composto por um conjunto de documentos construído para que tanto usuários quanto desenvolvedores possam aplicar os conceitos de proveniência em suas aplicações. Dentro da estrutura do PROV, a PROV-O é o modelo utilizado para padronizar a captura de proveniência de dados através de uma ontologia. 3. Arquitetura de Integração e Ontologia Prov4LA 3.1. Prov4LA Embora a Onto4LA, apresentada na Seção 2.2, abranja a maior parte dos frameworks para LA, peca quando o assunto é recomendação de conteúdos educacionais. Por exemplo, em [Barrére et al. 2018] é apresentado um processo de recomendação de vídeos educacionais no AVA Moodle através de indexação e recomendação semântica de videoaulas. O pro- cesso de recomendação utiliza de diversas etapas, desde a utilização de ferramentas de reconhecimento automático de fala, até recomendação baseada em metadados semânti- cos. Através da Onto4LA não é possível identificar quais são as principais ferramentas de recomendação e quais obtiveram os melhores resultados durante a recomendação. Além disso, não é possível avaliar alunos que participam de cursos com assuntos similares para saber se eles são candidatos a receber recomendações similares a de outros alunos com Figura 1. Onto4LA + Recomendação(RecMEM) perfis análogos receberam. Com a necessidade de analisar o cenário de recomendação de mídias educacionais (RecMEM) em AVAs, a Onto4LA foi expandida (Figura 1). A expansão da Onto4LA teve como objetivo inserir novas ferramentas e resul- tados aplicados ligados diretamente com o ambiente de recomendação. Na Figura 1 apresentam-se novas classes, o evento de recomendação e outros eventos ligados ao mo- nitoramento das atividades dos alunos dentro do AVA. A ideia desse monitoramento é além de entender o comportamento de cada aluno durante a utilização de AVAs, gerar metadados que auxiliem também outras ferramentas para o cenário de learning analy- tics, como recomendação de materiais, exercícios, caminhos de aprendizagem, parcei- ros para grupos de estudo, algoritmos de aprendizado curricular adaptativo, entre outros. [Machado et al. 2019, Machado et al. 2020]. Analisando a expansão da Onto4LA para o cenário apresentado no parágrafo an- terior, percebe-se a característica de proveniência de atividades agregada a ela. Afim de formalizar a captura de informação através dos padrões propostos pela W3C criou-se a Prov4LA. A Prov4LA é uma ontologia de proveniência que estende os padrões bási- cos da PROV-O através da Onto4LA + RecMEM. A Figura 2 apresenta a visão geral da Prov4LA demostrando através das linhas tracejadas as classes e propriedades pertencen- tes a Onto4LA. Com essa integração é possível utilizar todas as propriedades da PROV-O para capturar o rastreamento dos dados produzidos além de gerar as inferências próprias da Onto4LA. 3.2. Arquitetura de Integração Proposta Para que seja possível capturar a proveniência dos dados em AVA, é necessário que a Prov4LA seja utilizada de forma correta. Para isso, é fundamental a monitoração da ge- Figura 2. Prov4LA ração de dados dentro do AVA e instanciação dos mesmos dentro da Prov4LA. Pensando nessa integração, é proposto a criação de um plugin que captura os dados gerados no AVAs, processa-os na Prov4LA e, por fim, submete os resultados a aplicações para reco- mendação de conteúdo ou dashboards para monitoramento e avaliação dos dados gerados para LA. No contexto de ambientes virtuais de aprendizagem, a iniciativa de se trabalhar com um plugin torna-se uma alternativa viável, já que é uma pŕatica comum nesse cenário. Por exemplo, para o AVA Moodle já existem diversos plugins utilizados pelo usuários. A Figura 3 apresenta a visão geral do funcionamento da arquitetura. Inicialmente, os alunos serão cadastrados nos cursos de um AVA, no qual irão realizar suas atividades normalmente. O AVA irá disponibilizar o acesso ao material re- quisitado por cada aluno, salvando seus logs de acesso. Nessa etapa, o plugin se integra ao AVA funcionando como um listener entre as requisições realizadas pelo AVA e o acesso ao banco de dados do AVA. Os dados capturados pelo plugin são instanciados (popula- dos) na Prov4LA via OWLAPI 1 , o reasoner é acionado e as inferências são capturadas. Ao fim, o plugin irá trabalhar com um SGBD NoSQL pelo qual os dashboards poderão consultar os resultados processados pela Prov4LA, coletando os históricos de atividade e outras informações para utilização em LA, e os sistemas de recomendação poderão con- sultar quais são os melhores alunos para recomendar determinados assuntos ou então, dado que algum aluno recebeu um recomendação anteriormente, quais outros possuem perfis parecidos e são potenciais para receber a mesma recomendação. A utilização dessa arquitetura torna-se uma alternativa viável, pois utilizando a Prov4LA, além de gerar a proveniência dos dados e facilitar a integração destes entre AVAs, há uma padronização dos dados gerados para aplicações, tanto para o cenário de Learning analytics quanto para sistemas de recomendação de conteúdos educacionais. 3.3. Cenário de Aplicação da Arquitetura Como prova de conceito da arquitetura de integração proposta, esta subseção descreve um cenário possível para sua aplicação da arquitetura. Especificamente, descreve-se um exemplo de curso ministrado no Moodle, o qual corresponde a um curso X que é minis- trado no AVA e onde os alunos A e B participam do mesmo curso. O Aluno A acessa os conteúdos disponibilizados pelo professor e, através de um evento de recomendação 1 http://owlcs.github.io/owlapi/ Figura 3. Arquitetura de integração recebe uma recomendação de um conteúdo Y como resultado. Como o Aluno B, que faz o mesmo curso que o aluno A e recebeu, inicialmente, acesso ao mesmo conteúdo que A e A recebeu a recomendação Y, então é inferido que o Aluno B torna-se um potencial agente a receber a mesma recomendação de Y. A Figura 4 apresenta a exemplificação do caso descrito dentro da ontologia. Figura 4. Exemplificação do cenário de aplicação 4. Considerações Finais e Trabalhos Futuros Este trabalho apresentou uma estrutura para padronizar a geração de dados de LA e prover assistências a sistemas de recomendação. Foi apresentada a Prov4LA, uma ontologia para captura de proveniência de eventos dentro de ambientes virtuais de aprendizagem. Para utilização correta da Prov4LA foi proposta uma arquitetura de integração na qual um plugin funcionará como um listener que captura os acessos a banco de dados realizados por cada ator dentro de um AVA. Através do cenário de aplicação apresentado, foi possível identificar e analisar o rastreamento de atividades, além dos principais eventos ocorridos. Como trabalhos futuros está prevista a etapa de validação da arquitetura proposta dentro de um curso ministrado no Moodle. Além disso, espera-se a utilização dos me- tadados gerados dentro de outras ferramentas de LA, por exemplo, com a proveniência coletada conseguir gerar caminhos de aprendizados automáticos para cada aluno, afim de melhorar a interação entre os alunos e os ambientes virtuais de aprendizagem. Referências Baeza-Yates, R., Ribeiro, B. d. A. N., et al. (2011). Modern information retrieval. New York: ACM Press; Harlow, England: Addison-Wesley,. Barrére, E., Souza, J., Vitor, M. A., and de Almeida, M. A. (2018). Recomendação auto- mática de videoaulas no moodle. In Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação-SBIE), volume 29, page 1613. Berners-Lee, T., Hendler, J., and Lassila, O. (2001). The semantic web. Scientific ameri- can, 284(5):34–43. Burger, T., Zaihrayeu, I., Andrews, P., Babenko, D., Pane, J., and Popov, B. (2010). Report on the state-of-the-art and requirements for annotation representation models. Technical report, University of Trento. Carchedi, L., Souza, J., Barrére, E., and Mendonça, F. (2018). Onto4la: uma ontologia para integração de dados educacionais. Anais dos Workshops do Congresso Brasileiro de Informática na Educação, 7(1):439. Chatti, M. A., Dyckhoff, A. L., Schroeder, U., and Thüs, H. (2013). A reference model for learning analytics. International Journal of Technology Enhanced Learning, 4(5- 6):318–331. Cheney, J., Chiticariu, L., and Tan, W.-C. (2009). Provenance in databases: Why, how, and where. Foundations and Trends R in Databases, 1(4):379–474. Costa, E., Aguiar, J., and Magalhães, J. (2013). Sistemas de recomendação de recursos educacionais: conceitos, técnicas e aplicações. Jornada de Atualização em Informática na Educação, 1(1). da Silva Lemos, D. L. and Souza, R. R. (2020). Representação de recursos multimídia na web: uso e reúso de padrões de anotação. Perspectivas em Ciência da Informação, pages 202–232. Dwivedi, S. and Roshni, V. K. (2017). Recommender system for big data in education. In 2017 5th National Conference on E-Learning & E-Learning Technologies (ELEL- TECH), pages 1–4. IEEE. Dyckhoff, A. L., Zielke, D., Bültmann, M., Chatti, M. A., and Schroeder, U. (2012). Design and implementation of a learning analytics toolkit for teachers. Journal of Educational Technology & Society, 15(3):58–76. Horrocks, I. (2008). Ontologies and the semantic web. Communications of the ACM, 51(12):58–67. Machado, M. d. O. C., Barrére, E., and Souza, J. (2019). Solving the adaptive curriculum sequencing problem with prey-predator algorithm. International Journal of Distance Education Technologies (IJDET), 17(4):71–93. Machado, M. d. O. C., Bravo, N. F. S., Martins, A. F., Bernardino, H. S., Barrere, E., and de Souza, J. F. (2020). Metaheuristic-based adaptive curriculum sequencing approa- ches: a systematic review and mapping of the literature. Artificial Intelligence Review, pages 1–44. Missier, P., Belhajjame, K., and Cheney, J. (2013). The w3c prov family of specifications for modelling provenance metadata. In Proceedings of the 16th International Confe- rence on Extending Database Technology, EDBT ’13, pages 773–776, New York, NY, USA. ACM. Moreau, L. and Groth, P. (2013). Provenance: an introduction to prov. Synthesis Lectures on the Semantic Web: Theory and Technology, 3(4):1–129. Oliveira, F. H., Salvador, L. N., and Novais, R. L. (2017). Um experimento com a on- tologia ims ld na construç ao de modelos conceituais para e-learning. X Seminar on Ontology Research in Brazil. Rautenberg, S., de Souza, L., Dall’Agnol, J. M. H., and Michelon, G. A. (2019). Guia Prático para Publicação de Dados Abertos Conectados na Web. Appris Editora e Livraria Eireli-ME. Rosa, F. L., da Silva Machado, R., Primo, T. T., Yamin, A. C., and Pernas, A. M. (2019). Análise de desempenho de ferramentas para persistência de dados ontológicos em tri- plas: Experimentos e resultados. XII Seminar on Ontology Research in Brazil. Simmhan, Y. L., Plale, B., and Gannon, D. (2005). A survey of data provenance in e- science. SIGMOD Rec., 34(3):31–36. Uren, V., Cimiano, P., Iria, J., Handschuh, S., Vargas-Vera, M., Motta, E., and Ciravegna, F. (2006). Semantic annotation for knowledge management: Requirements and a sur- vey of the state of the art. Journal of Web Semantics, 4(1):14–28.