Arquitetura Inteligente para Integração Semântica de Dados do Setor de Energia Elétrica João Luiz Silva Barbosa e Marcello Peixoto Bax ECI - PPGGOC - Universidade Federal de Minas Gerais (UFMG) Av. Antônio Carlos, 6627 - Pampulha - 31270-901 Belo Horizonte - Minas Gerais - Brazil joaoluiz.barbosa@gmail.com e bax.ufmg@gmail.com Abstract. Design a flexible architecture that allows to expand and facilitate the access to information for the managerial and technical levels of the company through an ontological model that consolidates all knowledge of assets and operations of the electric power sector. This ontological model will be integrated on a digital assistant for intelligent search of information that is capable of responding to queries formulated in natural language. This architecture should be extensible to various information retrieval scenarios and tools. Resumo. Conceber uma arquitetura flexível de suporte que possibilite ampliar e facilitar o acesso a informações para os diversos níveis gerenciais e técnicos da empresa através de um modelo ontológico que consolide todo o conhecimento de ativos e operações do setor de energia elétrica. Este modelo ontológico deverá ser integrado a um assistente digital para busca inteligente de informações, que seja capaz de responder a consultas formuladas em linguagem natural a partir de informações disponíveis. Esta arquitetura deve ser extensível a diversos cenários e ferramentas de recuperação de informação. 1. Introdução O setor de energia elétrica na Europa, Estados Unidos e em várias outras partes do mundo está passando por um conjunto de mudanças transformadoras, impulsionadas pela interseção de vários fatores que representam ao mesmo tempo desafios e oportunidades para uma empresa como a CEMIG [4]. Dentre estas mudanças tecnológicas, podemos destacar as energias renováveis (eólicas, fotovoltaicas), o armazenamento de energia em diversos tipos de baterias, a gestão dos recursos elétricos distribuídos no grid, a geração distribuída, redes auto-reconfiguráveis, mobilidade baseada em energia elétrica, experiência do usuário em dispositivos móveis, equipamentos no grid com capacidade de processamento e comunicação para serem telecomandados e aspectos transversais como segurança cibernética, redes sociais e novas tecnologias para interação com o público, tanto interno, quanto externos. Copyright © 2019 for this paper by its authors. Use permitted under Creative Commons License Attribution 4.0 International (CC1BY 4.0). Esse conjunto de mudanças coloca uma série de novas questões para o setor elétrico: ● Como os serviços de eletricidade, que são hoje gerados e operados principalmente de maneira centralizada, serão fornecidos no futuro? ● Qual o impacto da intensificação da digitalização do setor elétrico? ● Quais novos modelos de negócios deverão ser criados para explorar os sistemas de energia do futuro? ● Quais são as oportunidades e desafios que as novas tecnologias colocam para as empresas do setor elétrico? ● Como gerenciar as múltiplas possibilidades de fluxos elétricos e de geração de carga nos diversos pontos do Grid ? Responder a essas questões demanda a coleta e integração de dados de fontes diversas e distintas que atualmente encontram-se em silos isolados na organização. No setor elétrico essa necessidade se mostra cada vez mais urgente, uma vez que iniciativas de gerenciamento e gestão de ativos têm surgido e demandado a representação e organização do conhecimento do setor, mesmo que de forma inconsciente ou não explicitada. O que se objetiva neste trabalho é estabelecer uma proposta de solução para o gerenciamento e a gestão de ativos do setor elétrico baseada na integração semântica de dados usando ontologias. De forma mais específica, objetiva-se aprofundar o entendimento sobre a viabilidade da interoperabilidade semântica, desenvolvendo uma visão macro de iniciativas complementares já existentes na organização alvo desta pesquisa. A premissa é que nesta área do conhecimento conhecida como "Enterprise Information Integration" sejam encontrados conhecimentos capazes de subsidiar um desenvolvimento estrutural, semântico e formal que sustente e apoie uma tecnologia ou solução de gerenciamento de ativos. Para contextualizar o alcance dos resultados, serão identificadas pesquisas correlatas e serão estabelecidas relações entre a anterioridade e necessidade atual. Espera-se alcançar assim, uma proposta de solução fundamentada na CI, viável e que norteará o desenvolvimento de um projeto. O trabalho está inserido em um conjunto de projetos de Pesquisa e Desenvolvimento (P&D) em execução na CEMIG (Companhia Energética de Minas Gerais), onde o desafio é evoluir a gestão das informações acerca dos ativos e operações, para fins de gerenciamento e gestão. A pergunta a ser respondida por este trabalho em específico é: Como criar uma arquitetura flexível de informações para suporte dos usuários e dos sistemas que precisam interoperar entre si ? 2. Fundamentação Teórica A integração de dados envolve a combinação de dados que residem em diferentes fontes e fornece aos usuários uma visão unificada deles [12]. Ainda não existe um modelo ontológico brasileiro com as informações do setor elétrico. A investigação poderá ser útil a pesquisadores (e organizações) que desconhecem sobre modelagem e representação semântica e trabalham com problemas de integração e interoperabilidade de dados e sistemas. Adicionalmente existem iniciativas de P&D na CEMIG para suportar a 2 construção de um modelo ontológico para os ativos elétricos, para o tratamento das informações de dados gerenciais e para a concepção de um centro de operação da Distribuidora. Todos estes P&D podem ser beneficiados da concepção de um modelo ontológico geral e alto nível e este modelo passaria ser a referência para os trabalhos subsequentes advindos destas iniciativas. Esse processo se torna significativo em diversas situações, que incluem a integração de dados é cada vez mais relevante à medida que o volume [2] e a necessidade de compartilhar dados existentes parecem aumentar exponencialmente [9]. A integração de dados tornou-se o foco de extenso trabalho teórico, e numerosos problemas abertos permanecem sem solução. Uma estratégia comum para lidar com o problema envolve o uso de ontologias que explicitamente definem termos de esquemas de dados e, assim, ajudam a resolver conflitos semânticos [15] [16] [17]. Essa abordagem, comum no campo da biomedicina, denomina-se "integração de dados baseada em ontologias" e permite que dados de fontes diversas sejam comparáveis (harmonizados e normalizados) e possam ser integrados mesmo quando suas naturezas e grandezas são distintas [20]. Para completar esta ainda breve fundamentação teórica serão utilizados ainda trabalhos relacionados à concepção de ontologias, tais como [10]. Em específico os trabalhos correlatos de concepção de ontologias de domínio específico do setor de energia elétrica. Para fundamentação teórica dos mecanismos flexíveis e inteligentes de recuperação de informações serão utilizados os trabalhos relacionados às áreas de recuperação da informação e usabilidade da interface usuário máquina. Ambas áreas já bastante evoluídas e com diversas tecnologias aplicáveis a este contexto. 3. Metodologia Seguindo os preceitos da Design Science Research [1], a metodologia a ser utilizada é a pesquisa de trabalhos relacionados e complementares que objetivam: (1) a busca por modelos ontológicos similares ou extensíveis tais como [11] [13] [8] [7] [6] [3]; (2) a concepção e construção da arquitetura web flexível [18]; (3) a concepção ou a integração de ferramentas de pesquisa a partir de linguagem natural [5]; e (4) a validação dos resultados realizada por intermédio de um experimento protótipo [19]. Para a fase de construção serão adotados ciclos ágeis e uso de MVP (produto minimamente viável) visando antecipar a validação da solução nos diversos cenários de uso e teste da ontologia concebida. 4. Conclusão Este projeto contribuirá com os estudos atuais sobre integração semântica de dados baseada em ontologias com o propósito de promover a interoperabilidade de diferentes fontes de dados e sistemas. O ambiente smart grid [14] tem trazido diversas inovações, novas complexidades, novos equipamentos, formas de telecomando e abordagens de gestão baseada no ciclo de vida dos ativos. A construção de uma ontologia para este 3 contexto informacional é peça chave para integração semântica dos dados e sistemas envolvidos. A extensão das diversas ontologias existentes, mesmo que oriundas de outros domínios ou contextos, viabiliza a concepção de uma ontologia específica para o setor. Esta nova ontologia será a base para a concepção de um protótipo de arquitetura flexível de recuperação de informações que fará a integração e interoperabilidade de fontes de dados dos diversos sistemas de informações existentes hoje na organização. Referências [1] BAX, Marcello P.. Design science: filosofia da pesquisa em ciência da informação e tecnologia. Ciência da Informação, [S.l.], v. 42, n. 2, aug. 2015. ISSN 1518- 8353. Disponível em: . Acesso em: 13 may 2019. [2] Big Data Integration. Available at: https://www.talend.com/resources/what-is-data- integration [3] Bottaccioli, L., Aliberti, A., Ugliotti, F. M., Osello, A., Macii, E., Patti, E., Acquaviva, A. (2017), Building energy modelling and monitoring by integration of IoT devices and Building Information Models. In: Building Digital Autonomy for a Sustainable World (COMPSAC), Torino, Italy. [4] Calvillo, C.F., Sánchez-Miralles, A.,Villar, J.. 2016. Energy management and planning in smart cities. Renewable and Sustainable Energy Reviews, Volume 55, March 2016, Pages 273-287 [5] Chung-Cheng Chiu, Tara Sainath, Yonghui Wu, Rohit Prabhavalkar, Patrick Nguyen, Zhifeng Chen, Anjuli Kannan, Ron J. Weiss, Kanishka Rao, Katya Gonina, Navdeep Jaitly, Bo Li, Jan Chorowski, Michiel Bacchiani, {State-of- the-art Speech Recognition With Sequence-to-Sequence Models, https://arxiv.org/pdf/1712.01769.pdf, 2018. [6] Cuenca, J., Larrinaga, F., Curry, E., 2017. A unified semantic ontology for energy management applications, in: CEUR Workshop Proceedings. pp. 86–97. [7] Dilek Küçük, A high-level electrical energy ontology with weighted attributes. Advanced Engineering Informatics, Volume 29, Issue 3, August 2015, Pages 513-522 [8] Dogdu, Erdogan & Ozbayoglu, Murat & Benli, Okan & Erdener Akinc, Hulya & Erol, Erdeniz & Atasoy, Tugrul & Gurec, Ozan & Ercin, Ozden. (2014). Ontology-centric data modelling and decision support in smart grid applications a distribution service operator perspective. 2014 IEEE International Conference on Intelligent Energy and Power Systems, IEPS 2014 - Conference Proceedings. 198-204. 10.1109/IEPS.2014.6874179. [9] Frederick Lane (2006). "IDC: World Created 161 Billion Gigs of Data in 2006". 4 [10] Gangemi, A., Presutti, V., 2009. Ontology design patterns, in: Handbook on Ontologies. Springer, pp. 221–243. [11] Geum, Y., Suh, Y., Park, Y., Oh, H., 2008. Generating new service concepts based on ontology integration, in: Proc. of the 4th IEEE Int. Conf. Conference on Management of Innovation and Technology, ICMIT. pp. 878–883. [12] Maurizio Lenzerini (2002). "Data Integration: A Theoretical Perspective" (PDF). PODS 2002. pp. 233–246. [13] Mathias Weise, María Poveda Villalón, Mari Carmen Suárez-Figueroa, Raúl García Castro, Jérôme Euzenat, et al.. Ontologies and datasets for energy management system interoperability. [Contract] Ready4SmartCities. 2014, pp.72. ⟨hal-01180932⟩ [14] Mohamed E. El-hawary (2014) The Smart Grid—State-of-the-art and Future Trends, Electric Power Components and Systems, 42:3-4, 239-250, DOI: 10.1080/15325008.2013.868558 [15] Pinheiro, P., Bax, M., Santos, H., Rashid, S.M., Liang, Z., Liu, Y., McCusker, J.P., McGuinness, D.L. (2018), Annotating Diverse Scientific Data with HAScO. In: Proceedings of the Seminar on Ontology Research in Brazil. [16] Pinheiro, P., Bax, M., Santos, H., Rashid, S.M., Liang, Z., Liu, Y., McCusker, J.P., McGuinness, D.L.: Annotating Diverse Scientific Data with HAScO. In: Proceedings of the Seminar on Ontology Research in Brazil 2018 (ONTOBRAS 2018). São Paulo, SP, Brazil (2018) [17] Pinheiro, P., McGuinness, D., Dyzon, A., Bax, M. (2019), “HADatAc Framework”, http://hadatac.org, April. [18] Razik, L., Mirz, M., Knibbe, D. et al. Comput Sci Res Dev (2018) 33: 93. https://doi.org/10.1007/s00450-017-0350-y [19] Santos, H., Furtado, V., Pinheiro, P., McGuinness, D.L. (2015), Contextual Data Collection for Smart Cities. In: Proceedings of the Sixth Workshop on Semantics for Smarter Cities, Bethlehem, PA, USA. [20] Shubhra S. Ray; et al. (2009). "Combining Multi-Source Information through Functional Annotation based Weighting: Gene Function Prediction in Yeast". IEEE Transactions on Biomedical Engineering. 56 (2): 229–236. CiteSeerX 10.1.1.150.7928. doi:10.1109/TBME.2008.2005955. PMID 19272921. 5