MultiMeta - Система интеграции пространственных данных и ресурсов электронных библиотек ♣ © О.М. Атаева, А.А. Каленкова, В.А. Серебряков Учреждение Российской академии наук Вычислительный центр им. А.А.Дородницына РАН, г.Москва oli@ultimeta.ru, akalenkova@ultimeta.ru, serebr@ccas.ru Аннотация доступ граждан, хозяйствующих субъектов, органов государственной и муниципальной власти к В статье представлена Система интеграции распределенным ресурсам пространственных пространственных данных и ресурсов данных, а также распространение и обмен данными электронных библиотек MultiMeta. в общедоступной глобальной информационной сети Приводится схема метаданных MultiMeta, в целях повышения эффективности их производства построенная на базе схемы ЕНИП [16], она и использования. С развитием Интернета, включает основной и библиотечный Всемирной паутины и географических профили ЕПИП, а также схемы для работы информационных систем (ГИС) [20, 22] с пространственными данными, музейными приложения, в которых используются и медиа-объектами, которые были распределенные системы географической разработаны в рамках систем GeoMeta [15] информации, получили существенное развитие. и LibMeta [19]. Дается описание основных Распределенная географическая информация функциональных и интеграционных представляет собой всеобщее распространение возможностей MultiMeta. географической информации во множестве форм, включая карты, снимки, наборы данных, операции 1. Введение по анализу и отчеты [10]. Интеграция средств Интернета и географических информационных Пространственные данные – это цифровые систем открывает новые области исследований. данные о пространственных объектах, включающие Кроме того, в силу специфики своей предметной сведения об их местоположении и свойствах, области участники процесса интеграции обладают пространственных и непространственных атрибутах данными и метаданными, дополняющими [21]. пространственную информацию: это могут быть В последние годы идет поиск механизмов, публикации, включающие набор метаданных и которые позволили бы различным организациям полный текст, музейные экспонаты, представленные работать вместе в направлении разделения и обмена метаданными и медиа-объектами, самостоятельные своими пространственными данными и ресурсами медиа-объекты, такие как фотографии, видео и для предоставления эффективных информационных аудиозаписи. Интеграция разнородной информации, сервисов различным пользователям [5]. Это предоставляемой несколькими источниками, соображение обуславливает внесение ряда позволит максимально составить описание инициатив. Одна из них: Инфраструктура территории, провести анализ, выявить взаимосвязи, Пространственных Данных (ИПД) (Spatial Data получить принципиально новые возможности Infrastructure, SDI) берет свое начало с ранних поиска: ресурсы, даже хранящиеся в разных девяностых [4], когда предложение по развитию системах, представляются связанными друг с национальной инфраструктуры пространственных другом единой системой навигации. данных получило общественное признание, Системой, которая позволяет интегрировать признание частного сектора и сообщества пространственные и другие (в частности пользователей. В соответствии с определением, библиотечные и музейные) метаданные, используя представленным в [17, 4], ИПД – информационно- стандартные форматы и протоколы обмена, и телекоммуникационная система, обеспечивающая является представленная в этой работе Система интеграции пространственных данных и ресурсов электронных библиотек – MultiMeta. Труды 13й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» - RCDL’2011, Воронеж, Россия, 2011. 26 Рис. 1. Схема метаданных MultiMeta 2. Схема метаданных MultiMeta работы с библиографическими описаниями и сборниками публикаций в MultiMeta включен Схема метаданных Системы MultiMeta Библиотечный профиль ЕНИП, непосредственно из построена на базе схем Портала GeoMeta и Системы профиля метаданных СУЭБ LibMeta наследуются управления электронными библиотеками LibMeta схемы для работы с мультимедийными и (СУЭБ LibMeta), которые в свою очередь музейными объектами, коллекциями публикаций. проектировались на основе архитектуры Единого Благодаря тому, что сами схемы метаданных Научного Информационного Пространства (ЕНИП). формализованы с помощью стандартов RDF [11]/ Схема метаданных, которая составляет основу RDFS [12] / OWL [9], они легко объединяются и MultiMeta, представлена на рисунке 1. MultiMeta дополняются: сам профиль метаданных MultiMeta наследует такие преимущества ЕНИП, как включает набор объектных свойств, которые ориентация на семантический Веб (Semantic Web) связывают «геоинформационные ресурсы» и такие [1], возможность уникальной идентификации ресурсы как «коллекция», «музейный объект» (связь информации, возможность поиска информации в «геоинформационного ресурса» и «публикации» распределённой среде, возможности уже реализована в GeoMeta, связь интероперабельности с внешней средой. «мультимедийного объекта» и произвольного Построенная на основе портала GeoMeta, «ресурса» представлена в LibMeta). Таким образом, Система MultiMeta естественным образом наследует интеграция пространственных данных и ресурсов схему ЕНИП и возможность работы с такими электронных библиотек базируется на унификации ресурсами как «персона», «публикация», «проект» и и совместимости схем метаданных. «организация». Кроме того, центральным элементом схемы для MultiMeta остается 3. Функциональные возможности «геоинформационый ресурс». Первоначально «геоинформационный ресурс» обладает MultiMeta атрибутами, представляющими идентификационную информацию, информацию о Система интеграции пространственных данных качестве, координатной основе, распространении, и ресурсов электронных библиотек MultiMeta карте и слоях. Схема информационных ресурсов, включает в себя следующие функциональные служащих дополнением «геоинформационному подсистемы, доступные пользователю через web- ресурсу», таких как тексты, видео и аудиозаписи, интерфейс: полностью представлена в СУЭБ LibMeta, поэтому • Подсистема работы с метаданными об она включена в схему MultiMeta. Для возможности ученых, публикациях, музейных объектах и 27 геоинформационных объектах позволяет ресурсом, а также страницы привязки указанных просматривать, редактировать, а также типов объектов к геоинформационному ресурсу. производить поиск информации об ученом, публикации, музейном объекте. 4. Интеграционные возможности • Подсистема работы с коллекциями MultiMeta позволяет просматривать, редактировать и выполнять поиск по коллекции. Система MultiMeta позволяет интегрировать как • Подсистема работы с наборами пространственные данные с помощью подсистем, дополнительных атрибутов дает реализованных в Системе GeoMeta и возможность создавать наборы атрибутов, «унаследованных» MultiMeta, так и ресурсы назначать их некоторому музейному электронных библиотек. предмету. Задача интеграции распределенных • Подсистема работы с медиа-объектами неоднородных источников пространственных позволяет просматривать и редактировать данных решается путем выделения базовой схемы медиа-объекты. метаданных, реализованной в виде OWL-онтологии • Подсистема хранения и просмотра на основе стандартов ISO 19115:2003 отсканированных текстов дает следующие «Географическая информация. Метаданные» [6] и возможности: просматривать подряд ISO 19139:2007 «Географическая информация. страницы издания, переходить на любую Метаданные – XML схема» [7] и полностью заданную страницу (в том числе на включающей российский стандарт ГОСТ Р 52573- предыдущую, на последующую, на 2006 «Географическая информация. Метаданные» страницу с заданным номером), [18] (а также учитывающей профили стандартов и просматривать оглавления издания (с схемы метаданных, лежащие в основе наиболее возможностью перехода на нужный известных национальных инфраструктур раздел), просматривать страницы в пространственных данных), для обеспечения увеличенном масштабе, выполнять семантической интероперабельности систем, разворот иллюстраций на 90°. участвующих в распределенном взаимодействии. • Подсистема управления структурой На данный момент возможна загрузка метаданных в статического наполнения портала. формате ISO 19139:2007. • Подсистема управления группами и Предусмотрена возможность периодического пользователями. сбора метаданных (harvesting) из различных • Подсистема управления новостями. источников – каталогов метаданных. При этом система может выступать как в роли клиента, • Подсистема ведения словарей и который выполняет сбор информации из других классификаторов, которые могут быть каталогов, так и в роли сервера, который может использованы для организации предоставлять метаданные в другие каталоги. тематического поиска. Каждый каталог, участвующий в сборе, может • Подсистема пакетной загрузки данных предоставлять в другие каталоги как локальные позволяет загружать данные в формате метаданные, так и метаданные, собранные в нем с RDF/XML в соответствии с онтологической удаленных источников. Механизм периодического моделью метаданных MultiMeta. сбора метаданных обеспечивает копирование • Подсистема полнотекстового поиска метаданных из удаленного источника и их информации об ученых, публикациях, синхронизацию с заданной периодичностью. музейных объектах, коллекциях и медиа- В настоящее время реализованы два протокола объектах. обмена: GeoNetwork – порталы на базе ресурсов • Подсистема каталогизации, сбора, поиска системы «Geonetwork opensource» [3] и Web DAV пространственных метаданных. [14] – каталоги на базе сервера WebDAV, • Подсистема предоставления доступа к используются для обмена с другими порталами, пространственным данным по кроме GeoNetwork. В обоих случаях текст стандартизованным протоколам. метаданных передается в формате XML по • Подсистема визуализация карт. стандарту ISO 19139:2007. • Подсистема получения метаданных по Для получения пространственных и протоколу OAI-PMH [8], в частности непространственных метаданных в MultiMeta получение и загрузка метаданных полностью реализованы стандарты OAI-PMH и публикаций и геоинформационных Dublin Core. Кроме того, для интеграции с ресурсов в формате Dublin Core [13]. музейными системами существует отображение метаданных системы на концептуальную модель Кроме того, были созданы страницы просмотра CIDOC-CRM [2]. Для использования других списков медиа-объектов, коллекций, музейных протоколов и форматов обмена данными и объектов, связанных с геоинформационным метаданными, в особенности основанных на XML, 28 не представляется сложной реализация модулей [11] Resource Description Framework (RDF) Model обмена. and Syntax. http://www.w3.org/TR/rdf-primer/. Таким образом, в MultiMeta на ряду с загрузкой [12] Resource Description Framework (RDF) Schema геоинформационных ресурсов может быть Specification. http://www.w3.org/TR/rdf-schema. выполнена загрузка публикаций, музейных и медиа- [13] The Dublin Core Metadata Element Set: an объектов. American national standard. Связь загружаемых объектов и http://dublincore.org/documents/dces/. пространственных данных может быть указана при [14] WebDAV Resources. http://www.webdav.org/ загрузке в формате RDF/XML, соответствующем [15] Атаева О.М., Кузнецов К.А., В.А. Серебряков, схеме метаданных MultiMeta. Рассматривается Филиппов В.И. Портал интеграции вопрос об указании связи при загрузке в формате пространственных данных «ГеоМета» // Dublin Core. Электронные библиотеки: перспективные методы и технологии, электронные коллекции. 5. Заключение 2010. – C. 219. [16] Бездушный А. Н., Бездушный А. А., Серебряков В работе представлена созданная авторами Система В. А., Филиппов В. И. Интеграция метаданных MultiMeta, позволяющая интегрировать Единого Научного Информационного пространственные данные и ресурсы электронных Пространства РАН / М.:ВЦ РАН, 2006. библиотек, основываясь на известных стандартных [17] ГОСТ Р 52438-2005 –Географические форматах и протоколах. Кроме того, Система информационные системы. Термины и MultiMeta построена на основе единой схемы определения. метаданных и позволяет загружать информацию в [18] ГОСТ Р 52573–2006 – Географическая формате RDF/XML в соответствии с информация. Метаданные. http://protect.gost.ru/ онтологической моделью. В дальнейшие планы document.aspx?control=7&id =74833. авторов входит улучшение дизайна системы и ее [19] Захаров А.А., Серебряков В.А. Система наполнение данными мультимедийного управления электронными библиотеками электронного атласа Курильских островов и других LibMeta // Электронные библиотеки: электронных атласов, предоставляемых Институтом перспективные методы и технологии, географии РАН. электронные коллекции. 2010. – C. 28. [20] Майкл Н. ДеМерс. Географические инфор- мационные системы основы / М: Дата+, 1999. Литература [21] Cловарь по естественным наукам. Глоссарий.ру http://slovari.yandex.ru/dict/gl_natural/article/97/09 [1] Berners-Lee T., Shadbolt N., Hall W. The Semantic 7_214.HTM. Web Revisited // IEEE Intelligent Systems. 2006. [22] Томлинсон, Роджер Ф. Думая о ГИС. N. 6. Планирование географических инфор- [2] CIDOC CRM Home page. мационных систем: руководство для http://cidoc.ics.forth.gr/index.html. менеджеров. Пер. с англ. / М.: Дата+, 2004. [3] Geonetwork opensource. The complete manual. V 2.4, 2009. http://geonetwork-opensource.org/. [4] Groot R., McLaughlin J. Geospatial Data MultiMeta – a System of Spatial and Digital Infrastructure Concepts, Cases and Good Practices Library Resources Integration / NY: Oxford University Press, 2000. [5] Guarin J. M. M., Radwan M. M. Architecting © O.M. Ataeva, A.A. Kalenkova, V.A. Serebriakov distributed geo-information services beyond data infrastructures // XXth ISPRS congress: The system of spatial and digital library resources Geoimagery bridging continents. integration – MultiMeta is presented. MultiMeta [6] ISO 19115:2003 – Geographic information. metadata schema is given; it is based on ENIP schema Metadata. and includes the main and library profiles of the ENIP. [7] ISO 19139:2007 – Geographic information – Also it contains schemas to deal with geospatial data, Metadata – XML schema implementation. museum and media objects which were developed [8] Open archives initiative protocol for metadata within GeoMeta and LibMeta systems. Main functional harvesting. http://www.openarchives.org/ pmh. and integration capabilities of MultiMeta are exposed. [9] OWL Web Ontology Language Semantics and Abstract Syntax. http://www.w3.org/TR/2004/REC-owl-semantics- ♣ Работа выполняется в рамках проекта РФФИ №11-07- 20040210/. 00286-а. [10] Plewe B. GIS Online Infromation Retrieval, Mapping, and the Internet / USA: Onward Press, 1997. 29