ОНТОЛОГО-ОРИЕНТИРОВАННАЯ ИНТЕГРАЦИЯ ДАННЫХ В СЕМАНТИЧЕСКОМ ВЕБЕ

ОНТОЛОГО-ОРИЕНТИРОВАННАЯ ИНТЕГРАЦИЯ ДАННЫХ В СЕМАНТИЧЕСКОМ ВЕБЕ ИСЧистякова inna_islyamova@ukr.net

Институт программных систем НАН Украины, Киев-187, проспект Академика Глушкова 03187, 40

ОНТОЛОГО-ОРИЕНТИРОВАННАЯ ИНТЕГРАЦИЯ ДАННЫХ В СЕМАНТИЧЕСКОМ ВЕБЕ 2133FF723AEBA481F09F4E7362562C94 GROBID - A machine learning software for extracting information from scholarly documents

Работа посвящена проблеме интеграции данных в Семантическом Вебе. Рассматривается процесс интеграции, основные его составляющие, а именно: выработка схем интеграции, выработка отображений между моделями, выработка способов манипулирования.

This paper is devoted to the problem of data integration in the Semantic Web. The process of integration, its main components, namely, construction of integration schemes, the development of mappings between models, the development of ways of manipulation are considered.

Определение проблемы интеграции

Интеграция данных является одним из наиболее востребованных направлений в современной информационной индустрии. За все годы существования Интернет-пространства в нем скопилось большое количество информации, объем которой с каждым днем возрастает в геометрической прогрессии, а релевантность -в арифметической. Это порождает множество проблем связанных с использованием и хранением данных информационного пространства. Огромные объемы разнородных данных в гетерогенных источниках представляют информацию различными способами и имеют разнообразное функциональное назначение. Интеграция и совместное использование информации из множества таких источников данных является сложной задачей, остающейся неизменно актуальной на протяжении последних десятилетий.

Можно выделить несколько порождающих причин гетерогенности: 1) различные модели данных. Согласно разным сведениям от 75% до 90% (в зависимости статистического источника) информации хранится в РБД. Однако, на оставшиеся проценты приходится немалое количество данных, хранящихся в структурах, которые определяются совершенно другими моделями данных со своей специфической семантикой. В этих условиях не представляется возможным иметь согласованный доступ одновременно ко всем источникам информации;

2) различные способы хранения данных (файлы, БД, хранилища и т. д.). Физическая организация хранения информации создает дополнительные препятствия к ее использованию. Интеграция данных должна предоставить единый логический формат организации данных таким образом, что независимо от способа их физического хранения, конечный пользователь имеет единый механизм доступа к содержимому;

3) существенная распределенность данных. Источники информации изолированы друг от друга, каждый из которых подчиняется концепции «замкнутого мира». Такой подход значительно затрудняет введение принципиально новых понятий различных предметных областей, порождает дублирование данных, что приводит к увеличению объема, но уменьшению релевантности искомой информации. Интеграция данных способна устранить такую изолированность источников друг от друга, тем самым способствуя согласованному использованию уже существующих данных, устранение дубликатов, а также оперативному возникновению новой информации; 4) неполнота и противоречивость данных. Отсутствие семантической составляющей современных источников порождает проблему неполноты сведений каждого из них в отдельности. А при рассмотрении совокупности этих источников возникает проблема противоречивости. Интегрция данных призвана устранить эти недостатки путем введения единого семантического контекста для всех информационных ресурсов, хранящихся в интегрированных источниках; 5) различные способы оперирования данными (манипулирование, поиск, выборка и т. д.). Существующие возможности поисковых систем общего назначения не позволяют обеспечить эффективный поиск информации. Каждая модель данных предполагает существоввания своих собственных средств манипулирования, что порождает их разнообразие, приводящее к гетерогенности данных.

Ввиду всего вышесказанного становится очевидной важность решения комплексной проблемы интеграции.

Проблема интеграции данных заключается в таком логическом объединении данных, принадлежащих разнородным источникам, которое обеспечивает единое представление и оперирование этими данными. Система интеграции данных позволяет освободить пользователя от необходимости самостоятельно отбирать источники, в которых находится интересующая пользователя информация, обращаться к каждому источнику по отдельности и вручную сопоставлять и объединять данные из различных источников.

Акцентируя внимание на разнородности данных, следует прояснить это понятие. Данные разнородны не с точки зрения их физического хранения, а с точки зрения модели их представления. То есть, вне зависимости от места их расположения и способа их хранения, для решения проблемы интеграции важную роль играет модель представления данных со своей специфической семантикой, которая предоставляет механизмы организации работы с данными для конечного пользователя.

В работе [4] авторы выделили следующие признаки неоднородности данных: Физические модели данных описывают то, как данные хранятся в компьютере, представляя информацию о структуре записей, их упорядоченности и существующих путях доступа. Физических моделей данных не так много, как логических, а самыми популярными среди них являются обобщающая модель (unifying model) и модель памяти кадров (frame memory).

Возвращаясь к проблематике интеграции, следует обратить внимание, что согласно [1] проблема интеграции является комплексной и многоаспектной. В то время, как ее основной целью является обеспечить гомогенное, унифицированное представление данных различных источников, конкретная задача интеграции может зависить от множества факторов. Среди них: архитектурное представление информационной системы; содержимое и функциональность систем; вид информации, которой оперируют системы (числовые данные, мультимедийные данные; структурированные, полу-структурированные, неструктурированные данные); и т. д.

На сегодняшний день мы выделяем три основных составляющих проблемы интеграции данных:  выработка схем интеграции данных;  выработка отображений между моделями;  выработка способов манипулирования, суть которых раскрывается далее.  отношения -таксономия классов, таксономия свойств, принадлежность индивида классу, область определения и область значений свойства (способы, с помощью которых классы и индивиды могут быть связаны друг с другом);

Выработка схем интеграции данных

 правила -способ задания других видов ограничений, которые не поддерживаются отношениями.

Операции

 теоретико-множественные операции на классах и свойствах (объединение, пересечение, дополнение);

 ограничения свойств по существованию и общности (квантификация свойств);  численные ограничения свойств (функциональные, количественные, качественные);

 и другие. Как видно из всего выше сказанного, используя централизованую схему интеграции данных для решения комплексной проблемы интеграции, онтология наилучшим образом подходит в качестве глобальной схемы, что позволяет в качестве локальной схемы использовать любую модель данных. Вопрос взаимодействия внутри такой системы относится к следующей общей проблеме интеграции -выработке отображений между моделями.

Выработка отображений между моделями

Рассмотрим абстрактную систему интеграции данных, основанную на архитектуре централизованой схемы. Задача такой системы, называемой также посредником, заключается в том, чтобы предоставить интегрированный доступ к множеству распределенных, разнородных, автономно разработанных источников, без необходимости централизовано хранить всю информацию из источников. Система предоставляет пользователю возможность формулировать запросы на выборку информации из таких источников в терминах глобальной схемы данных (общей системы понятий), которая проектируется «сверху» исходя из интересующих пользователя аспектов предметной области.

При этом в каждом источнике информация может представляться в терминах собственной схемы данных (системы понятий), соответственно, при включении источника в систему указывается некоторое семантическое отображение между терминами глобальной схемы данных и терминами различных схем данных источников.

В работе [3] дается следующее определение системы интеграции данных (СИД).

СИД І представляется тройкой   M S G , , , где  G -глобальная схема, описанная в языке G L над алфавитом G A .

Алфавит содержит символы каждого элемента G (отношения, если G -реляционная, классы, если G -объектно-ориентированная). В нашем случае, алфавит содержит символы, соответствующие всем концептам и ролям онтологии.

 S -схема источника, описанная в языке S L над алфавитом S A . Алфавит содержит все символы источника.

 M -отображения между G и S , образованные набором утверждений в форме S q ↝ G q , G q ↝ S q где G q и S q -два запроса одинаковой арности, сформулированных в языке

G M L , и S M L  соответственно.

Запись S q ↝ G q означает, что каждый концепт источника, представленный запросом S q соответствует концепту глобальной схемы, представленной запросом G q (аналогичным образом трактуется утверждение G q ↝ S q ). По утверждению автора, данное определение охватытвает все подходы, известные в литературе, но каждый специфический подход зависит только от характеристик отображений и выразительной мощности схем и языков формулирования запросов.

Предлагается два подхода, определяющие отображения в СИД. Они называются LAV (Local-as-view) и GAV(Global-as-view).

LAV

В СИД I =   M S G , ,

, основанной на LAV-подходе, отображение M связывает каждый элемент s схемы источника S с запросом G q к схеме G . Другими словами, язык запросов S M L , разрешает только выражения, образованные одним символом алфавита S A . Таким образом, LAV отображение -это набор утверждений, по одному на каждый элемент s из схемы S , в форме s↝ G q . С точки зрения моделирования, подход LAV основывается на идее, что каждый элемент источника s должен быть связан запросом q G с соответствующим элементом глобальной схемы. Запрос формулируется в языке источника с последующим переформулированием в терминах G . Добавление нового источника сводится к обогащению набора отображений новыми утверждениями без прочих изменений.

GAV В GAV-подходе отображения M связывают каждый элемент g схемы данных G запросом S q с элементом источника S . Другими словами, язык запросов G M L , разрешает только выражения, образованные одним символом алфавита G A . Таким образом, GAV-отображение -это набор утверждений, по одному на каждый элемент g из схемы G , в форме g↝ S q . С точки зрения моделирования, подход GAV основывается на идее, что каждый элемент g глобальной схемы должен быть связан запросом S q с соответствующим элементом c выбранным источником данных. Отображение говорит нам, как нужно извлечь данные из источника, когда кто-то хочет оценить различные данные глобальной схемы.

Главным в подходе является обработка запросов, т. к. с их помощью система знает как использовать источники для извлечения данных. Однако, добавление нового источника является серьезной проблемой, т. к. некоторые элементы глобальной схемы должны быть переопределены.

У каждого из этих подходов есть свои преимущества и недостатки.

1. В подходе LAV сложно сформулировать запрос. Представление элемента в ГС одно, а запрос формируется в терминах ИД (алфавит ИД, язык ИД). Но добавление нового ИД не является проблемой, т. к. формулирование запросов -задача самого источника.

2. В подходе GAV легко сформулировать запрос, т. к. мы сразу знаем, какой запрос к ИД соответствует элементу ИД. Представление элемента едино, алфавит и язык формулирования запросов един. Но добавление нвого источника является проблемой, т. к. некоторые представления необходимо бедт переопределить для формулирования запросов и к новому источнику тоже.

3. В то время, как проектировщик LAV концентрируется на том, как представить данные источника в терминах ГС, проектировщик GAV решает проблему, как извлечь необходимые данные из предоставленных источников.

4. Подход нужен для задач, в которых много разнородных ИД, но объем данных не сильно велик. Подход GAV нужен для задач с небольшим количеством источников, но с очень большим объемом данных.

Принципиально новым является суть понятия отображения. Оно представляет собой запрос, а не очередное отношение между элементами моделей. Это означает, что в основе взаимодействия между элементами моделей лежит некоторый логический аппарат конкретного языка формулирования запроса.

В своей работе [6] автор предлагает создавать так называемые «обертки» для каждого из источников системы. Они представляют собой локальные схемы, представленные в той же самой модели данных, что и глобальная схема. Предполагается, что каждый информационный источник «обернут» промежуточным компонентом-адаптером, который отвечает за выборку сведений из источника в рамках единой модели данных, а также за предоставление стандартного технического интерфейса для обращения к источнику (сетевой протокол, язык запросов). Пользователь не взаимодействует с источниками напрямую, а обращается к выделенному компоненту-посреднику, который отвечает за обслуживание пользовательских запросов и взаимодействие с источниками. «Обертывание» каждого источника информации в локальную онтологию позволяет развиваться онтологии-источнику вне зависимости от других онтологий. Следовательно, задача интеграции может быть упрощена и добавление или удаление источников можно легко поддерживать.

Выработка способов манипулирования

После выработки отображений между моделями данных возникает вопрос применимости таких систем, то есть каким образом можно манипулировать созданными глобальными схемами и управлять данными, расположенными внутри различных систем. «Обертывание» источников данных углубляет этот вопрос тем, что дает возможность использовать эти источники вне существующей системы, а также расширяет возможности манипулирования данными на уровне единой принятой модели.

Поскольку мы сводим всю комплексную проблему интеграции данных к онтологической модели, то ввиду этого остро возникает проблема манипулирования онтологиями. Решая эту проблему, мы решаем в полной мере общую проблему интеграции.

В проблеме манипулирования онтологий важны следующие два аспекта: выработка подходов по интеграции онтологий и определение множества операций манипулирования онтологиями, которые обсуждаются далее.

Интеграции онтологий

В работе [2] дается три определения интеграции онтологий: 1. Интеграция как повторное использование. В данном случае, интеграция онтологий рассматривается как процесс создания новой онтологии с помощью повторного использования уже существующих, доступных онтологий (путем сборки, расширения, специализации, адаптации) (рис.

Выводы

Интеграция данных в информационном пространстве является важной научной проблемой. Существует множество подходов к её решению. Было выявлено три составляющие комплексной проблемы интеграции, в процессе рассмотрения которых мы остановились на централизованой схеме интеграции данных и онтологической модели, в качестве единой модели на роль глобальной схемы данных. Приведена аргументация данного выбора, дана характеристика онтологии как модели данных, проанализированы способы манипулирования онтологиями. Были определены операции манипулирования онтологиями, а именно уточнение, унификация, отображение согласование, интеграция, наследование.

Опираясь на исследования[1], а также фундаментальную работу[3] мы рассматриваем 2 типа схем интегрции данных: Р2Р (peer-to-peer) схема (ещё её называют одноранговой) и централизованая схема.В Р2Р схеме (рис. 1) не существует глобальных точек контроля. В основе каждого узла, принимающего участие в схеме, лежит своя модель данных. Каждый узел равноправен и может принимать запросы пользователя к информации, распределенной по всей системе. Преимущества этой схемы заключаются в следующем: где бы ни был выполнен запрос на информацию, в какой из точек данные ни находились бы, узел, принявший запрос, имеет прямой и непосредственный доступ к каждой точке системы, вследствие чего ему открывается абсолютно вся информация, хранящаяся в ней. Существенным недостатком можно назвать следующее: при добавлении нового узла в схему, необходимо установить соответствия с ним существующих узлов. При небольшом объеме это сделать нетрудно, но с последующим увеличением количество точек, возрастает количество взаимодействий, которые требуется установить внутри схемы, возрастает сложность этих взаимодействий, увеличивается трудоемкость работы проектировщика. Система, основаная на такой схеме становится все более громоздкой и хрупкой, гетерогенность моделей налагает дополнительные сложности на установление связей друг с другом, исходя из особенностей собственных структурных отличий, а также особенностей своих компонент. Рис. 1. Одноранговая (Р2Р) схема интеграции данных Данные недостатки породили развитие другого подхода -централизованой схемы. На сегодняшний день она является наиболее успешной для решения комплексной проблемы интеграции данных. Применяется во многих системах и лежит в основе подходов к выработке отображений между моделями системы, а также к разработке способов манипулирования. В централизованной схеме (рис. 2) обычно присутствует одна глобальная точка контроля. В основе этого узла лежит своя модель данных. В работе [3] ее называют глобальной схемой, а все остальные моделилокальными схемами, или схемами источников. Мы также будем придерживаться этой терминологии в дальнейшем. Основная роль глобальной схемы -предоставление пользователю единого интерфейса для доступа к информации, хранящейся в реальных источниках данных. Преимуществом такой системы является возможность объедининения любого количество узлов без существенных потерь, т. к. сами локальные схемы могут взаимодействовать между собой любым доступным способом. Главным остается связь с глобальной схемой, обеспечивающей единое согласованое представление данных пользователю и предоставление централизованого поиска. Критическим моментом централизованой схемы остается разработка отображений между моделями, а именно схемами источников и глобальной схемой. При рассмотрении подходов взаимодействия глобальной и локальных схем будут рассмотрены недостатки каждого из подходов, которые в целом являются недостатками всех централизованой схемы интеграции данных. Рис. 2. Централизованая схема интеграции данных В своих исследованиях, при выработке схем мы остановились именно на втором подходе, а именно на централизованой схеме интеграции данных. Развивая далее эту тему, возникает вопрос, а какую же модель данных выбрать в качестве глобальной схемы? Рассмотрев современные модели данных, наиболее подходящей для выполнения задачи предоставления пользователю единого согласованого представления данных, является онтологическая модель или онтология.В свое время было сформулировано понятие семантической интеграции данных как процесса использования концептуального представления данных, а также их взаимоотношений для ликвидации возможных неоднородностей[4].Мы уточнили это определение следующим образом. Семантическая (онтолого-ориентированная) интеграция данных -использование онтологии в качестве объединяющей модели для: описания и поддержания отображений между различными моделями данных;  унифицированного манипулирования данными. Использование онтологий для семантической интеграции данных аргументируется следующими факторами: онтология является самой развитой моделью данных;  онтологии обладают более развитой семантикой;  онтологии предоставляют самые мощные механизмы вывода;  онтологии имеют четкую формальную спецификацию (дескриптивная логика). Мы понимаем онтологию в ее стандартном, классическом определении, которые сформулировано много лет назад, а именно.Онтология -это формальная, явная спецификация согласованной концептуализации[5].Онтология, как модель данных, представляется следующими компонентами: 1. Структура.  классы -концептуальное представление некоторых общих понятий;  индивиды -конкретные экземпляры класса;  свойства -позволяют утверждать общие факты о классах и специфические факты об индивидах. 2. Ограничения целостности.

2 . 3 .233). Рис. 3. Интеграция онтологий: повторное использование В процессе интеграции существуют одна или несколько первоначальных онтологий ) , итоговая онтология O , которая образуется в результате процесса интеграции. Домены ) , отличаться от результирующего домена D , но между ними могут существовать связи. При этом, обычно n k  , но такое может быть не всегда, так как в процессе интеграции могут участвовать несколько различных онтологий принадлежащих одному и тому же домену. В результате процесса интеграции образуется онтология O такая, что аналогичной не существует. В противном случае одна из них должна будет повторно использовать другую. Интеграция как объединение. В данном случае, интеграция онтологий рассматривается как процесс создания новой онтологии с помощью объединения нескольких онтологий в одну которая обобщает их все (рис. 4). Рис. 4. Интеграция онтологий: объединение В процессе интеграции участвуют несколько первоначальных онтологий онтологий ) итоговая онтология O , которая образуется в результате процесса интеграции, которую в этом случае иногда называют объединением. Начальные онтологии принадлежат одному и только одному домену S, которому также принадлежит результирующая онтология. Целью данного процесса является создание более общей онтологии на заданном домене, собирая в единое целое знания нескольких онтологий этого домена. Уровень обобщенности первоначальных онтологий может отличаться. Интеграция как использование в программном обеспечении. В данном случае, интеграция онтологий рассматривается как процесс создания программного приложения, основанного на использовании нескольких онтологий. Рис. 5. Интеграция онтологий: использование В процессе интеграции участвуют несколько первоначальных онтологий онтологий ) результате не создается никакой новой онтологии. Некоторое приложение A просто использует готовые онтологии, а результат зависит от архитектуры и назначения самого приложения. Онтологии должны быть совместимы между собой по следующим критериям: язык описания, онтологические соглашения, уровень детализации, уровень обобщения, модульность, контекст и т. д. Операции над онтологиями. Что касается операций манипулирования онтологиями, то можно выделить следующие два вида операций над онтологиями: сопоставление и оперирование. Сопоставление решает проблему установления различного рода (семантических) соответствий между онтологиями. Оперирование -это набор унарных и бинарных операций создания новых онтологий из существующих. Мы кратко представим только операции сопоставления, как наиболее важные при решении проблемы интеграции онтологий. Уточнение (refinement). Под уточнением онтологий понимают такое сопоставление онтологии A с другой онтологией B , что каждому понятию из онтологии A ставится в соответствие эквивалентное ему понятие в B . Примитивные понятия из онтологии A могут соответствовать непримитивным понятиям онтологии B (рис. 6). Рис. 6. Уточнение Унификация (unification). Онтология приводится к некоему каноническому (эталонному) представлению. Для унификации должна задаваться исходная онтология, которая приводится к результирующей согласно заданной канонической онтологии. Задача унификации множества исходных онтологий становится актуальной при работе с гетерогенными онтологиями (рис. 7). Рис. 7. Унификация Отображение (mapping). Отображение одной онтологии в другую -это функция преобразования одной онтологии в другую (способ перевода объектов одной онтологии в другую), либо сам результат такого преобразования. Часто это означает перевод между понятиями и отношениями. Отображение может быть частичным в том смысле, что не все понятия исходной онтологии отображаются в результирующую. В частности, это означает, что в исходной онтологии существует подонтология, для которой существует полное отображение (рис. 8). Рис. 8. Отображение Согласование (alignment). Это процесс отображения онтологий в обоих направлениях. Согласование, как и отображение, может быть лишь частичным. Спецификация согласования называется артикуляцией (articulation) (рис. 9). Рис. 9. Согласование Интеграция (integration). Это процесс поиска одинаковых частей двух разных онтологий, A и B , при разработке новой онтологии C , которая позволяет выполнить перевод между онтологиями A и B , и, таким образом, позволяет взаимодействие между двумя системами, где одна использует онтологию A , а другаяонтологию B . Новая онтология C может заменить онтологии A и B или может использоваться в качестве промежуточной онтологии для перевода между двумя онтологиями. Интеграция может меняться от согласования к унификации. Наследование (inheritance). Означает, что онтология A наследует все из онтологии B . Она наследует все понятия, отношения и ограничения или аксиомы, и дополнительные знания, содержащиеся в онтологии, не внося при этом какой-либо несогласованности.

1. Модель. Структурные различия моделей данных порождают схематическую гетерогенность. 2. Синтаксис. Порождается в связи с наличием различных языков описания моделей данных. 3. Семантика. Порождается различным определением данных в различных контекстах.  объектно-ориентированная модель (расширяет определение сущности с целью включения в него не только атрибутов, которые описывают состояние объекта, но и действий, которые с ним связаны, т. е.При этом, каждый из этих признаков может присутствовать независимо от двух остальных, например,семантическая гетерогенность может возникать даже в том случае, если схематическая и синтаксическаяразнородности отсутствуют (именование концептов и т. д.).В связи с тем, что далее мы будем много раз говорить о моделях данных, следует дать определение этомупонятию.Данные -представление фактов и идей в формализованном виде, пригодном для передачи и обработки внекотором информационном процессе. Данные, могут подвергаться обработке, и результаты обработкификсируются в виде новых данных.Модель данных -интегрированный набор понятий для описания и обработки данных, связей междуними и ограничений, накладываемых на данные в некоторой организации.Цель построения модели данных заключается в представлении данных в понятном виде.Можно по-разному характеризовать понятие модели данных. С одной стороны, модель данных -этоспособ структурирования данных, которые рассматриваются как некоторая абстракция в отрыве от предметнойобласти. С другой стороны, модель данных -это инструмент представления концептуальной моделипредметной области и динамики ее изменения.На этапе выработки схем интеграции данных, модель является представлением "реального мира"объектов и событий, а также существующих между ними связей. Это некоторая абстракция, в которой акцентделается на самых важных и неотъемлемых аспектах ПО, а все второстепенные свойства игнорируются.Модель должна отражать основные концепции, представленные в таком виде, который позволитпроектировщикам и пользователям обмениваться конкретными и недвусмысленными мнениями о роли тех илииных данных в ПО.Модель данных можно рассматривать как сочетание указанных ниже компонентов [7]: структурная часть (набор правил, определяющих типы и характеристики логических структурданных); управляющая часть, определяющая типы допустимых операций с данными (описываются правиласоставления структур более общего типа из структур более простых типов, сюда относятся операцииобновления и извлечения данных, а также операции изменения структуры экземпляра модели); набор ограничений поддержки целостности данных, гарантирующих корректность используемыхданных. Сюда входят возможные действия над структурами и правила их выполнения, включающие:средства контроля относительно простых условий корректности ввода данных (ограничения);средства контроля сколь угодно сложных условий корректности выполнения определенныхдействий (правила).Модели данных подразделяются на три категории [9]:1. Объектные модели данных (описание данных на концептуальном и внешнем уровнях).При создании объектных моделей данных используются следующие понятия:

 сущность -это отдельный концептуальный элемент ПО  атрибут -это свойство, которое описывает некоторый аспект объекта и значение которого следует зафиксировать.  связь -это ассоциативное отношение между сущностями. Наиболее общие типы объектных моделей данных:  ER-модель (Entity-Relationship model);  семантическая модель (онтология);  функциональная модель; его поведение) 2. Модели данных на основе записей (описание данных на концептуальном и внешнем уровнях). В модели на основе записей база данных состоит из нескольких записей фиксированного формата, которые могут иметь разные типы. Каждый тип записи определяет фиксированное количество полей, каждое из которых имеет фиксированную длину. Существуют три основных типа логических моделей данных на основе записей:  реляционная модель данных;  сетевая модель данных;  иерархическая модель данных. 3. Физические модели данных (описание данных на внутреннем уровне).

Dittrich Three Decades of Data Integration // All Problems Solved? PatrickZiegler KlausR CH-8057 190 Zürich, Switzerland Database Technology Research Group ; Department of Informatics, University of Zurich Winter thurerstrasse Pinto Some Issues on Ontology Integration HSofia Proceedings of the IJCAI-99 workshop on Ontologies and Problem-Solving Methods (KRR5) the IJCAI-99 workshop on Ontologies and Problem-Solving Methods (KRR5)

Stockholm, Sweden

August 2, 1999 Data Integration: A Theoretical Perspective MLenzerini Proc. of the 21st ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems of the 21st ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems

PODS; N. Y.

ACM Press 2002. 2002 Huiyong Xiao The Role of Ontologies in Data Integration IsabelFCruz Jounal of Engineering Intelligent Systems 2005 Ontologies and Knowledge Bases: Towards a Terminological Clarification NGuarino PGiaretta Towards Very Large Knowledge Bases: Knowledge Building and Knowledge Sharing NicolaGuarino1 DanielOberle2 Steffen

Amsterdam

IOS Press 1995. Staab3 ААБездушный Математическая модель системы интеграции данных на основе онтологий // Журнал «Вестник НГУ», серия «Информационные технологии» -Новосибирск 2008 6 вып. 2 ВВПасічник ВРезніченко .А. Організація баз даних та знань: підручник для ВНЗ Видавнича група BHV 2006 384