<?xml version="1.0" encoding="UTF-8"?>
<TEI xml:space="preserve" xmlns="http://www.tei-c.org/ns/1.0" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://www.tei-c.org/ns/1.0 https://raw.githubusercontent.com/kermitt2/grobid/master/grobid-home/schemas/xsd/Grobid.xsd"
 xmlns:xlink="http://www.w3.org/1999/xlink">
	<teiHeader xml:lang="ru">
		<fileDesc>
			<titleStmt>
				<title level="a" type="main">ОНТОЛОГО-ОРИЕНТИРОВАННАЯ ИНТЕГРАЦИЯ ДАННЫХ В СЕМАНТИЧЕСКОМ ВЕБЕ</title>
			</titleStmt>
			<publicationStmt>
				<publisher/>
				<availability status="unknown"><licence/></availability>
			</publicationStmt>
			<sourceDesc>
				<biblStruct>
					<analytic>
						<author role="corresp">
							<persName><forename type="first">И</forename><forename type="middle">С</forename><surname>Чистякова</surname></persName>
							<email>inna_islyamova@ukr.net</email>
							<affiliation key="aff0">
								<address>
									<addrLine>Институт программных систем НАН Украины, Киев-187, проспект Академика Глушкова</addrLine>
									<postCode>03187, 40</postCode>
								</address>
							</affiliation>
						</author>
						<title level="a" type="main">ОНТОЛОГО-ОРИЕНТИРОВАННАЯ ИНТЕГРАЦИЯ ДАННЫХ В СЕМАНТИЧЕСКОМ ВЕБЕ</title>
					</analytic>
					<monogr>
						<imprint>
							<date/>
						</imprint>
					</monogr>
					<idno type="MD5">2133FF723AEBA481F09F4E7362562C94</idno>
				</biblStruct>
			</sourceDesc>
		</fileDesc>
		<encodingDesc>
			<appInfo>
				<application version="0.7.2" ident="GROBID" when="2023-03-24T05:17+0000">
					<desc>GROBID - A machine learning software for extracting information from scholarly documents</desc>
					<ref target="https://github.com/kermitt2/grobid"/>
				</application>
			</appInfo>
		</encodingDesc>
		<profileDesc>
			<abstract>
<div xmlns="http://www.tei-c.org/ns/1.0"><p>Работа посвящена проблеме интеграции данных в Семантическом Вебе. Рассматривается процесс интеграции, основные его составляющие, а именно: выработка схем интеграции, выработка отображений между моделями, выработка способов манипулирования.</p><p>This paper is devoted to the problem of data integration in the Semantic Web. The process of integration, its main components, namely, construction of integration schemes, the development of mappings between models, the development of ways of manipulation are considered.</p></div>
			</abstract>
		</profileDesc>
	</teiHeader>
	<text xml:lang="ru">
		<body>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Определение проблемы интеграции</head><p>Интеграция данных является одним из наиболее востребованных направлений в современной информационной индустрии. За все годы существования Интернет-пространства в нем скопилось большое количество информации, объем которой с каждым днем возрастает в геометрической прогрессии, а релевантность -в арифметической. Это порождает множество проблем связанных с использованием и хранением данных информационного пространства. Огромные объемы разнородных данных в гетерогенных источниках представляют информацию различными способами и имеют разнообразное функциональное назначение. Интеграция и совместное использование информации из множества таких источников данных является сложной задачей, остающейся неизменно актуальной на протяжении последних десятилетий.</p><p>Можно выделить несколько порождающих причин гетерогенности: 1) различные модели данных. Согласно разным сведениям от 75% до 90% (в зависимости статистического источника) информации хранится в РБД. Однако, на оставшиеся проценты приходится немалое количество данных, хранящихся в структурах, которые определяются совершенно другими моделями данных со своей специфической семантикой. В этих условиях не представляется возможным иметь согласованный доступ одновременно ко всем источникам информации;</p><p>2) различные способы хранения данных (файлы, БД, хранилища и т. д.). Физическая организация хранения информации создает дополнительные препятствия к ее использованию. Интеграция данных должна предоставить единый логический формат организации данных таким образом, что независимо от способа их физического хранения, конечный пользователь имеет единый механизм доступа к содержимому;</p><p>3) существенная распределенность данных. Источники информации изолированы друг от друга, каждый из которых подчиняется концепции «замкнутого мира». Такой подход значительно затрудняет введение принципиально новых понятий различных предметных областей, порождает дублирование данных, что приводит к увеличению объема, но уменьшению релевантности искомой информации. Интеграция данных способна устранить такую изолированность источников друг от друга, тем самым способствуя согласованному использованию уже существующих данных, устранение дубликатов, а также оперативному возникновению новой информации; 4) неполнота и противоречивость данных. Отсутствие семантической составляющей современных источников порождает проблему неполноты сведений каждого из них в отдельности. А при рассмотрении совокупности этих источников возникает проблема противоречивости. Интегрция данных призвана устранить эти недостатки путем введения единого семантического контекста для всех информационных ресурсов, хранящихся в интегрированных источниках; 5) различные способы оперирования данными (манипулирование, поиск, выборка и т. д.). Существующие возможности поисковых систем общего назначения не позволяют обеспечить эффективный поиск информации. Каждая модель данных предполагает существоввания своих собственных средств манипулирования, что порождает их разнообразие, приводящее к гетерогенности данных.</p><p>Ввиду всего вышесказанного становится очевидной важность решения комплексной проблемы интеграции.</p><p>Проблема интеграции данных заключается в таком логическом объединении данных, принадлежащих разнородным источникам, которое обеспечивает единое представление и оперирование этими данными. Система интеграции данных позволяет освободить пользователя от необходимости самостоятельно отбирать источники, в которых находится интересующая пользователя информация, обращаться к каждому источнику по отдельности и вручную сопоставлять и объединять данные из различных источников.</p><p>Акцентируя внимание на разнородности данных, следует прояснить это понятие. Данные разнородны не с точки зрения их физического хранения, а с точки зрения модели их представления. То есть, вне зависимости от места их расположения и способа их хранения, для решения проблемы интеграции важную роль играет модель представления данных со своей специфической семантикой, которая предоставляет механизмы организации работы с данными для конечного пользователя.</p><p>В работе <ref type="bibr" target="#b3">[4]</ref> авторы выделили следующие признаки неоднородности данных: Физические модели данных описывают то, как данные хранятся в компьютере, представляя информацию о структуре записей, их упорядоченности и существующих путях доступа. Физических моделей данных не так много, как логических, а самыми популярными среди них являются обобщающая модель (unifying model) и модель памяти кадров (frame memory).</p><p>Возвращаясь к проблематике интеграции, следует обратить внимание, что согласно <ref type="bibr" target="#b0">[1]</ref> проблема интеграции является комплексной и многоаспектной. В то время, как ее основной целью является обеспечить гомогенное, унифицированное представление данных различных источников, конкретная задача интеграции может зависить от множества факторов. Среди них: архитектурное представление информационной системы; содержимое и функциональность систем; вид информации, которой оперируют системы (числовые данные, мультимедийные данные; структурированные, полу-структурированные, неструктурированные данные); и т. д.</p><p>На сегодняшний день мы выделяем три основных составляющих проблемы интеграции данных:  выработка схем интеграции данных;  выработка отображений между моделями;  выработка способов манипулирования, суть которых раскрывается далее.  отношения -таксономия классов, таксономия свойств, принадлежность индивида классу, область определения и область значений свойства (способы, с помощью которых классы и индивиды могут быть связаны друг с другом);</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Выработка схем интеграции данных</head><p> правила -способ задания других видов ограничений, которые не поддерживаются отношениями.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.">Операции</head><p> теоретико-множественные операции на классах и свойствах (объединение, пересечение, дополнение);</p><p> ограничения свойств по существованию и общности (квантификация свойств);  численные ограничения свойств (функциональные, количественные, качественные);</p><p> и другие. Как видно из всего выше сказанного, используя централизованую схему интеграции данных для решения комплексной проблемы интеграции, онтология наилучшим образом подходит в качестве глобальной схемы, что позволяет в качестве локальной схемы использовать любую модель данных. Вопрос взаимодействия внутри такой системы относится к следующей общей проблеме интеграции -выработке отображений между моделями.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Выработка отображений между моделями</head><p>Рассмотрим абстрактную систему интеграции данных, основанную на архитектуре централизованой схемы. Задача такой системы, называемой также посредником, заключается в том, чтобы предоставить интегрированный доступ к множеству распределенных, разнородных, автономно разработанных источников, без необходимости централизовано хранить всю информацию из источников. Система предоставляет пользователю возможность формулировать запросы на выборку информации из таких источников в терминах глобальной схемы данных (общей системы понятий), которая проектируется «сверху» исходя из интересующих пользователя аспектов предметной области.</p><p>При этом в каждом источнике информация может представляться в терминах собственной схемы данных (системы понятий), соответственно, при включении источника в систему указывается некоторое семантическое отображение между терминами глобальной схемы данных и терминами различных схем данных источников.</p><p>В работе <ref type="bibr" target="#b2">[3]</ref> дается следующее определение системы интеграции данных (СИД).</p><formula xml:id="formula_0">СИД І представляется тройкой   M S G , , , где  G -глобальная схема, описанная в языке G L над алфавитом G A .</formula><p>Алфавит содержит символы каждого элемента G (отношения, если G -реляционная, классы, если G -объектно-ориентированная). В нашем случае, алфавит содержит символы, соответствующие всем концептам и ролям онтологии.</p><p> S -схема источника, описанная в языке S L над алфавитом S A . Алфавит содержит все символы источника.</p><p> M -отображения между G и S , образованные набором утверждений в форме S q ↝ G q , G q ↝ S q где G q и S q -два запроса одинаковой арности, сформулированных в языке</p><formula xml:id="formula_1">G M L , и S M L  соответственно.</formula><p>Запись S q ↝ G q означает, что каждый концепт источника, представленный запросом S q соответствует концепту глобальной схемы, представленной запросом G q (аналогичным образом трактуется утверждение G q ↝ S q ). По утверждению автора, данное определение охватытвает все подходы, известные в литературе, но каждый специфический подход зависит только от характеристик отображений и выразительной мощности схем и языков формулирования запросов.</p><p>Предлагается два подхода, определяющие отображения в СИД. Они называются LAV (Local-as-view) и GAV(Global-as-view).</p><p>LAV</p><formula xml:id="formula_2">В СИД I =   M S G , ,</formula><p>, основанной на LAV-подходе, отображение M связывает каждый элемент s схемы источника S с запросом G q к схеме G . Другими словами, язык запросов S M L , разрешает только выражения, образованные одним символом алфавита S A . Таким образом, LAV отображение -это набор утверждений, по одному на каждый элемент s из схемы S , в форме s↝ G q . С точки зрения моделирования, подход LAV основывается на идее, что каждый элемент источника s должен быть связан запросом q G с соответствующим элементом глобальной схемы. Запрос формулируется в языке источника с последующим переформулированием в терминах G . Добавление нового источника сводится к обогащению набора отображений новыми утверждениями без прочих изменений.</p><p>GAV В GAV-подходе отображения M связывают каждый элемент g схемы данных G запросом S q с элементом источника S . Другими словами, язык запросов G M L , разрешает только выражения, образованные одним символом алфавита G A . Таким образом, GAV-отображение -это набор утверждений, по одному на каждый элемент g из схемы G , в форме g↝ S q . С точки зрения моделирования, подход GAV основывается на идее, что каждый элемент g глобальной схемы должен быть связан запросом S q с соответствующим элементом c выбранным источником данных. Отображение говорит нам, как нужно извлечь данные из источника, когда кто-то хочет оценить различные данные глобальной схемы.</p><p>Главным в подходе является обработка запросов, т. к. с их помощью система знает как использовать источники для извлечения данных. Однако, добавление нового источника является серьезной проблемой, т. к. некоторые элементы глобальной схемы должны быть переопределены.</p><p>У каждого из этих подходов есть свои преимущества и недостатки.</p><p>1. В подходе LAV сложно сформулировать запрос. Представление элемента в ГС одно, а запрос формируется в терминах ИД (алфавит ИД, язык ИД). Но добавление нового ИД не является проблемой, т. к. формулирование запросов -задача самого источника.</p><p>2. В подходе GAV легко сформулировать запрос, т. к. мы сразу знаем, какой запрос к ИД соответствует элементу ИД. Представление элемента едино, алфавит и язык формулирования запросов един. Но добавление нвого источника является проблемой, т. к. некоторые представления необходимо бедт переопределить для формулирования запросов и к новому источнику тоже.</p><p>3. В то время, как проектировщик LAV концентрируется на том, как представить данные источника в терминах ГС, проектировщик GAV решает проблему, как извлечь необходимые данные из предоставленных источников.</p><p>4. Подход нужен для задач, в которых много разнородных ИД, но объем данных не сильно велик. Подход GAV нужен для задач с небольшим количеством источников, но с очень большим объемом данных.</p><p>Принципиально новым является суть понятия отображения. Оно представляет собой запрос, а не очередное отношение между элементами моделей. Это означает, что в основе взаимодействия между элементами моделей лежит некоторый логический аппарат конкретного языка формулирования запроса.</p><p>В своей работе <ref type="bibr" target="#b5">[6]</ref> автор предлагает создавать так называемые «обертки» для каждого из источников системы. Они представляют собой локальные схемы, представленные в той же самой модели данных, что и глобальная схема. Предполагается, что каждый информационный источник «обернут» промежуточным компонентом-адаптером, который отвечает за выборку сведений из источника в рамках единой модели данных, а также за предоставление стандартного технического интерфейса для обращения к источнику (сетевой протокол, язык запросов). Пользователь не взаимодействует с источниками напрямую, а обращается к выделенному компоненту-посреднику, который отвечает за обслуживание пользовательских запросов и взаимодействие с источниками. «Обертывание» каждого источника информации в локальную онтологию позволяет развиваться онтологии-источнику вне зависимости от других онтологий. Следовательно, задача интеграции может быть упрощена и добавление или удаление источников можно легко поддерживать.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Выработка способов манипулирования</head><p>После выработки отображений между моделями данных возникает вопрос применимости таких систем, то есть каким образом можно манипулировать созданными глобальными схемами и управлять данными, расположенными внутри различных систем. «Обертывание» источников данных углубляет этот вопрос тем, что дает возможность использовать эти источники вне существующей системы, а также расширяет возможности манипулирования данными на уровне единой принятой модели.</p><p>Поскольку мы сводим всю комплексную проблему интеграции данных к онтологической модели, то ввиду этого остро возникает проблема манипулирования онтологиями. Решая эту проблему, мы решаем в полной мере общую проблему интеграции.</p><p>В проблеме манипулирования онтологий важны следующие два аспекта: выработка подходов по интеграции онтологий и определение множества операций манипулирования онтологиями, которые обсуждаются далее.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Интеграции онтологий</head><p>В работе <ref type="bibr" target="#b1">[2]</ref> дается три определения интеграции онтологий: 1. Интеграция как повторное использование. В данном случае, интеграция онтологий рассматривается как процесс создания новой онтологии с помощью повторного использования уже существующих, доступных онтологий (путем сборки, расширения, специализации, адаптации) (рис. </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Выводы</head><p>Интеграция данных в информационном пространстве является важной научной проблемой. Существует множество подходов к её решению. Было выявлено три составляющие комплексной проблемы интеграции, в процессе рассмотрения которых мы остановились на централизованой схеме интеграции данных и онтологической модели, в качестве единой модели на роль глобальной схемы данных. Приведена аргументация данного выбора, дана характеристика онтологии как модели данных, проанализированы способы манипулирования онтологиями. Были определены операции манипулирования онтологиями, а именно уточнение, унификация, отображение согласование, интеграция, наследование.</p></div><figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_0"><head></head><label></label><figDesc>Опираясь на исследования<ref type="bibr" target="#b0">[1]</ref>, а также фундаментальную работу<ref type="bibr" target="#b2">[3]</ref> мы рассматриваем 2 типа схем интегрции данных: Р2Р (peer-to-peer) схема (ещё её называют одноранговой) и централизованая схема.В Р2Р схеме (рис. 1) не существует глобальных точек контроля. В основе каждого узла, принимающего участие в схеме, лежит своя модель данных. Каждый узел равноправен и может принимать запросы пользователя к информации, распределенной по всей системе. Преимущества этой схемы заключаются в следующем: где бы ни был выполнен запрос на информацию, в какой из точек данные ни находились бы, узел, принявший запрос, имеет прямой и непосредственный доступ к каждой точке системы, вследствие чего ему открывается абсолютно вся информация, хранящаяся в ней. Существенным недостатком можно назвать следующее: при добавлении нового узла в схему, необходимо установить соответствия с ним существующих узлов. При небольшом объеме это сделать нетрудно, но с последующим увеличением количество точек, возрастает количество взаимодействий, которые требуется установить внутри схемы, возрастает сложность этих взаимодействий, увеличивается трудоемкость работы проектировщика. Система, основаная на такой схеме становится все более громоздкой и хрупкой, гетерогенность моделей налагает дополнительные сложности на установление связей друг с другом, исходя из особенностей собственных структурных отличий, а также особенностей своих компонент. Рис. 1. Одноранговая (Р2Р) схема интеграции данных Данные недостатки породили развитие другого подхода -централизованой схемы. На сегодняшний день она является наиболее успешной для решения комплексной проблемы интеграции данных. Применяется во многих системах и лежит в основе подходов к выработке отображений между моделями системы, а также к разработке способов манипулирования. В централизованной схеме (рис. 2) обычно присутствует одна глобальная точка контроля. В основе этого узла лежит своя модель данных. В работе [3] ее называют глобальной схемой, а все остальные моделилокальными схемами, или схемами источников. Мы также будем придерживаться этой терминологии в дальнейшем. Основная роль глобальной схемы -предоставление пользователю единого интерфейса для доступа к информации, хранящейся в реальных источниках данных. Преимуществом такой системы является возможность объедининения любого количество узлов без существенных потерь, т. к. сами локальные схемы могут взаимодействовать между собой любым доступным способом. Главным остается связь с глобальной схемой, обеспечивающей единое согласованое представление данных пользователю и предоставление централизованого поиска. Критическим моментом централизованой схемы остается разработка отображений между моделями, а именно схемами источников и глобальной схемой. При рассмотрении подходов взаимодействия глобальной и локальных схем будут рассмотрены недостатки каждого из подходов, которые в целом являются недостатками всех централизованой схемы интеграции данных. Рис. 2. Централизованая схема интеграции данных В своих исследованиях, при выработке схем мы остановились именно на втором подходе, а именно на централизованой схеме интеграции данных. Развивая далее эту тему, возникает вопрос, а какую же модель данных выбрать в качестве глобальной схемы? Рассмотрев современные модели данных, наиболее подходящей для выполнения задачи предоставления пользователю единого согласованого представления данных, является онтологическая модель или онтология.В свое время было сформулировано понятие семантической интеграции данных как процесса использования концептуального представления данных, а также их взаимоотношений для ликвидации возможных неоднородностей<ref type="bibr" target="#b3">[4]</ref>.Мы уточнили это определение следующим образом. Семантическая (онтолого-ориентированная) интеграция данных -использование онтологии в качестве объединяющей модели для: описания и поддержания отображений между различными моделями данных;  унифицированного манипулирования данными. Использование онтологий для семантической интеграции данных аргументируется следующими факторами: онтология является самой развитой моделью данных;  онтологии обладают более развитой семантикой;  онтологии предоставляют самые мощные механизмы вывода;  онтологии имеют четкую формальную спецификацию (дескриптивная логика). Мы понимаем онтологию в ее стандартном, классическом определении, которые сформулировано много лет назад, а именно.Онтология -это формальная, явная спецификация согласованной концептуализации<ref type="bibr" target="#b4">[5]</ref>.Онтология, как модель данных, представляется следующими компонентами: 1. Структура.  классы -концептуальное представление некоторых общих понятий;  индивиды -конкретные экземпляры класса;  свойства -позволяют утверждать общие факты о классах и специфические факты об индивидах. 2. Ограничения целостности.</figDesc></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_1"><head>2 . 3 .</head><label>23</label><figDesc>3). Рис. 3. Интеграция онтологий: повторное использование В процессе интеграции существуют одна или несколько первоначальных онтологий ) , итоговая онтология O , которая образуется в результате процесса интеграции. Домены ) , отличаться от результирующего домена D , но между ними могут существовать связи. При этом, обычно n k  , но такое может быть не всегда, так как в процессе интеграции могут участвовать несколько различных онтологий принадлежащих одному и тому же домену. В результате процесса интеграции образуется онтология O такая, что аналогичной не существует. В противном случае одна из них должна будет повторно использовать другую. Интеграция как объединение. В данном случае, интеграция онтологий рассматривается как процесс создания новой онтологии с помощью объединения нескольких онтологий в одну которая обобщает их все (рис. 4). Рис. 4. Интеграция онтологий: объединение В процессе интеграции участвуют несколько первоначальных онтологий онтологий ) итоговая онтология O , которая образуется в результате процесса интеграции, которую в этом случае иногда называют объединением. Начальные онтологии принадлежат одному и только одному домену S, которому также принадлежит результирующая онтология. Целью данного процесса является создание более общей онтологии на заданном домене, собирая в единое целое знания нескольких онтологий этого домена. Уровень обобщенности первоначальных онтологий может отличаться. Интеграция как использование в программном обеспечении. В данном случае, интеграция онтологий рассматривается как процесс создания программного приложения, основанного на использовании нескольких онтологий. Рис. 5. Интеграция онтологий: использование В процессе интеграции участвуют несколько первоначальных онтологий онтологий ) результате не создается никакой новой онтологии. Некоторое приложение A просто использует готовые онтологии, а результат зависит от архитектуры и назначения самого приложения. Онтологии должны быть совместимы между собой по следующим критериям: язык описания, онтологические соглашения, уровень детализации, уровень обобщения, модульность, контекст и т. д. Операции над онтологиями. Что касается операций манипулирования онтологиями, то можно выделить следующие два вида операций над онтологиями: сопоставление и оперирование. Сопоставление решает проблему установления различного рода (семантических) соответствий между онтологиями. Оперирование -это набор унарных и бинарных операций создания новых онтологий из существующих. Мы кратко представим только операции сопоставления, как наиболее важные при решении проблемы интеграции онтологий. Уточнение (refinement). Под уточнением онтологий понимают такое сопоставление онтологии A с другой онтологией B , что каждому понятию из онтологии A ставится в соответствие эквивалентное ему понятие в B . Примитивные понятия из онтологии A могут соответствовать непримитивным понятиям онтологии B (рис. 6). Рис. 6. Уточнение Унификация (unification). Онтология приводится к некоему каноническому (эталонному) представлению. Для унификации должна задаваться исходная онтология, которая приводится к результирующей согласно заданной канонической онтологии. Задача унификации множества исходных онтологий становится актуальной при работе с гетерогенными онтологиями (рис. 7). Рис. 7. Унификация Отображение (mapping). Отображение одной онтологии в другую -это функция преобразования одной онтологии в другую (способ перевода объектов одной онтологии в другую), либо сам результат такого преобразования. Часто это означает перевод между понятиями и отношениями. Отображение может быть частичным в том смысле, что не все понятия исходной онтологии отображаются в результирующую. В частности, это означает, что в исходной онтологии существует подонтология, для которой существует полное отображение (рис. 8). Рис. 8. Отображение Согласование (alignment). Это процесс отображения онтологий в обоих направлениях. Согласование, как и отображение, может быть лишь частичным. Спецификация согласования называется артикуляцией (articulation) (рис. 9). Рис. 9. Согласование Интеграция (integration). Это процесс поиска одинаковых частей двух разных онтологий, A и B , при разработке новой онтологии C , которая позволяет выполнить перевод между онтологиями A и B , и, таким образом, позволяет взаимодействие между двумя системами, где одна использует онтологию A , а другаяонтологию B . Новая онтология C может заменить онтологии A и B или может использоваться в качестве промежуточной онтологии для перевода между двумя онтологиями. Интеграция может меняться от согласования к унификации. Наследование (inheritance). Означает, что онтология A наследует все из онтологии B . Она наследует все понятия, отношения и ограничения или аксиомы, и дополнительные знания, содержащиеся в онтологии, не внося при этом какой-либо несогласованности.</figDesc></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0"><head></head><label></label><figDesc></figDesc><graphic coords="8,112.02,534.72,371.28,136.08" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0"><head></head><label></label><figDesc></figDesc><graphic coords="9,162.84,56.64,269.97,208.32" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_0"><head></head><label></label><figDesc>1. Модель. Структурные различия моделей данных порождают схематическую гетерогенность. 2. Синтаксис. Порождается в связи с наличием различных языков описания моделей данных. 3. Семантика. Порождается различным определением данных в различных контекстах.  объектно-ориентированная модель (расширяет определение сущности с целью включения в него не только атрибутов, которые описывают состояние объекта, но и действий, которые с ним связаны, т. е.</figDesc><table><row><cell cols="2">При этом, каждый из этих признаков может присутствовать независимо от двух остальных, например,</cell></row><row><cell cols="2">семантическая гетерогенность может возникать даже в том случае, если схематическая и синтаксическая</cell></row><row><cell cols="2">разнородности отсутствуют (именование концептов и т. д.).</cell></row><row><cell cols="2">В связи с тем, что далее мы будем много раз говорить о моделях данных, следует дать определение этому</cell></row><row><cell>понятию.</cell><cell></cell></row><row><cell cols="2">Данные -представление фактов и идей в формализованном виде, пригодном для передачи и обработки в</cell></row><row><cell cols="2">некотором информационном процессе. Данные, могут подвергаться обработке, и результаты обработки</cell></row><row><cell cols="2">фиксируются в виде новых данных.</cell></row><row><cell cols="2">Модель данных -интегрированный набор понятий для описания и обработки данных, связей между</cell></row><row><cell cols="2">ними и ограничений, накладываемых на данные в некоторой организации.</cell></row><row><cell cols="2">Цель построения модели данных заключается в представлении данных в понятном виде.</cell></row><row><cell cols="2">Можно по-разному характеризовать понятие модели данных. С одной стороны, модель данных -это</cell></row><row><cell cols="2">способ структурирования данных, которые рассматриваются как некоторая абстракция в отрыве от предметной</cell></row><row><cell cols="2">области. С другой стороны, модель данных -это инструмент представления концептуальной модели</cell></row><row><cell cols="2">предметной области и динамики ее изменения.</cell></row><row><cell cols="2">На этапе выработки схем интеграции данных, модель является представлением "реального мира"</cell></row><row><cell cols="2">объектов и событий, а также существующих между ними связей. Это некоторая абстракция, в которой акцент</cell></row><row><cell cols="2">делается на самых важных и неотъемлемых аспектах ПО, а все второстепенные свойства игнорируются.</cell></row><row><cell cols="2">Модель должна отражать основные концепции, представленные в таком виде, который позволит</cell></row><row><cell cols="2">проектировщикам и пользователям обмениваться конкретными и недвусмысленными мнениями о роли тех или</cell></row><row><cell cols="2">иных данных в ПО.</cell></row><row><cell cols="2">Модель данных можно рассматривать как сочетание указанных ниже компонентов [7]:</cell></row><row><cell cols="2"> структурная часть (набор правил, определяющих типы и характеристики логических структур</cell></row><row><cell>данных);</cell><cell></cell></row><row><cell cols="2"> управляющая часть, определяющая типы допустимых операций с данными (описываются правила</cell></row><row><cell cols="2">составления структур более общего типа из структур более простых типов, сюда относятся операции</cell></row><row><cell cols="2">обновления и извлечения данных, а также операции изменения структуры экземпляра модели);</cell></row><row><cell cols="2"> набор ограничений поддержки целостности данных, гарантирующих корректность используемых</cell></row><row><cell cols="2">данных. Сюда входят возможные действия над структурами и правила их выполнения, включающие:</cell></row><row><cell></cell><cell>средства контроля относительно простых условий корректности ввода данных (ограничения);</cell></row><row><cell></cell><cell>средства контроля сколь угодно сложных условий корректности выполнения определенных</cell></row><row><cell cols="2">действий (правила).</cell></row><row><cell cols="2">Модели данных подразделяются на три категории [9]:</cell></row><row><cell cols="2">1. Объектные модели данных (описание данных на концептуальном и внешнем уровнях).</cell></row><row><cell cols="2">При создании объектных моделей данных используются следующие понятия:</cell></row></table><note> сущность -это отдельный концептуальный элемент ПО  атрибут -это свойство, которое описывает некоторый аспект объекта и значение которого следует зафиксировать.  связь -это ассоциативное отношение между сущностями. Наиболее общие типы объектных моделей данных:  ER-модель (Entity-Relationship model);  семантическая модель (онтология);  функциональная модель; его поведение) 2. Модели данных на основе записей (описание данных на концептуальном и внешнем уровнях). В модели на основе записей база данных состоит из нескольких записей фиксированного формата, которые могут иметь разные типы. Каждый тип записи определяет фиксированное количество полей, каждое из которых имеет фиксированную длину. Существуют три основных типа логических моделей данных на основе записей:  реляционная модель данных;  сетевая модель данных;  иерархическая модель данных. 3. Физические модели данных (описание данных на внутреннем уровне).</note></figure>
		</body>
		<back>
			<div type="references">

				<listBibl>

<biblStruct xml:id="b0">
	<monogr>
		<title level="m" type="main">Dittrich Three Decades of Data Integration // All Problems Solved?</title>
		<author>
			<persName><forename type="first">Patrick</forename><surname>Ziegler</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Klaus</forename><forename type="middle">R</forename></persName>
		</author>
		<idno>CH-8057</idno>
		<imprint>
			<biblScope unit="volume">190</biblScope>
			<pubPlace>Zürich, Switzerland</pubPlace>
		</imprint>
		<respStmt>
			<orgName>Database Technology Research Group ; Department of Informatics, University of Zurich Winter thurerstrasse</orgName>
		</respStmt>
	</monogr>
</biblStruct>

<biblStruct xml:id="b1">
	<analytic>
		<title level="a" type="main">Pinto Some Issues on Ontology Integration</title>
		<author>
			<persName><forename type="first">H</forename><surname>Sofia</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Proceedings of the IJCAI-99 workshop on Ontologies and Problem-Solving Methods (KRR5)</title>
				<meeting>the IJCAI-99 workshop on Ontologies and Problem-Solving Methods (KRR5)<address><addrLine>Stockholm, Sweden</addrLine></address></meeting>
		<imprint>
			<date type="published" when="1999-08-02">August 2, 1999</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b2">
	<analytic>
		<title level="a" type="main">Data Integration: A Theoretical Perspective</title>
		<author>
			<persName><forename type="first">M</forename><surname>Lenzerini</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Proc. of the 21st ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems</title>
				<meeting>of the 21st ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems<address><addrLine>PODS; N. Y.</addrLine></address></meeting>
		<imprint>
			<publisher>ACM Press</publisher>
			<date type="published" when="2002">2002. 2002</date>
			<biblScope unit="page" from="233" to="246" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b3">
	<analytic>
		<title level="a" type="main">Huiyong Xiao The Role of Ontologies in Data Integration</title>
		<author>
			<persName><forename type="first">Isabel</forename><forename type="middle">F</forename><surname>Cruz</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Jounal of Engineering Intelligent Systems</title>
		<imprint>
			<date type="published" when="2005">2005</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b4">
	<analytic>
		<title level="a" type="main">Ontologies and Knowledge Bases: Towards a Terminological Clarification</title>
		<author>
			<persName><forename type="first">N</forename><surname>Guarino</surname></persName>
		</author>
		<author>
			<persName><forename type="first">P</forename><surname>Giaretta</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Towards Very Large Knowledge Bases: Knowledge Building and Knowledge Sharing</title>
				<editor>
			<persName><forename type="first">Nicola</forename><surname>Guarino1</surname></persName>
		</editor>
		<editor>
			<persName><forename type="first">Daniel</forename><surname>Oberle2</surname></persName>
		</editor>
		<editor>
			<persName><forename type="first">Steffen</forename></persName>
		</editor>
		<meeting><address><addrLine>Amsterdam</addrLine></address></meeting>
		<imprint>
			<publisher>IOS Press</publisher>
			<date type="published" when="1995">1995. Staab3</date>
			<biblScope unit="page" from="25" to="32" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b5">
	<monogr>
		<author>
			<persName><forename type="first">А</forename><forename type="middle">А</forename><surname>Бездушный</surname></persName>
		</author>
		<title level="m">Математическая модель системы интеграции данных на основе онтологий // Журнал «Вестник НГУ», серия «Информационные технологии» -Новосибирск</title>
				<imprint>
			<date type="published" when="2008">2008</date>
			<biblScope unit="volume">6</biblScope>
			<biblScope unit="page" from="15" to="40" />
		</imprint>
	</monogr>
	<note>вып. 2</note>
</biblStruct>

<biblStruct xml:id="b6">
	<monogr>
		<author>
			<persName><forename type="first">В</forename><forename type="middle">В</forename><surname>Пасічник</surname></persName>
		</author>
		<author>
			<persName><forename type="first">В</forename><surname>Резніченко</surname></persName>
		</author>
		<title level="m">.А. Організація баз даних та знань: підручник для ВНЗ</title>
				<imprint>
			<publisher>Видавнича група BHV</publisher>
			<date type="published" when="2006">2006</date>
			<biblScope unit="page">384</biblScope>
		</imprint>
	</monogr>
</biblStruct>

				</listBibl>
			</div>
		</back>
	</text>
</TEI>
