<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Разработка семантических электронных библиотек на основе онтологических моделей</article-title>
      </title-group>
      <fpage>143</fpage>
      <lpage>151</lpage>
      <abstract>
        <p>Аннотация. Рассматриваются основные функции электронных библиотек на основе использования семантических технологий, делается постановка задач их реализации. Предлагаются методы их решения и демонстрируются примеры реализации функций семантической электронной библиотеки в разработанной системе.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>Под электронными библиотеками (ЭБ)
понимаются информационные системы,
позволяющие автоматизировать работу
пользователей с различными электронными
ресурсами: документами, изображениями,
мультимедиа-файлами. Реализация подобных
систем сталкивается с рядом ключевых проблем [1]:</p>
      <p>• интеграция разнородной информации
(электронных ресурсов, пользовательских
профилей, структур знаний предметных областей),
представленной разными способами на основе
использования различных метаданных;</p>
      <p>• обеспечение надёжности результатов поиска
и навигации по ресурсам;</p>
      <p>• обеспечение точности категоризации
электронных ресурсов.</p>
      <p>Основной причиной возникновения этих
проблем является описание электронных ресурсов
(ЭР) в системе в виде набора терминов
естественных языков (ключевых слов) и
формирование логических выводов об их
смысловом содержании без учёта синонимии,
полисемии и омонимии. Это влечёт за собой
снижение качества функций, предоставляемых ЭБ.</p>
      <p>Для решения перечисленных проблем и
повышения эффективности работы с ЭР требуется
выполнять работу с их семантикой, для чего
используются модели описания семантики
(таксономии, тезаурусы, онтологии) и технологии
Semantic Web (семантические технологии).
Использование таких технологий позволяет
реализовать работу с ЭР на новом уровне, с учётом
содержащегося в них смысла. Электронные
библиотеки, разработанные с использованием
подобных технологий, обычно называются
семантическими ЭБ (СЭБ).</p>
      <p>В данной статье предлагается способ реализации
2 Онтологический поход к описанию ЭР</p>
      <p>Основной идеей данного подхода является
использование онтологий предметных областей для
аннотирования содержания электронных ресурсов
[2]–[4]. В СЭБ описание электронных ресурсов,
содержащих знания из разных предметных
областей, выполняется с использованием
специально разработанных онтологий этих
областей, описанных с помощью таких языков, как
RDFS или OWL [5],[6].</p>
      <p>Под описанием (аннотированием) ресурса
понимается его семантическое метаописание, в виде
набора простых высказываний (триплетов) на
основе онтологической модели, в состав которых
могут входить контекстные и контентные
семантические метаданные.</p>
      <p>Сделаем вначале несколько базовых
определений.</p>
      <p>Определение 1. Под онтологической моделью
(онтологией) O понимается знаковая система C, P,
I, L, T, где, C – множество элементов, которые
называются понятиями; P – множество
элементов, называемые свойствами (двуместными
предикатами); I – множество экземпляров
понятий; L – множество текстовых меток или
значений понятий и свойств; T – частичный
порядок на множестве C и P.</p>
      <p>С помощью набора предикатов P онтологии
могут описываться различные отношения между
понятиями и экземплярами. Эти отношения
задаются с использованием простых утверждений
(триплетов) s, p, o, где s и o – это субъект и объект
высказывания, а p ∊ P – это предикат онтологии O.</p>
      <p>Считаем, что любому свойству p ∊ P может быть
задан весовой коэффициент (семантический вес) pv
∊ [0, 1], задающий смысловую близость между
субъектом и объектом утверждения (1 – субъект и
объект считаются сходными по семантике, а 0 – не
похожими), составленного с использованием
данного свойства.</p>
      <p>Определение 2. Контекстными метаданными
ресурса s (заданного с помощью идентификатора
URI) называется набор простых утверждений
(триплетов) Mк = {ti = s, pi, oi  | i = 1, n}, где s ∊ I
– это аннотируемый ресурс (субъект), o ∊ C  I  L
– объект утверждения, p ∊ P – отношение между
субъектом и объектом.</p>
      <p>Таким образом, под набором Mк ресурса s в СЭБ
понимаются утверждения о его связи с другими
объектами, понятиями из общих онтологий
библиотеки, таких как онтологии пользователей,
онтологии ресурсов и онтологии предметных
областей.</p>
      <p>Определение 3. Контентные метаданные
ресурса – это набор простых утверждений
(кортежей) Mc = {tj = sj, pj, oj, vj | j = 1, m}, где s ∊ C
 I – это субъект утверждения, o ∊ C  I – объект
утверждения, p ∊ P – отношение между субъектом
и объектом, а v – весовой коэффициент, который
оценивает значимость данного утверждения.</p>
      <p>Под набором Mc ресурса s понимаются
утверждения о знаниях, содержащихся в самом
аннотируемом ресурсе.</p>
      <p>В СЭБ набор М(s) = Mк(s)  Mс(s) будет
называться семантическими метаданными ресурса s.
Таким образом, все компоненты библиотеки
(электронные ресурсы, пользователи, категории и
т.п.) описываются метаданными, представленными с
помощью RDF-триплетов на основе использования
элементов некоторых онтологий. Множество
триплетов, описывающих онтологию O и их
экземпляры s, формирует базу знаний (БЗ,
Knowledge Base) СЭБ. К этой базе знаний могут
выполняться запросы, описанные на некотором
языке (например, SPARQL или SERQL [8], [9]), и на
основе их обработки могут решаться различные
задачи, позволяющие реализовать услуги,
предоставляемые СЭБ.
3 Постановка задач и их решение</p>
      <p>Доступные функции СЭБ (семантический поиск,
категоризация и формирование рекомендаций)
реализуются с учетом семантики описаний ЭР. В
связи с этим необходима некоторая оценка
(метрика) семантической близости различных
объектов.
3.1 Семантическая близость</p>
      <p>Семантическая близость (смысловое сходство)
может определяться между разными компонентами
триплетов, триплетами и наборами триплетов.
Существуют различные методы вычисления таких
метрик [4], которые имеют свои сильные и слабые
стороны. В рамках данной работы они не
анализируются. В ходе выполнения исследований по
созданию СЭБ авторами были разработаны новые
методы оценки семантической близости,
учитывающие специфику разрабатываемой системы.
3.1.1 Метод вычисления семантической близости
между компонентами триплетов</p>
      <p>Пусть Sim(α, β) – семантическая близость между
элементами α и β, где α, β  C  I  P  T. Для
вычисления Sim(α, β) необходимо построить
неориентированный граф GO из всех имеющих
триплетов в БЗ. Граф GO создаётся в соответствии
со следующими правилами:</p>
      <p> используются только триплеты, у которых
значения весовых коэффициентов предикатов не
равны нулю (pv ≠ 0);</p>
      <p> вершинами графа являются субъекты и
объекты триплетов, а ребра графа, соединяющие
субъекты с объектами имеют веса, равные
значению pv предиката того триплета, с
использованием которого они были сформированы;</p>
      <p> инверсное отношение (на основе предиката
owl:inverseOf) между предикатами p1 (pv1) и p2
(pv2) добавляет в граф два ребра с весами pv1 и pv2,
например: для триплета s, p1, o добавляются
следующие два ребра: s, pv1, o, o, pv2, s;</p>
      <p> симметричное отношение добавляет в граф
два ребра с равными весами, например:
&lt;owl:sameAs&gt; добавляет два ребра со значениями
pv = 1.0.</p>
      <p>Под путём PATH(α, β) между двумя вершинами α
и β графа GO понимается набор рёбер (предикатов)
ведущих от вершины α до вершины β, с учётом их
направленности. В этом случае значение Sim(α, β)
между этими вершинами вычисляется следующим
образом:</p>
      <p>Sim  ,   max SimPATHi ( , ), (1)</p>
      <p>i1k
где k – число возможных путей графа GO от
вершины α до вершины β. Значение семантической
близости между элементами α и β по направлению
пути i SimPATHi (α, β) определяется по следующей
формуле:</p>
      <p>hi
SimPATHi ( ,  )   pvi, j , (2)</p>
      <p>j1
где hi – число семантических отношений между
элементами α и β на пути i, pvi,j – значение веса
ребра на основе j-ого семантического предиката на
пути i. На основе формул 1 и 2 можно получить
окончательную формулу для определения
семантической близости между вершинами α и β:</p>
      <p>
         hi 
Sim ,    max SimPATHi ( ,  )  max  pvi, j  (
        <xref ref-type="bibr" rid="ref1 ref4">3</xref>
        )
      </p>
      <p>i1k i1k  j1 
Величина Sim(α, β) удовлетворяет следующим
свойствам: Sim(α, β) ∊ [0,1]; Sim(α, β) = 0 при
отсутствии пути от α к β; Sim(α, α) = Sim(β, β) = 1. В
исключительном случае Sim(α, β) может равняться
1, при условии существовании инверсного
отношения между элементами α, β.
3.1.2 Метод вычисления семантической близости
между триплетами
Пусть Sim(t1, t2) – семантическая близость между
триплетами t1 и t2. Близость между триплетами
вычисляется на основе близостей между их
компонентами. В данной работе учитываются
свойства инверсного отношения между предикатами
(Если два предиката p1 и p2 имеют отношение p1,
owl:inverseOf, p2, то при наличии триплета s, p1, o
подразумевается триплет o, p2, s) [7].</p>
      <p>Имеются следующие две ситуации:
 если t1, t2  Mк: то Sim(t1, t2) вычисляется по
следующей формуле:</p>
      <p>Sim(t1,t2)  Sim( p1, p2)Sim(o1, o2)
(4)
3.1.3 Метод вычисления семантической близости
между наборами триплетов</p>
      <p>Семантическая близость между наборами
триплетов может быть вычислена с использованием
двух методов: на основе метода предложенного в
работе [10] и метода косинусной меры в модели
векторного пространства [11]. Для вычисления
семантической близости между наборами триплетов
T1 = {ti=si, pi, oi | i = 1, k} и T2 = {tj=sj, pj, oj | j = 1,
h} используются следующие формулы:</p>
      <p> max Sim(ti ,T2 )
Sim(T1,T2 )  tiT1
k
 max Sim(ti , t j )
 i1 j1h</p>
      <p>k
Sim(T1,T2 ) </p>
      <p>T1
и

T1 T2
T12  T 2</p>
      <p>2
k h
  Sim(ti , t j )
i1 j1
k k h h
  Sim(ti , t j )   Sim(ti , t j )
i1 j1 i1 j1
где Sim(T1,T2 ) ∊ 0, 1 и Sim(ti , t j ) – семантическая
близость между триплетами, вычисляемая по
формуле 4 (если  ti, tj  Mк) или формуле 5 (если 
ti, tj  Mс).
3.2 Семантический поиск</p>
      <p>Как отмечалось ранее, метаописание ЭР на
основе онтологической модели О рассматривается с
точки зрения его контекста и контента. На основе
контекстных метаданных и контентных метаданных,
запрос семантического поиска q представляется в
виде набора М(q) = (Mк(q), Mс(q)), а объект
кандидата d (возможный результат на данный
запрос) – М(d) = (Mк(d), Mс(d)). Тогда, задачу
семантического поиска можно переформулировать
следующим образом: Имеется запрос q с его
набором М(q), тогда результатом выполнения
данного запроса q будет конечный набор из k
объектов знаний (ЭР) D = {di | i = 1, k}, где каждый
d с набором М(d) удовлетворяет следующему
условию:</p>
      <p>Sim(M(q), M(d) =  ×Sim(Mк(q), Mк(d)) + (8)
β×Sim(Mc(q), Mc(d)) &gt; ɛ,
где ɛ  (0, 1) – пороговое значение, α и β –
коэффициенты близости по контексту и по контенту,
соответственно и α + β = 1.0. Значения α и β
настраиваются так, чтобы значение семантической
близости корректно определяло важность контента и
контекста искомого объекта. Если более важным
является содержание искомого объекта (контента),
тогда значение β превышает значение α и наоборот.</p>
      <p>Кроме семантического поиска, в СЭБ также
доступен и поиск по графу, который получает
широкое применение в социальных сетях
(например: Facebook) [13].
3.3 Формирование рекомендаций</p>
      <p>В данной работе под формированием
рекомендаций понимается предоставление
пользователям набора ресурсов, релевантных
рассматриваемому ЭР. Пусть в СЭБ имеется ЭР d с
метаданными М(d) = (Mк(d), Mс(d)). Задача
формирования рекомендаций для документа d может
рассматриваться как выполнение семантического
поиска с использованием запроса q = d с наборами
Mк(d) и Mс(d). Набор кандидатов R = {dri | dri ≠ d  i
= 1, h} на запрос q считаются рекомендуемыми для
документа d если для любого dr  R выполняется
условие:</p>
      <p>
        ×Sim(Mк(d), Mк(dr)) + β×Sim(Mc(d), (
        <xref ref-type="bibr" rid="ref12">12</xref>
        )
Mc(dr)) &gt; ɛ
      </p>
      <p>Выборы значений α, β и порогового значения ɛ
делаются вручную или автоматически на основе
количества триплетов метаописаний ресурса d.
3.4 Автоматическая категоризация</p>
      <p>В СЭБ пользователь может создавать свои
категории (рубрики), а система автоматически будет
относить релевантные ресурсы к заданным
категориям. Одна категория может включить в себя
другие категории, и они структурируются в виде
какой-либо иерархии (например: категория –
подкатегория).</p>
      <p>Категория k может описываться конечным
набором шаблонных ресурсов Dk = {tri | i = 1, h} и
каждый tri имеет своё метаописание M(tri). Любой
ресурс dr  Dk считается релевантным к заданной
категории k при выполнении следующего условия:
,
(6)
(7)
Рис. 1. Программная архитектура системы SemDL
×Sim(Mк(Dk), Mк(dr)) + β×Sim(Mc(Dk), (13)
Mc(dr)) &gt; ɛ,
где Мк(Dk) = Мк(tr1)  …  Мк(trh), Мс(Dk) =
Мс(tr1)  …  Мс(trh). В качестве шаблонных
ресурсов могут служить существующие ЭР или
наборы триплетов (контекст и контент), созданные
вручную для описания созданной категории. Кроме
метода категоризации по набору шаблонных
ресурсов в СЭБ выполняется категоризация по
элементам используемых в СЭБ онтологий,
описывающих предметные области.
3.5 Метод просмотра</p>
      <p>В СЭБ все ЭР (экземпляры), понятия (элементы)
онтологии (кроме лексических и числовых данных)
имеют уникальные идентификаторы (URIs). Такими
идентификаторами могут быть субъекты, объекты и
предикаты триплетов в БЗ. В связи с этим имеется
возможность просмотра содержания СЭБ по
субъектам или объектам описаний ЭР. Реализация
функции просмотра позволяет пользователям
находить и просматривать все допустимые
отношения (триплеты), связанные с
рассматриваемым ресурсом. Например: по ссылке
автора ресурса, можно найти все его публикации,
его интересы и т.п., а далее по этим публикациям и
интересам могут быть выполнены следующие
переходы.
4 Программная реализация в SemDL</p>
      <p>Предложенные методы решения задач по
реализации описываемых функций СЭБ применены
в разработанной системе SemDL [10].
4.1 Программная архитектура SemDL</p>
      <p>Программная архитектура системы SemDL
показана на рис. 1. Она логически разделена на
четыре уровня. В соответствии с этим разделением,
пользователи взаимодействуют с системой с
помощью веб-интерфейса и под контролем системы
могут получить доступ к интересующим их
функциям системы. Системные компоненты
(пакеты) группируются по четырём категориям на
основе их функциональности:</p>
      <p> ПРЕДСТАВЛЕНИЯ (VIEWS): включают в себя
различные разработанные теги (например,
HTMLтеги) и сервлеты (servlets), которые непосредственно
обрабатывают полученные запросы и возвращают
ответы системы.</p>
      <p> АННОТАЦИЯ (ANNOTATION): включает
функции для работы с текстовыми документами
(извлечение, индексирование). В основном, данный
пакет выполняет поиска кандидатов для
аннотирования ресурсов (создание метаописания
ЭР). Индексирование и поиск ключевых слов
возлагается на библиотеку с открытым исходным
кодом LUCENE ENGINE [14], [15].</p>
      <p> ГРАФ ОЦЕНОК (WG): данный пакет
предназначен для создания и индексирования графа
семантических оценок GO, и вычисляет
семантическую близость между компонентами
триплетов, наборами триплетов по контенту и
контексту. Элементарные операции с графом
осуществляется с помощью библиотеки с открытым
исходным кодом JGRAPH [16]-[18].</p>
      <p> СЕРВИСЫ SEMDL: данный пакет
осуществляет доступ к базе знаний (SESAME) и
выполняют различные операции с хранимыми
данными, а также обеспечивают фильтрацию
ресурсов по наборам триплетов контента и
контекста. Для работы с SESAME используется
библиотека с открытым исходным кодом
OPENRDF-SESAME-API [19], [20].
4.2 Реализация</p>
      <p>Примеры интерфейса системы SemDL показаны
на рис. 2–3. Составление запроса с использованием
набора триплетов по контексту или контенту для
семантического поиска выполняется с помощью
рекомендации субъектов, предикатов и объектов на
основе вводимых терминов (слов). Результаты
поиска, рекомендации или категоризации
ранжируются в порядке уменьшения оценок
семантической близости. Ресурсы в результатах
кратко показываются с основными свойствами
(авторы, ключевые слова), по которым можно
выполнять переходы к другим ресурсам. При работе
с категориями и рекомендациями для получения
желаемых результатов можно настраивать значения
параметров α, β и ε. Значения параметров α и β по
умолчанию определяются на основе количества
триплетов для описания контекста и контента
ресурса.
4.3 Обоснование полученного решения</p>
      <p>Процесс семантического поиска. Схема
процесса выполнения семантического поиска
показана на рис. 4. Пользователь выполняет
семантический поиск с помощью составленных
триплетов контекста и контента M(q). На основе
M(q) выполняется фильтрация возможных
кандидатов (ЭР) d, которые могут быть ответом на
запрос q. В результате чего получаются наборы: SPRK
– набор возможных кандидатов по контексту и SPRC
– набор по контенту. В дальнейшем между
метаописаниями M(q) и M(d) вычисляются близости
по формуле 8. Ресурсы d, которые удовлетворяют
заданному запросу q, ранжируются по степени
убывания значений их близости обрабатываемому
запросу.</p>
      <p>Фильтрация возможных кандидатов. Для
повышения эффективности работы данного
алгоритма имеется возможность выполнять
фильтрацию возможных кандидатов с
использованием описанных ниже методов.</p>
      <p>Метод фильтрации по набору триплетов
контекста. Пусть задан набор триплетов контекста
некоторого объекта s: TK = {ti = s, pi, oi | i = 1, k}.
Для любого элемента e триплета имеется непустой
список связанных элементов по семантике Exs:
Exs(e) = {e, ei | i = 0, h  Sim(e, ei) &gt; }, где 
пороговое значение близости и Sim(e, ei)
вычисляется по формуле 3.</p>
      <p>Пусть ExsP(TK) – список всех предикатов из
набора TK и их связанных элементов по семантике,
ExsP(TK) = Exs(p1)  …  Exs(pk); ExsO(TK) = Exs(o1)
 …  Exs(ok) – список всех объектов из набора TK
и их связанных элементов по семантике.</p>
      <p>
        На основе списков связанных элементов по
семантике предложенный метод фильтрации по
набору TK допускает только тот ресурс prk ∊ SPRK с
набором триплетов его контекста TPRK = {tj = prk, pj,
oj | j1, h}, который удовлетворяет следующему
условию:
( tj TPRK)  (pj ExsP(TK))  (oj ExsO(TK)) (
        <xref ref-type="bibr" rid="ref14">14</xref>
        )
      </p>
      <p>Метод фильтрации по набору триплетов
контента. Пусть заданный набор триплетов
контекста некоторого объекта s: TС = {ti = si, pi, oi | i
= 1, k}. Для набора TС имеются следующие списки
связанных элементов по семантике для компонентов
всех триплетов: ExsS(TC) = Exs(s1)  …  Exs(sk);
Exs(p1)  …  Exs(pk); ExsO(TK) = Exs(o1)  … 
Exs(ok).</p>
      <p>На основе списков связанных элементов по
семантике предложенный метод фильтрации по
набору TC допускает только тот ресурс prc ∊ SPRC с
набором триплетов его контента TPRC = {tj = sj, pj, oj
| j = 1, h}, который удовлетворяет следующему
условию:</p>
      <p>
        ( tj TPRC)  (sj ExsS(TC))  (pj ExsP(TC)) (
        <xref ref-type="bibr" rid="ref16">15</xref>
        )
 (oj ExsO(TC))
      </p>
      <p>Условия фильтрации (14 и 15) могут описываться
на языках запросов SPARQL или SERQL, которые
эффективно обрабатываются сервером БЗ.</p>
      <p>Пример шаблона запроса на языке SERQL для
фильтрации возможных кандидатов некоторого
объекта S по заданным наборам триплетов показан
ниже.
/*Запрос на фильтрацию возможных
кандидатов по набору TK */
SELECT S FROM
{S} P {O}
WHERE P IN ExsP(TK) AND O IN ExsO(TK)
USING NAMESPACE
…
/*Запрос на фильтрацию возможных
кандидатов по набору TC */
/* CONTEXT S – триплеты контента объекта
S */
SELECT S FROM CONTEXT S
{Sc} Pc {Oc}
WHERE Sc IN ExsS(TC) AND Pc IN ExsP(TC) AND Oc</p>
      <p>IN ExsO(TC) USING NAMESPACE …
Рис. 2. Составление триплетов для поиска
Рис. 3. Интерфейс категоризации или рекомендации на основе метаописаний</p>
      <p>M(q),  Фильтрация
M(q) = Mк(q)  (Mc(q) кандидатов d
d SPRK  SPRC Вычисления близости</p>
      <p>между M(q) и M(d)
Рис. 4. Схема процесса семантического поиска</p>
      <p>Ранжирование
элетронных ресурсов d
Mc(d)
_:2013051402540193 _:title
_:type
_:hasKeyword
_:hasKeyword
_:hasAuthor
_:hasAuthor
_:Document
_:Semantic_Technology
_:Semantic_Digital_Library
_:Ле_Хоай
_:Тузовский</p>
      <p>O №
1
2
3
4
5
Количество триплетов контекста (k): 5
ЭЛЕКТРОННЫХ 1
ОСНОВЕ
rdf:type
_:hasKeyword
_:hasKeyword
_:hasKeyword
_:hasKeyword
_:hasKeyword
_:hasAuthor
_:hasAuthor
РАЗРАБОТКА
БИБЛИОТЕК НА
СЕМАНТИЧЕСКИХ ТЕХНОЛОГИЙ
_:Article
_:Semantic_Technology
_:Semantic_Digital_Library
_:Digital_Library
_:Semantic_Search
_:Knowledge_System
_:Ле_Хоай
_:Тузовский
Для i = 1 и j = 1→8 величина p(q)1 = rdf:type, а
p(d)1→8  {_:title,rdf:type,_:hasKeyword, _:hasAuthor}.
Так как в используемой онтологической модели нет
семантических отношений между предикатами p(q)1
и p(d)1→8 (но могут быть семантические отношения
между другими предикатами), то max(Sim(t1, Mк(d))
= max (Sim(pi, pj)  Sim(oi, oj) =(Sim(p1, p2) </p>
      <p>i1, j18
Sim(o1, o2), так как Sim(pi, pj) = 0 при j≠2.</p>
      <p>Тогда в данном случае получается следующая
окончательная формула: max(t1, Mк(d)) =
Sim(rdf:type, rdf:type)  Sim(:_Document, _:Article) =
Sim(:_Document, _:Article).</p>
      <p>Для i = 2 и j = 1→8 получаем:
max(Sim(t2, Mк(d)) = Sim(_:Semantic_Technology,
_:Semantic_Technology) = 1.
Sim(_:Document, _:Article) 1111 ,
</p>
      <p>5
Sim(_:Document, _:Article)  4</p>
      <p>5
Для определения величины Sim(_:Document,
_:Article) используется граф семантических
отношений GO (рис. 6). Здесь символы «_:»
обозначают некоторое пространство имен понятий.</p>
      <p>В показанном фрагменте графа GO используются
четыре семантических отношений:</p>
      <p>subClassOf (подКласс), subPropertyOf
(ПодСвойство), hasBroader (Уже) и hasNarrower
(Шире). Отметим, что все эти предикаты
отображают таксономические отношения (на
практике могут использоваться и другие
предикаты). В таксономической иерархии имеются
два отношения, которые либо обобщают
(subClassOf, subPropertyOf, hasBroader), либо
детализируют (hasNarrower) понятия.</p>
      <p>Предпочтение всегда отдаётся детализации, это
означает, что при поиске некоторого понятия более
важными являются те понятия, которые детализуют
рассматриваемое понятие. В связи с этим можно
задать значения предикатом следующим образом:</p>
      <p> Если предикат p описывает отношение в
направлении детализации, то pv &gt; 0.5. Например, в
данной работе pv(hasBroader) = 0.8.</p>
      <p> Если предикат p описывает отношение в
направлении обобщения, то pv &lt; 0.5. Например, в
данной работе pv(hasNarrower) = 0.4.
s
u
b
C
l
a
s
s
O
f
_:Resource
_:Document
_:Article
_:Semantic_Se</p>
      <p>arch
_:hasCreate
r
subPropertyOf
_:Digital_Library
_:Semantic_Digital_Librar
y
_:Semantic_Co
ntext_Search
_:Information_</p>
      <p>Retrieval</p>
      <p>hasBroader
Information_S
ystem
hasBroader
_:Knowledge_Syste</p>
      <p>m
_:Semantic_An</p>
      <p>notation
_:Metadata
_:Semantic_Te
chnology</p>
      <p>hasNarrower
_:hasAuthor
_:OWL
_:RDF
_:RDFS
Рис. 6. Фрагмент графа семантических отношений GO
Все значения веса предикатов могут быть заданы
специалистом, поддерживающим работу СЭБ, в
соответствии с его пониманием онтологии
предметной области.</p>
      <p>В рассматриваемом случае pv(subClassOf) = 0.7 в
направлении детализации, a в направления
обобщения pv(subClassOf) = 0.3, а это значит, что
Sim(_:Resource, _:Article) = 0.7, а Sim (_:Resource;
_:Article)=0.3 и тогда</p>
      <p>Sim(_:Document, _:Article)  4</p>
      <p>5</p>
      <p>Повышение эффективности электронных
библиотек в значительной степени связано с
использованием в их работе описания семантики
электронных ресурсов. Для создания таких ЭБ
требуется решение целого комплекса новых задач. В
данной статье предложены методы описания
семантики ЭР и вычисления семантической
близости, рассмотрена реализация стандартных
функций электронных библиотек с их
использованием. Выполнение тестирования
показало высокие результаты со средними
значениями критерий: Точность = 100%, Полнота =
94%.
Литература</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          <source>и для i = 3→5.</source>
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          <article-title>Mк(d)) определяется следующим образом: [1] Тузовский, А</article-title>
          . Ф. Разработка семантических
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          <string-name>
            <surname>радиоэлектроники</surname>
          </string-name>
          . - 2011 - №.
          <volume>2</volume>
          (
          <issue>24</issue>
          )
          <string-name>
            <surname>- C.</surname>
          </string-name>
          195-
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          №. 3. C.
          <volume>108</volume>
          -
          <fpage>112</fpage>
          . [4]
          <string-name>
            <surname>Нгуен</surname>
          </string-name>
          , Б. Н.
          <article-title>Модели и методы поиска</article-title>
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          <source>наук / Нгуен Ба Нгок. - Томск</source>
          ,
          <year>2012</year>
          . -
          <fpage>198c</fpage>
          . [5]
          <string-name>
            <surname>Hendler</surname>
            ,
            <given-names>A. J.</given-names>
          </string-name>
          <string-name>
            <surname>Handbook</surname>
          </string-name>
          of Semantic Web
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          <string-name>
            <surname>Technologies</surname>
          </string-name>
          . - Springer,
          <year>2011</year>
          . [6]
          <string-name>
            <given-names>OWL</given-names>
            <surname>Web Ontology Language Overview</surname>
          </string-name>
          //
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>http://www.w3.org/TR/owl-features/. [7] OWL:inverseOf // Доступ осуществлен</mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          http://www.infowebml.ws/rdf-owl
          <source>/inverseOf.htm. [8] SPARQL 1</source>
          .1 Federated Query // Доступ
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          http://www.w3.org/TR/sparql11-federated-query/. [9]
          <article-title>System documentation for Sesame 2</article-title>
          .x // Доступ
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          http://www.openrdf.org/doc/sesame2/system/. [10]
          <string-name>
            <surname>Тузовский</surname>
          </string-name>
          , А. Ф. Онтолого-семантические
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          <string-name>
            <surname>Тузовский</surname>
          </string-name>
          . - Томск,
          <year>2007</year>
          . -
          <fpage>342c</fpage>
          . [11] Vector space model // Доступ осуществлен
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          l. [12]
          <string-name>
            <surname>Хоай</surname>
          </string-name>
          , Л. Программная система «SemDL -
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          <string-name>
            <surname>собственности (Роспатент)</surname>
          </string-name>
          . -
          <fpage>2013</fpage>
          . [13] Facebook graph search // Доступ осуществлен
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          earch. [14]
          <string-name>
            <given-names>Thomas</given-names>
            <surname>Paul</surname>
          </string-name>
          . The Lucene Search Engine //
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>http://www.javaranch.com/journal/2004/04/Luce</mixed-citation>
      </ref>
      <ref id="ref16">
        <mixed-citation>ne.html. [15] Welcome to Apache Lucene // Доступ</mixed-citation>
      </ref>
      <ref id="ref17">
        <mixed-citation>
          http://lucene.apache.org/ . [16]
          <string-name>
            <given-names>Java</given-names>
            <surname>Graph</surname>
          </string-name>
          Visualization Library // Доступ
        </mixed-citation>
      </ref>
      <ref id="ref18">
        <mixed-citation>http://www.jgraph.com/jgraph.html. [17] JGraph Diagram Component // Доступ</mixed-citation>
      </ref>
      <ref id="ref19">
        <mixed-citation>http://sourceforge.net/projects/jgraph/. [18] JGraphT Visualizations via JGraph // Доступ</mixed-citation>
      </ref>
      <ref id="ref20">
        <mixed-citation>
          http://jgrapht.org/visualizations.html. [19]
          <string-name>
            <given-names>The</given-names>
            <surname>Sesame</surname>
          </string-name>
          <string-name>
            <surname>API</surname>
          </string-name>
          // Доступ осуществлен
        </mixed-citation>
      </ref>
      <ref id="ref21">
        <mixed-citation>http://www.openrdf.org/doc/sesame/users/ch07.</mixed-citation>
      </ref>
      <ref id="ref22">
        <mixed-citation>html. [20] Sesame distribution // Доступ осуществлен</mixed-citation>
      </ref>
      <ref id="ref23">
        <mixed-citation>
          <source>me%202/.</source>
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>