=Paper= {{Paper |id=Vol-2139/197-203 |storemode=property |title=Моделі та методи використання онтологій у семантичному пошуку у web Models and Methods of Ontology Use for the Web Semantic search |pdfUrl=https://ceur-ws.org/Vol-2139/197-203.pdf |volume=Vol-2139 |authors=Julia Rogushina |dblpUrl=https://dblp.org/rec/conf/ukrprog/Rogushina18 }} ==Моделі та методи використання онтологій у семантичному пошуку у web Models and Methods of Ontology Use for the Web Semantic search== https://ceur-ws.org/Vol-2139/197-203.pdf
      УДК 004.853, 004.55                                                                                                                           Web під семантизацією ІР будемо розуміти встановлення зв’язків між ІР (або їх компонентами), доступ до
                                                                                                                                                    яких забезпечує середовище Web, та елементами певним чином формалізованих знань, які теж є
                                                                                                                                                    доступними через Web. Семантизація інформаційних потреб користувача – це встановлення зв’язків між
                                                                                                                                                    формалізованим поданням цих потреб (запитом, документом-зразком тощо), наданих користувачем за
                                                                                                                                                    допомогою Web-інтерфейсу, та елементами формалізованих знань, теж доступних через Web. Таким чином,
                 МОДЕЛІ ТА МЕТОДИ ВИКОРИСТАННЯ ОНТОЛОГІЙ У                                                                                          у семантичному пошуку проблема співставлення інформаційних потреб користувача з наявними ІР зводиться
                        СЕМАНТИЧНОМУ ПОШУКУ У WEB                                                                                                   до співставлення тих елементів знань, з якими вони пов’язані.
                                                                                                                                                           Семантичний пошук [1] – це окремий випадок пошуку інформації, в якому інформаційні потреби
                                                                                                                                                    користувача в процесі розв’язання певної задачі задовольняються із застосуванням знань про суб’єкти і
                                                               Ю.В. Рогушина
                                                                                                                                                    об’єкти пошукової процедури й методів аналізу цих знань [2]. Для пошуку можуть використовуватися знання,
      В роботі проаналізовано основні напрямки семантизації інформаційних ресурсів Web та теоретичні засади, що можуть                              що стосуються користувача та специфіки його інформаційних потреб (персоніфікація пошуку), знання про
      використовуватися для цього. Розглянуто проблеми, пов’язані з використанням та аналізом інформації з відкритого середовища
      на рівні знань. Обґрунтована потреба в розробці методів та засобів семантичного пошуку в Web та доцільність використанні
                                                                                                                                                    структуру та типи ІР, серед яких здійснюється пошукова процедура, та про ту предметну область (ПрО), до якої
      онтологій для формалізації знань щодо інформаційних потреб користувачів та їх поточних задач. Розглянуто сучасні напрямки                     відносяться ці ІР. Використання знань може бути приховано від користувача (внутрішня база знань пошукової
      розвитку семантичного пошуку та його персоніфікації. Обґрунтована доцільність використання семантично розмічених Wiki-                        системи, до якої користувач не має доступу), що ускладнює розуміння роботи такої системи та зменшує довіру
      ресурсів як джерела знань для побудови онтологій окремих задач, що є підмножинами більших за обсягом та складністю                            до неї, або здійснюватися безпосередньо за його вибором (база знань користувача), що вимагає від користувача
      онтологій предметних областей. Розроблено формальну модель онтології задачі, розглядається її співставлення з формальною
                                                                                                                                                    певної обізнаності у пошуку та додаткових зусиль. Система семантичного пошуку (ССП) є відкритою, якщо у
      моделлю онтології предметної області. Запропоновано методи побудови онтології задачі за множиною семантично розмічених
      Wiki-сторінок. Проаналізовано перспективи застосування систем семантичного пошуку, здатних використовувати такі                               пошуку застосовуються знання, здобуті з відкритого середовища. Прикладами таких знань є онтології ПрО,
      онтології. Описано програмну реалізацію запропонованого у роботі підходу – систему семантичного пошуку МАІПС, що                              отримані із зовнішніх репозиторіїв.
      забезпечує персоніфіковане задоволення інформаційних потреб користувачів. Така персоніфікація базується на застосування                              Основна тенденція семантизації пошукових засобів пов’язана з переходом від виявлення документів,
      знань з онтологій задач та побудованих за цими онтологіями тезаурусів.
                                                                                                                                                    що містять певні ключові слова, до пошуку знань, необхідних для виконання поставленого перед
      Ключові слова: семантичний пошук, онтологія задачі, семантичні Wiki-ресурси, персоніфікація пошуку.
                                                                                                                                                    користувачем завдання. Семантична розмітка ІР, серед яких виконується пошук, дозволяє автоматизувати
      В работе проанализированы основные направления семантизации информационных ресурсов Web и теоретические основы,                               такий аналіз, використовуючи зовнішні бази знань, з якими пов’язується контент ІР, для співставлення зі
      которые могут использоваться для этого. Рассмотрены проблемы, связанные с использованием и анализом информации из
      открытой среды на уровне знаний. Обоснована потребность в разработке методов и средств семантического поиска в Web и
                                                                                                                                                    сферою інтересів користувача, яка теж описується певним чином формалізованими знаннями відповідної
      целесообразность использовании онтологий для формализации знаний об информационных потребностях пользователей и их                            ПрО. Слід відмітити, що використання онтології ПрО для семантичної розмітки ІР та використання
      текущих задачах. Рассмотрены современные направления развития семантического поиска и его персонификации.                                     семантичної розмітки ІР для вдосконалення онтології ПрО розглядаються в цій роботі як два взаємопов’язані
      Обоснованная целесообразность использования семантически размеченных          Wiki-ресурсов как источника знаний для                          етапи онтологічного аналізу ПрО, що застосовуються ітеративно до того часу, поки користувач не буде
      построения онтологий отдельных задач, которые являются подмножествами больших по объему и сложностью онтологий
      предметных областей. Разработана формальная модель онтологии задачи, рассматривается ее сопоставление с формальной
                                                                                                                                                    задоволений побудованою онтологією.
      моделью онтологии предметной области. Предложены методы построения онтологии задачи по множеству семантически                                        На ефективність пошуку значним чином впливає те, які саме бази знань використовуються в ньому.
      размеченных Wiki-страниц. Проанализированы перспективы применения систем семантического поиска, способных                                     Важливо, з одного боку, які формалізми та мови використовуються для подання знань (це можуть бути
      использовать такие онтологии. Описана программная реализация предложенного в работе подхода – система семантического                          семантичні мережі та фреймові системи, таксономії тощо, мови OWL [3] та RDF [4] тощо), а з другого –
      поиска МАИПС, которая обеспечивает персонифицированное удовлетворение информационных потребностей пользователей.
                                                                                                                                                    наскільки цей набір знань є актуальним та відповідає потребам конкретного користувача та його поточній
      Такая персонификация базируется на применение знаний, содержащихся в онтологиях задач и построенных по этими
      онтологиям тезаурусах.                                                                                                                        задачі. Якщо для рішення першого питання на сьогодні для Web-орієнтованих застосувань фактично стало
      Ключевые слова: семантический поиск, онтология задачи, семантические Wiki-ресурсы, персонификация поиска.                                     стандартом використання онтологій [5] (і питання більшою мірою стосується того, якої складності онтології
      In this paper we show the main directions of semantization of the Web information resources and their theoretical bases. We consider the
                                                                                                                                                    потрібно використовувати), то для другого – побудови [6] або пошуку найбільш пертинентної онтології –
      semantization problems associated with the open environment information at the knowledge level. This analysis substantiates the need for      поки що загальноприйняте рішення ще на знайдено.
      the Web semantic search methods and means. Modern principle tendencies in the personified semantic deal with the ontology-based                      Сьогодні поширені різні підходи до семантизації пошуку в Web. Деякі з них використовують складні
      formalization of knowledge about the information needs of users and their current tasks. Our approach is based on use of the semantically     структуровані мови для подання запитів користувачів, інші орієнтовані на пошук за ключовими словами або на
      marked Wiki-resources as a source of knowledge for constructing of ontologies of individual task. Each task ontology is considered as a
      small subset of domain ontology with large number of terms volume and high complexity. We develop the formal model of the task
                                                                                                                                                    природномовні запити. Більшість підходів першої групи базуються на RDF і орієнтовані на технології проекту
      ontology as a special case of the formal model of domain ontology and propose methods for constructing of this task ontology on base of the   Semantic Web, тобто здійснюють пошук у вже семантично розмічених ІР. Наприклад, Swoogle [7] використовує
      set of semantically marked Wiki pages. The software implementation of the retrieval systems capable to process such task ontologies is        краулер для виявлення, індексації та запитування документів в форматі RDF. На жаль, таку розмітку на
      analyzed on example of MAIPS – semantic retrieval system which provides personalized satisfaction of user information needs. Such             сьогодні має лише невелика частина ресурсів Web. Більш детально переваги та проблеми різних моделей
      personification is based on knowledge contained into the user task thesauri that are built on base of task ontologies.
                                                                                                                                                    пошуку розглянуто в [8]. В обох напрямках пошуку широко застосовуються онтології, але ці онтології
      Key words: semantic retrieval, task ontology, semantic Wiki resources, personification of retrieval.
                                                                                                                                                    зазвичай є однаковими для всіх користувачів пошукової системи.
      Пошук у Web є ключовою технологією Web, тому що дозволяє отримати доступ до його ресурсів.
Результатами пошуку можуть бути різні види інформаційних ресурсів або їх елементів – природномовні                                                  Використання онтологій для подання знань у Web
документи та їх фрагменти, структуровані або слабкоструктуровані дані. Сам інформаційний запит, що                                                        Онтології є потужним та ефективним засобом подання знань у Web, але слід враховувати, що обробка
формалізує інформаційну потребу користувача, теж може бути представлено по-різному – ключовими                                                      онтологічних структур дуже складна і потребує у загальному випадку багато часу. Але досить часто для
словами, структурованими мовами запитів (SQL, SQRL тощо) або прикладами тих ІО, що потрібні                                                         рішення задачі у певній ПрО потрібно враховувати не всі поняття цієї області та зв’язки між ними, а тільки
користувачеві. Ціль пошуку у найбільш широкому розумінні – співставити запит з описами тих ІР, про які                                              невелика їх підмножину. Тоді використання онтології ПрО поділяється на два етапи – виокремлення
відомо пошуковій системі, та знайти серед них найбільш релевантні. На сьогодні збільшення ефективності                                              необхідної для задачі підмножини знань онтології – ІО з простішою структурою, меншими обсягом та
пошуку пов’язують не з його повнотою, а з фільтрацією результатів, яка дозволяє з великої кількості ІР,                                             виразністю (приміром, таксономії, тезаурусу або словника), що значно пришвидшує їх обробку. Те, за якими
релевантних запиту користувача, відібрати ті ІР, які стосуються його поточних інтересів, позбавивши самого                                          умовами будуються ці ІО та яку структуру вони мають, залежить від специфіки задачі. Приміром, для задачі
користувача від рутинного аналізу запропонованої інформації.                                                                                        пошуку це може бути набір класів онтології, які використовуються у семантичній розмітці заданого
      Великий обсяг та складна структура інформаційних ресурсів (ІР) Web викликають потребу у створенні                                             текстового документа-зразка; підкласи цих класів та екземпляри цих класів. Інший поширений варіант
таких засобів їх автоматизованої обробки, які забезпечили б аналіз змісту цих ресурсів та дозволили б                                               побудови такого ІО – набір класів онтології, на екземпляри яких є посилання у семантичній розмітці з
здобувати з них саме ті відомості, що потрібні користувачам для вирішення конкретних задач. Для такої                                               обраної сторінки-зразку. Важливо, що, як правило, такі ІО не описують характеристики класів, відношень та
обробки необхідно розробляти як засоби семантичного пошуку, так і засоби семантичної розмітки ІР. Обидві                                            екземплярів, але ці характеристики можуть бути застосовані в процесі побудови цих ІО за онтологією
ці задачі безпосередньо пов’язані із семантизацією інформації. У широкому розумінні семантизація –                                                  відповідно до кожної конкретної задачі. Приміром, у побудові ІО може бути використана симетричність
встановлення зв’язків між певним інформаційним об’єктом (ІО) та його змістом. Для відкритого середовища                                             певного відношення між екземплярами класів, але сам ІО не містить цю характеристику. Таким чином, це

                                                                    197                                                                             198




дозволяє перейти від “важких” онтологій до “легких”, створюючи спрощену підмножину великовагової                                                    розширень є Semantic MediaWiki [10]. Ця надбудова над MediaWiki має досить високу виразну потужність,
онтології [9].                                                                                                                                      надійну реалізацію і зручний інтерфейс користувачів. Сьогодні на SMW базується значна кількість сайтів,
      Аналіз існуючих на сьогодні засобів семантичного пошуку показує, що у переважній більшості задач                                              порталів та енциклопедичних видань. Прикладом ІР, що базується саме на цій платформі, є електронна версія
для опису ПрО достатньо використовувати “легкі” (“легковагові”) онтології, в яких не застосовуються                                                 Великої української енциклопедії [2].
аксіоми, а множина відношень між класами, що описуються додатковими властивостями, зазвичай є
порожніми. Легкі онтології – це відносно прості структури термінів з відповідними визначеннями та                                                           Алгоритм побудови онтології задачі користувача
обмеженою множиною відношень. Такі онтології мають менші виразові можливості, але їх значно легше                                                         Формальна модель онтології визначає її основні елементи, їх структуру та зв’язки. Надалі будемо
та швидше обробляти. Для таких онтологій характерна наявність тільки наступних відношень:                                                           використовувати наступну формальну модель O  X, R , F, T , що складається з наступних елементів:
      - відношення “клас-підклас”, значення якого пов’язані транзитивно;
                                                                                                                                                            -      X  X cl  Xind – множина концептів онтології, де X cl – множина класів, Xind – множина
      - об’єктне відношення синонімії, значення якого пов’язані симетрично;
                                                                                                                                                    екземплярів класів, таких, що a  X ind A  X cl , a  A ;
      - об’єктні відношення, специфічні для ПрО, значення яких не мають бінарних властивостей.
       У більш складних випадках деякі відношення ПрО можуть також бути визначені як транзитивні або                                                        -      R  rier _ cl  {ri }  {p j} – множина відношень між елементами онтології, де rier _ cl – ієрархічні
симетричні, і це дозволяє реалізувати більш складне логічне виведення на знаннях ПрО. Але частіше для                                               відношення, що можуть встановлюватися між класами онтології і властивостями класів і характеризується
семантичного пошуку достатньо самої наявності відношення між екземплярами класів, щоб оцінити                                                       такими властивостями, як антисиметричність і транзитивність, rier _ cl : X cl  X cl ; {ri } – множина об'єктних
пертинентність ІО області пошуку. Це пов’язано з тим, що аналіз, приміром, природномовного тексту із
                                                                                                                                                    властивостей,         що        встановлюють        стосунки          між   екземплярами       класів:       ri a , a  X ind   b, b  X ind ,
урахуванням усіх знань щодо ПрО для визначення його семантики займає дуже багато часу, що неприйнятно
для аналізу великої кількості ІР, релевантних запиту. Залежно від того, наскільки        складно описує                                             ri : Xind  Xind ; {p j} – множина властивостей даних, що установлюють відношення між екземплярами класів
користувач потрібну ПрО, залежить як час пошуку, так і його якість. Обирати компроміс між цими                                                      і значеннями: p i a , a  X ind   t , t  T , p i : X ind  Const , такі, що усередині множин об'єктних властивостей і
протилежними критеріями має сам користувач.
                                                                                                                                                    властивостей відносин також можуть існувати ієрархічні відносини                           rier _ obj , rier _ obj : {ri }  {ri } і rier _ data ,
       Така “легка” онтологія може базуватися на онтології більш широкої ПрО (з більшою кількістю класів,
відношень та екземплярів), яка має значно більшу виразну потужність (приміром, подана на OWL Full або                                               rier _ data : {p j}  {p j} ;
OWL-DL). Але безпосередньо побудувати підмножину онтології для переважної більшості користувачів є
надто складною задачею. Значно легше обробляти ІР, що містять відповідну семантичну розмітку, обираючи                                                    -    F – множина характеристик класів онтології, екземплярів класів і їхніх властивостей, що можуть
ті, що відносяться до поточної задачі.                                                                                                              застосовуватися для логічного виводу (наприклад, еквівалентність, відмінність, відсутність перетинання,
                                                                                                                                                    область визначення й область значення);
Постановка задачі                                                                                                                                           -      T – множина типів даних (наприклад, рядок, ціле).
      Щоб реалізувати семантичний пошук інформації в Web, використовуючи знання, що містяться в                                                           Формально проблема побудови онтології задачі користувача полягає у наступному: за онтологією ПрО
онтологіях, доступ до яких також забезпечує середовище Web, виникає потреба у засобах здобуття з цих                                                O domain , O domain  X domain , R domain , Fdomain , Tdomain , та набором Wiki-сторінок Wuser , семантична
онтологій тих відомостей, що стосуються інформаційних потреб користувача, та методах застосування
здобутих відомостей у пошукових процедурах. Пропонується будувати за онтологіями довільної структури                                                розмітка яких базується на O domain , побудувати “легковажну” онтологію задачі користувача Ouser , знання
та складності більш прості інформаційні об’єкти, що містять визначену користувачем підмножину                                                       якої є підмножиною знань з O domain . Потрібно відмітити, що джерела та методи побудови цієї онтології ПрО
онтологічних знань, та співставляти з цими інформаційними об’єктами результати, отримані від зовнішніх                                              знаходяться поза сферою розгляду даної роботи – вона може мати довільну структуру, високу виразну
інформаційно-пошукових систем, відбираючи семантично ближчі до потреб користувача. Для вдосконалення                                                потужність та бути сформована як безпосередньо експертами ПрО, так і за допомогою різноманітних засобів
онтологій, що застосовуються для пошуку, пропонується застосовувати інформаційні ресурси, семантично                                                здобуття онтологічних знань.
розмічені елементами цих онтологій, а саму таку розмітку використовувати для побудови відповідних ІО.
                                                                                                                                                            O user  X user , R user , Fuser , Tuser , така, що:
Семантичні Wiki як джерело онтологічної інформації
                                                                                                                                                            - X user  X domain , тобто X cluser  Xcldomain , Xind user  Xind domain ;
       На сьогодні існує велика кількість пошукових систем, орієнтованих саме на пошук структурованих ІР,
приміром, для виявлення, індексації та запитування документів в форматі RDF або OWL. Вони дозволяють
аналізувати вміст ІР з семантичною розміткою, але, на жаль, переважна частина ресурсів Web не є                                                             - R user  R domain ,          тобто         rier _ cl user  rier _ cldomain ,   {ruser j }  {rdomain i }, i  0, n , j  0, m, m  n ;
семантизованими, хоча кількість ІР, що містять семантичну розмітку та різноманітні метаописи, постійно
                                                                                                                                                                   {p userk }  {pdomain l }, l  0, q, k  0,t , t  q
збільшується. Тому виникає потреба використовувати семантично розмічені ІР як джерело знань для обробки
несемантизованих документів. В якості таких джерел пропонується використовувати бази знань, побудовані
на Wiki-платформі. По-перше, такі системи застосовують стандартизовані засоби для подання семантичної                                                       - Fuser   ;
розмітки (за допомогою системи категорій та властивостей). Ці елементи можна легко розпізнавати навіть у
тих випадках, коли різні ІО отримані з різних ресурсів. Інша важлива перевага – у семантичних Wiki-                                                         - Tuser  Tdomain .
ресурсах завжди є наявності різноманітні засоби для внутрішньої навігації та пошуку, і це дозволяє
користувачу досить швидко визначити набір Wiki-сторінок, пов’язаних з його задачею. Третій важливий                                                       Будувати онтологію задачі доцільно тільки в тому випадку, якщо користувач планує працювати над
фактор – на сьогодні вже створено багато різноманітних семантичних Wiki-ресурсів, і їх кількість, обсяг та                                          великою та досить складною проблемою, рішення якої буде потребувати інформації на протязі досить
якість постійно збільшуються. У-четвертих, у випадку, якщо інформації в семантичних Wiki недостатньо, їх                                            значного часу, значно більшого, ніж час, потрібний на побудову власної онтології (приміром, плануючи
досить легко доповнити відомостями з несемантизованих Wiki (приміром, з Вікіпедій різними мовами або                                                дослідження на кілька років, доцільно витратити кілька годин на те, щоб надалі отримувати семантично
Wiki-довідників) – з таких ресурсів можна здобути менше семантичної інформація, але у поєднання з                                                   відфільтровані відомості).
семантизованими вони дозволяють досить коректно описати довільну проблему.
       Для Wiki-технології зараз використовується багато семантичних розширень. Сформовані на їх основі                                             Основні етапи побудови онтології задачі
ІР можуть динамічно оновлюватися всім співтовариством користувачів, що забезпечує актуальність
                                                                                                                                                          Етап 1. Знайти семантичний Wiki-ресурс W, що за тематикою співвідноситься із задачею користувача
інформації, мають зручну й просту для розуміння структуру, забезпечують обробку інформації на
                                                                                                                                                    або перекриває більш широку ПрО. Найпростіше використовувати неспеціалізовані енциклопедії та довідники
семантичному рівні, надаючи технологічну платформу для групового керування знаннями. Одним з таких

                                                                                                                                           199      200
(такі, як електронна версія Великої української енциклопедії [11]), але, якщо користувач має відомості до більш                                        Персоналізація семантичного пошуку в МАІПС базується на тому, що користувач явно визначає, які саме
спеціалізованих ресурсів, то їх застосування може збільшити ефективність роботи.                                                                       знання (онтології та базовані на них тезауруси задач) використовуються для формалізації його
                                                                                                                                                       інформаційних потреб. Це є характерною рисою цієї ССП та її основною відмінністю від інших систем, що
         Етап 2. У цьому Wiki-ресурсі відібрати множину ІР Wuser , що безпосередньо пов’язані із задачею
                                                                                                                                                       підтримують пошук інформації на семантичному рівні.
користувача, Wuser  W . Почати цей відбір можна із пошуку Wiki-сторінок, назви яких співпадають із
ключовими словами цієї задачі, а надалі за допомогою вбудованих засобів навігації Wiki-ресурсом переходити                                             Висновки
до сторінок, сполучених із цими сторінками семантичними властивостями (усіма або тільки тими, що цікавлять
користувача) або відносяться до тих самих категорій. На цьому етапі користувач має виконати певну кількість                                                   Враховуючи складність створення та обробки онтологій, пропонується використовувати їх для
роботи самостійно, щоб охарактеризувати ту інформацію, що йому потрібна, та відкинути ту, що не стосується                                             семантизації пошуку в Web наступним чином: в онтологіях накопичувати в інтероперабельному вигляді знання
його поточної задачі (це може бути цінна інформація, важлива для ПрО в цілому, але не потрібна саме для                                                ПрО, поповнюючи їх відомостями з тих інформаційних ресурсів, для семантичної розмітки яких
рішення поточної проблеми). Від того, наскільки точно буде виконано відбір, залежить ефективність виконання                                            застосовувалися елементи цих онтологій, а для рішення прикладних задач будувати за онтологіями ПрО
семантичного пошуку: відсутність потрібної інформації не дозволить знаходити відповідні ресурси, а наявність                                           похідні інформаційні об’єкти (з простішою структурою та меншим обсягом, в яких аксіоми ПрО
зайвих сторінок збільшить час обробки.                                                                                                                 використовуються на етапі побудови, але не містяться безпосередньо), які надалі використовувати як джерело
                                                                                                                                                       знань, необхідних для задачі користувача. Запропонований у роботі алгоритм дозволяє будувати онтології, що
         Етап 3. Здійснюється аналіз інформації з Wuser  {w useri }, i  1, s .                                                                       характеризують поточну задачу користувача і можуть застосовуватися для семантичного пошуку інформації.

         Для кожної сторінки виконуються наступні дії:
         -     інформація про класи сторінки (усі або відібрані користувачем) дозволяє поповнити Xcluser .
Ієрархічні відношення між цими класами можна визначити за допомогою сторінок цих категорій;
         -     ім’я самої сторінки заноситься до X ind user ;
                                                                                                                                                       Література

      -   імена тих семантичних властивостей сторінок, що використані на даній сторінці та область                                                     1.              Baeza-Yates R., A. Raghavan R. Next generation Web search. S. Ceri and M. Brambilla, editors, Search Computing, Springer. 2010.
визначення яких відноситься до типу “Сторінка” (усі або відібрані користувачем), заносяться до {ruserj } ;                                                   P. 11–23.
                                                                                                                                                       2.              Rogushina J. Analysis of Automated Matching of the Semantic Wiki Resources with Elements of Domain Ontologies. International
                                                                                                                                                             Journal of Mathematical Sciences and Computing(IJMSC). 2017. Vol. 3, N 3. P. 50–58.
      -    імена сторінок, на які дана сторінка посилається за допомогою семантичних властивостей типу
                                                                                                                                                       3.              Antoniou G., Van Harmelen F. Web ontology language: Owl. In Handbook on ontologies. Springer Berlin Heidelberg. 2004.
“Сторінка” (усі або відібрані користувачем), також заносяться до X ind user ;                                                                                P. 67–92.
                                                                                                                                                       4.              Cyganiak R., Wood D., Lanthaler M. RDF 1. 1 Concepts and Abstract Syntax. W3C Recommendation 25 February 2014.
      -   імена сторінок, на які дана сторінка посилається за допомогою гіперпосилань (усі або відібрані                                                     http://www.w3.org/TR/2014/REC-rdf11-concepts-20140225/.
користувачем), також заносяться до X ind user ;                                                                                                        5.              Gruber T.R. Toward Principles for the Design of Ontologies Used for Knowledge Sharing. International Journal of Human-Computer
                                                                                                                                                             Studies. 1995. Vol. 43. Issues 5–6. P. 907–928.
      -   якщо дана сторінка відсилає до іншої сторінки, тоді ім’я такої сторінки розглядається як синонім                                             6.              Gladun A., Rogushina J., Valencia-García R., Martínez-Béjar R. Semantics-driven modelling of user preferences for information
                                                                                                                                                             retrieval in the biomedical domain. Informatics for health and social care. 2013. Vol. 38, N 2. P. 150–170.
поточної сторінки, заноситься до X ind user та пов’язується відношенням синонімії із іменем поточної                                                   7.              Finin T.W., Ding L., Pan R., Joshi A., Kolari P., Java A., Peng Y. Swoogle: Searching for knowledge on the Semantic Web. Proc.
                                                                                                                                                             AAAI-2005, AAAI Press. MIT Press. 2005. P. 1682–1683.
сторінки.
                                                                                                                                                       8.              Fazzingaa B., Lukasiewicz T. Semantic search on the Web. Semantic Web – Interoperability, Usability, Applicability. 2010. N 1. P. 1–
         Якщо обробляються несемантизовані Wiki-сторінки, тоді алгоритм їх обробки значно скорочується:                                                      7.                                                                                  https://www.researchgate.net/profile/Thomas_Lukasiewicz/
                                                                                                                                                             publication/220575552_Semantic_search_on_the_Web/links/0046351e94ee8994bd000000.pdf.
         -     інформація про класи сторінки (усі або відібрані користувачем) дозволяє поповнити Xcluser .                                             9.              Рогушина Ю.В. Семантичний пошук у Web на основі онтологій: розробка моделей, засобів і методів. Мелітополь: МДПУ ім.
                                                                                                                                                             Богдана Хмельницького. 2015. 291 с.
Ієрархічні відношення між цими класами можна визначити за допомогою сторінок цих категорій;                                                            10.             Krotzsch M., Vrandecic D., Volkel M. Semantic MediaWiki. http://c.unik.no/images/6/6d/SemanticMW.pdf.
                                                                                                                                                       11.             Рогушина Ю.В. Разработка распределенных интеллектуальных систем на основе онтологического анализа и семантических
         -     ім’я самої сторінки заноситься до X ind user ;                                                                                                wiki-технологий. Онтология проектирования. 2017. Т. 7, № 4(26). С. 453–472.
                                                                                                                                                       12.             Protégé. http:// protege. stanford.edu/.
      -   імена сторінок, на які дана сторінка посилається за допомогою гіперпосилань (усі або відібрані                                               13.             Rogushina J.V. The Use of Ontological Knowledge for Semantic Search of Complex Information Objects. Open semantic technologies
користувачем), також заносяться до X ind user ;                                                                                                              for intelligent systems. 2017. С. 127–132.

      -   якщо дана сторінка відсилає до іншої сторінки, тоді ім’я такої сторінки розглядається як синонім
поточної сторінки, заноситься до X ind user та пов’язується відношенням синонімії із іменем поточної
                                                                                                                                                       References
сторінки.
      Результатом виконання цих етапів є онтологія задачі користувача. Хоча існує можливість їх                                                        1.              Baeza-Yates R., A. Raghavan R. Next generation Web search. S. Ceri and M. Brambilla, editors, Search Computing, Springer, 2010.
автоматизації, через те, що більшість операцій потребує втручання користувача та прийняття рішення щодо                                                      P. 11–23.
кожного поняття та відношення, доцільніше виконувати ці дії безпосередньо за допомогою редактору                                                       2.              Rogushina J. Analysis of Automated Matching of the Semantic Wiki Resources with Elements of Domain Ontologies // International
онтологій (приміром, Protégé [12]). Таким чином побудована онтологія представлена мовою OWL та може                                                          Journal of Mathematical Sciences and Computing(IJMSC). 2017. Vol. 3, N 3, P. 50–58.
                                                                                                                                                       3.              Antoniou G., Van Harmelen F. Web ontology language: Owl. In Handbook on ontologies. Springer Berlin Heidelberg. 2004.
використовуватися семантичними пошуковими системами для фільтрації результатів запитів [13]. Основна                                                         P. 67–92.
ідея такої фільтрації полягає у тому, що контент знайдених ІР (або певних їх елементів, визначених                                                     4.              Cyganiak R., Wood D., Lanthaler M. RDF 1. 1 Concepts and Abstract Syntax. W3C Recommendation 25 February 2014.
користувачем) порівнюється із елементами онтології. За результатами порівняння знайдені ІР                                                                   http://www.w3.org/TR/2014/REC-rdf11-concepts-20140225/.
впорядковуються відповідно до кількісного значення коефіцієнту близькості. Алгоритм порівняння та міри                                                 5.              Gruber T.R. Toward Principles for the Design of Ontologies Used for Knowledge Sharing. International Journal of Human-Computer
                                                                                                                                                             Studies. 1995. Vol. 43. Issues 5–6. P. 907–928.
близькості залежать від специфіки конкретних пошукових систем та від обраних користувачем налаштувань.                                                 6.              Gladun A., Rogushina J., Valencia-García R., Martínez-Béjar R. Semantics-driven modelling of user preferences for information
Приклад такої системи семантичного пошуку, що використовує онтології користувачів, – метапошукова                                                            retrieval in the biomedical domain. Informatics for health and social care. 2013. Vol. 38, N 2. P. 150–170.
система МАІПС, що призначена для пошуку інформації, пов’язаної з професійними чи науковими інтересами                                                  7.              Finin T.W., Ding L., Pan R., Joshi A., Kolari P., Java A., Peng Y. Swoogle: Searching for knowledge on the Semantic Web. Proc.
користувачів, – більш детально описано в [9]. Формалізація інформаційних потреб користувача МАІПС                                                            AAAI-2005, AAAI Press. MIT Press. 2005. P. 1682–1683.
базується на представленні знань щодо його інтересів через онтології ПрО та похідні від них тезауруси задач.

                                                                                                                                              201      202




8.              Fazzingaa B., Lukasiewicz T. Semantic search on the Web. Semantic Web – Interoperability, Usability, Applicability. 2010. N 1. P. 1–
      7.                                                                                   https://www.researchgate.net/profile/Thomas_Lukasiewicz/
      publication/220575552_Semantic_search_on_the_Web/links/0046351e94ee8994bd000000.pdf.
9.              Rogushina J.V. Semantic retrieval for Web on base of ontologies: design of models, tools and methods. Melitopol: Bogdan Hmelnitsky
      MDUPU. 2015. 291 p. [in Ukrainian]
10.             Krotzsch M., Vrandecic D., Volkel M. Semantic MediaWiki. http://c.unik.no/images/6/6d/SemanticMW.pdf.
11.             Rogushina J.V. Design of distributed intelligent systems on base of ontological analysis and semantic Wiki technologies. Ontology of
      designing, Vol. 7, N 4(26)/2017. P. 453-472. [in Russian]
12.             Protégé. http:// protege. stanford.edu/.
13.             Rogushina J.V. The Use of Ontological Knowledge for Semantic Search of Complex Information Objects. Open semantic technologies
      for intelligent systems. 2017. P. 127–132.




Про автора:

Рогушина Юлія Віталіївна,
кандидат фізико-математичних наук,
старший науковий співробітник Інституту програмних систем НАН України.
Кількість наукових публікацій в українських виданнях – 140.
Кількість наукових публікацій в зарубіжних виданнях – 30.
Індекс Хірша – 10.
http://orcid.org/0000-0001-7958-2557.


Місце роботи автора:

Інститут програмних систем
НАН України,
03181, Київ-187,
проспект Академіка Глушкова, 40.
Тел.: 066 550 1999.
E-mail: ladamandraka2010@gmail.com




                                                                                                                                              203