=Paper= {{Paper |id=Vol-2022/paper12 |storemode=property |title= Проблема транзитивности в системе категорий Википедии (Problem of Transitivity of Wikipedia's Category System) |pdfUrl=https://ceur-ws.org/Vol-2022/paper12.pdf |volume=Vol-2022 |authors=Alexander Kirillovich,Olga Nevzorova |dblpUrl=https://dblp.org/rec/conf/rcdl/Kirillovich17 }} == Проблема транзитивности в системе категорий Википедии (Problem of Transitivity of Wikipedia's Category System) == https://ceur-ws.org/Vol-2022/paper12.pdf
          Проблема транзитивности в системе категорий
                          Википедии
                  © А. В. Кириллович1                      © О.А. Невзорова1,2
                       1
                         Казанский федеральный университет, Казань, Россия
         2
           Институт прикладной семиотики АН Республики Татарстан, Казань, Россия
             alik.kirillovich@gmail.com                       onevzoro@gmail.com
         Аннотация. Проведен анализ системы категорий Википедии. Показано, что в системе катего-
    рий происходит нарушение требования транзитивности, в результате чего статья из подкатегории
    некоторой категории может не относиться к основной категории. С помощью стандартных методов
    онтологического моделирования проанализированы причины нарушений транзитивности. Предло-
    жен подход к автоматическому устранению данных нарушений.
         Ключевые слова: Википедия, система категорий, информационно-поисковой тезаурус, онто-
    логическое моделирование, OntoClean, онтологическая зависимость



      Problem of Transitivity of Wikipedia Category System
              © Alexander Kirillovich1                          © Olga Nevzorova1,2
                             1
                               Kazan Federal University, Kazan, Russia
    2
      Research Institute of Applied Semiotics of Tatarstan Academy of Sciences, Kazan, Russia
            alik.kirillovich@gmail.com                           onevzoro@gmail.com
          Abstract. This paper analyses a violation of the transitivity principle of Wikipedia category system.
    Causes of the violation have been analyzed on base of ontological modeling methodologies such as Onto-
    Clean. A new approach for elimination of the violation has been proposed.
          Keywords: Wikipedia, categorization system, thesaurus, ontology engineering, OntoClean, ontologi-
    cal dependence

                                                                Каждая категория может содержать подкатего-
 1 Введение                                                  рии и самой находиться в родительских категориях.
                                                             Таким образом, система категорий представляет
    Википедия — одно из крупнейших хранилищ                  собой ориентированный граф без циклов.
 информации. Данные Википедии используются в
                                                                Категории могут группироваться с использова-
 таких задачах как разрешение лексической много-
                                                             нием    мета-категорий,     например     C:Writers →
 значности, категоризация текста, вычисление семан-
 тической близости, машинный перевод. Для автома-            C:Writers_by_nationality → C:Russian_writers.
 тической обработки информации из Википедии тре-                Согласно правилам Википедии, статья должна
 буется средство ее структурирования.                        находиться в наиболее специфичной категории в
    Система категорий — основной инструмент                  иерархии. Например статья Anton_Chekhov должна
 структурирования информации в Википедии. Кате-              находиться не в категории C:Writers, а в ее вложен-
 гории хранят статьи, объединенные общей темой.              ной подкатегории C:Russian_novelists через цепочку:
                                                             C:Writers → C:Writers_by_nationality → C:Russian_
    Категории бывают двух видов:
                                                             writers → C:Russian_novelists → Anton_Chekhov. По-
 • Категории-множества, например C:Cities, которая           этому, чтобы получить все статьи, релевантные за-
   содержит статьи про конкретные города                     данной категории, требуется извлекать статьи из
   (Москва, Казань, Лондон, Урюпинск и т. д.).               всех ее вложенных подкатегорий.
 • Категории-топики, например C:City, которая со-               В связи с этим требуется, чтобы система катего-
   держит статьи по городской тематике (Городское            рий была транзитивной: статьи из вложенных под-
   планирование, Урбанизация, История городов,               категорий должны быть релевантны родительской
   Городская культура и т.д.).                               категории. Однако требование транзитивности
                                                             нарушается. Так например категория Арифметика
                                                             содержит нерелевантную ей вложенную подкатего-
Труды XIX Международной конференции                          рию Расстрелянные колумбийцы: C:Arithmetic →
«Аналитика и управление данными в областях                   C:Ratios → C:Rates → C:Temporal_rates →
с интенсивным использованием данных»                         C:Acceleration → C:Force → C:Motion_(physics) →
(DAMDID/ RCDL’2017), Москва, Россия, 10–13
октября 2017 года

                                                        57
C:Flight → C:Ballistics → ... → C:Projectile_weapons →          o C:Operating_systems → C:Unix;
C:Firearms → C:People_associated_with_firearms →                o C:Fields_of_mathematics → C:Algebra;
C:Shooting_victims → ... →
                                                                o C:Axioms_of_set_theory → C:Axiom_of_choice;
C:Colombian_people_executed_by_firing_squad.
                                                                o C:Abstract_strategy_games → C:Chess;
   Цель данной статьи — проанализировать про-
блему нарушения транзитивности в системе катего-                o C:Engines → C:Internal_combustion_engine;
рий Википедии и предложить подход к ее решению.                 o C:Wars_involving_the_Soviet_Union →
Она построена следующим образом. В разделе 2                      C:World_War_II;
кратко перечислены другие средства структуриро-
                                                                o C:Dystopian_novels → C:Nineteen_Eighty-Four;
вания данных Википедии и отмечены их ограниче-
ния. В разделе 3 система категорий исследована с                o C:Organs → C:Brain;
помощью классических методов онтологического                    o C:Space_stations →
моделирования и выявлены причины потери транзи-                   C:International_Space_Station.
тивности. В разделе 4 предложен подход, который
исправляет систему категорий, удаляя из нее не-               • Отношение часть → целое:
транзитивные цепочки. В Разделе 5 описаны                       o C:Moscow →
направления будущей работы.                                       C:Cities_and_towns_under_jurisdiction_of_Mos
                                                                  cow → C:Zelenograd;
2 Связанные работы                                              o C:Yale_University → C:Yale_University_Library
   Существует множество проектов по извлечению                  o C:United_Nations →
структурированных данных из Википедии [1, 2]:                     C:International_Atomic_Energy_Agency;
DBpedia [3–5], YAGO [6–8], WikiTaxonomy [9–11],                 o C:World_War_II → … →
WikiNet [12–14], ORA: The Natural Ontology of                     C:Attack_on_Pearl_Harbor;
Wikipedia [15,16], WiBi [17], MENTA [18], BabelNet
[19-20], WiSiNet [22], KOG: Kylin Ontology Generator            o C:Central_nervous_system → C:Brain;
[23], а также проектов выравнивания системы кате-               o C:Unix → C:Network_socket;
горий и WordNet [24–28]. Однако данные проекты                  o C:Internal_combustion_engine → C:Pistons.
не являются универсальными и не применимы к
категориям-топикам.                                           • Ассоциативные отношения:
                                                                § Наука → объект изучения:
3 Анализ причин нарушения транзитив-                               o C:Botany → C:Plants.
ности                                                           § Агент → контрагент:
   Проанализируем систему категорий с помощью                     o C:Plants → C:Herbicides;
методологий онтологического моделирования и вы-                    o C:Violence → C:Nonviolence;
явим причины потери транзитивности.
                                                                   o C:Communism → C:Anti-communism.
   Систему категорий можно рассмотреть в каче-
                                                                § Величина → инструмент для измерения:
стве тезауруса [29, 30]. Категории будут соответ-
ствовать концептам, а отношения между категорией                   o C:Temperature → C:Thermometers.
и подкатегорией – стандартным онтологическим                    § Деятельность → агент деятельности:
отношениям:                                                        o C:Hunting → C:Hunting_dogs;
• Отношение класс → подкласс:                                      o C:Military → C:Military_personnel.
   o C:Cities_in_Europe → C:Capitals_in_Europe;                  § Сырье → результат:
   o C:Software → ... → C:Operating_systems;                       o C:Grape → C:Raisins;
   o C:Mathematical_axioms →                                       o C:Petroleum → C:Petroleum_products →
     C:Axioms_of_set_theory;                                         Gasoline;
   o C:Machines → C:Engines;                                       o C:Textiles → C:Textile_arts → C:Weaving.
   o C:Wars → ... →                                              § Другие ассоциативные отношения:
     C:Wars_involving_the_Soviet_Union;
                                                                   o C:Death → C:Death_customs → C:Funerals;
   o C:Fiction_books → ... → C:Dystopian_novels.
                                                                    o C:Automobiles → C:Auto_racing;
• Отношение класс → экземпляр:
                                                                    o C:Books → C:Book_arts → C:Bookbinding.
   o C:Capitals_in_Europe → C:Moscow;
                                                                 Мета-категориям соответствует так называемые
   o C:Intergovernmental_organizations →                      «Node labels».
     C:United_Nations;                                           Задача нахождения релевантных подкатегорий
   o C:Universities_and_colleges_in_Connecticut →             для заданной категории соответствует стандартной
     C:Yale_University;                                       задаче расширения поискового запроса (query ex-
                                                              pansion).



                                                         58
   Представив систему категорий в виде тезауруса,                   биологический процесс, а другом случае – как
мы применили к ней формальную методологию                           социальный процесс.
проверки корректности онтологий OntoClean, а так-                o Снег попал в Жидкости: C:Liquids →
же методологию построения информационно-                           C:Water → C:Forms_of_water → C:Snow. В
поисковых тезаурусов [29–33]. В результате оказа-                  одном случае Вода рассматривалась как ве-
лось, что многие случаи нарушения транзитивности                   щество вообще, а в другом – как вещество в
вызваны нарушениями правил построения иерархии                     жидком агрегатном состоянии.
концептов онтологии. Основными такими причина-
ми являются:                                                  • Несовместимые критерии идентичности:
• Неполное включение одной категории в другую:                  o Мусульманская святыня Кааба попала в кате-
                                                                   горию Математические объекты:
  o Аналоговая Кинопленка попала в категорию                       C:Mathematical_objects →
    Цифровые технологии:
                                                                   C:Geometric_shapes →
    C:Digital_technology → C:Digital_media →
                                                                   C:Elementary_shapes → C:Cubes →
    C:Video → C:Film_and_video_technology →
                                                                   C:Cubic_buildings → C:Kaaba. Ошибка нахо-
    C:Film_stock. Причина в том, что категория
                                                                   дится в цепочке C:Cubes → C:Cubic_buildings.
    Видео не полностью входит в категорию
                                                                   Кубические здания, вообще говоря, не явля-
    Цифровые медиа, т.к. существует и аналого-
                                                                   ются кубами, т. к. у них разные критерии
    вое видео.
                                                                   идентичности. Куб — это абстрактный, вне-
  o Англоязычный роман «Лолита» попал в кате-                      временной, неизменный объект. Если куб из-
    горию Русские романы:                                          менится хотя-бы на миллиметр, то это будет
    C:Russian_novels → …→                                          уже другой куб. Кубическое же здание — это
    C:Novels_by_Vladimir_Nabokov → Lolita. Ана-                    конкретный объект, существующий во вре-
    логично, категория Новеллы Набокова не                         мени и пространстве и сохраняющий иден-
    полностью входит в категорию Русские рома-                     тичность при небольших модификациях.
    ны.                                                         o Бермудский треугольник попал в категорию
  o Японский язык попал в категорию Языки Ко-                      Геометрические объекты:
    реи: C:Languages_of_Korea →                                    C:Mathematical_objects →
    C:Buyeo_languages → C:Japonic_languages →                      C:Geometric_shapes →
    C:Japanese_language.                                           C:Elementary_shapes → C:Triangles → Bermu-
• Ошибки при использовании нечетких понятий:                       da_Triangle.
  o Электрические стулья попали в категорию                   • Смешение понятия и знака:
    Потребительские товары:                                     o Династия Габсбургов попала в категорию
    C:Consumer_goods → C:Furniture →                              Слова и фразы: C:Words_and_phrases → ... →
    C:Chairs → C:Electric_chairs.                                 C:Surnames_of_Swiss_origin →
• Ошибки с использованием омонимичных катего-                     C:Swiss_families → C:Swiss_noble_families →
  рий:                                                            C:House_of_Habsburg.
  o Музыкальные чарты попали в Диаграмы:                         o Токсин попал в категорию Язык:
     C:Diagrams → C:Charts → C:Record_charts. В                    C:Language → C:Terminology →
     одном случае C:Charts использовались в зна-                   C:Biology_terminology → Toxin. Причина
     чении диаграмм, а в другом – в значении му-                   ошибки в том, что токсин не является терми-
     зыкальных чартов.                                             ном. Термином является слово “токсин”.
  o Строительство кораблей попало в Недви-                    • Наследование типов от ролей:
     жимость: C:Real_estate → C:Construction →                  o Анальгетики попали в категорию Запрещен-
     C:Ship_construction.                                          ные наркотики: C:Illegal_drugs →
• Использование одного понятия в разных смыс-                      C:Morphine → C:Analgesic. Причина ошибки в
  лах:                                                             том, что Запрещенные наркотики — это не
  o Электронная библиотека Lib.ru попала в кате-                   тип, а роль, и она не должна содержать кате-
     горию Здания: C:Buildings_and_structures →                    гории-типы.
     C:Buildings_and_structures_by_type →                       o Бомбовые прицелы попали в категорию
     C:Libraries → C:Digital_libraries → Lib.ru. В од-             Офисные принадлежности:
     ном случае Библиотека рассматривалась как                     C:Office_equipment → C:Computers → … →
     тип здания, а в другом – как социальный ин-                   C:Analog_computers → …→
     ститут.                                                       C:Optical_bombsights.
  o Философское мировоззрение Нигилизм попа-                     o Волчья ягода (несъедобная) попала в катего-
     ло в категорию Биология: C:Biology →                          рию Еда: C:Foods → C:Fruit → C:Berries →
     C:Life → C:Philosophy_of_life → C:Nihilism. В                 C:Sambucus.
     одном случае Жизнь рассматривалась как




                                                         59
   В следующих случаях транзитивность нарушает-             4 Подход к устранению нарушений тран-
ся не вследствие ошибки, а вследствие самого прин-          зитивности
ципа построения системы категорий Википедии:
• Нетранзитивность отношения класс → экзем-                    В данном разделе мы предложим метод, который
  пляр:                                                     устраняет не транзитивные цепочки и оставляет
                                                            только транзитивные.
  o Корабль «Санта-Мария» попал в категорию
     Типы кораблей: C:Ship_types → ... →                    4.1. Основная идея (и ее теоретическое обоснова-
     C:Exploration_ships → Santa_María_(ship).              ние)
   o Поэма под названием «Ода» попала в катего-
                                                                Как было показано в предыдущем разделе, одна
     рию Жанры литературы: C:Literary_genres →
                                                            из основных причин нарушения транзитивности
     C:Poetry → ... → Ode_(poem). Этот случай
                                                            состоит в том, что некоторые категории связаны с
     особенно опасен, т. к. существует настоящий            подкатегориями ассоциативным отношением, кото-
     литературный жанр с таким именем.                      рое в общем случае не является транзитивным.
• Нетранзитивность ассоциативного отношения:                    Существующие методы извлечения структури-
  o Город Зеленоград попал в Европейские сто-               рованной информации из системы категорий
     лицы: C:Capitals_in_Europe →                           (например, YAGO или WikiTaxonomy) выявляют
     C:Moscow → … → C:Zelenograd.                           ассоциативные связи между категориями и просто
   o Собака Блонди попала в категории Нацист-               устраняют их. Недостатком данных методов являет-
     сиких лидеров: C:Nazi_leaders →                        ся то, что они исключают даже те ассоциативные
     C:Adolf_Hitler → Blondi.                               связи, которые не нарушают транзитивность. В свя-
                                                            зи с этим возникает потребность в методе, который
   o Галактическая Империя из вымышленной                   устраняет ассоциативные отношения, нарушающие
     вселенной «Звездных войн» попала в катего-             транзитивность (например, Статистика → Демо-
     рию Североамериканские государства:                    графия), но сохраняет не нарушающие (например,
     C:Northern_American_countries →                        Образование → Учитель). Опишем основные прин-
     C:United_States → C:American_people → … →              ципы этого метода.
     C:George_Lucas → C:Star_Wars → … → Galac-                  Предлагаемый метод основан на подходе, кото-
     tic_Empire_(Star_Wars).                                рый применяется в тезаурусе РуТез для установле-
   o Языки Джибути попали в категорию Стати-                ния ассоциативных отношений между концептами
     стика: C:Statistics → C:Statistical_data_sets →        [30, 34–37]. В соответствии с этим подходом ассо-
     C:Demographics_by_country →                            циативное отношение между двумя концептами яв-
     C:Demographics_of_Djibouti →                           ляется транзитивным, если между концептами су-
     C:Languages_of_Djibouti.                               ществует отношение онтологической зависимости.
   o Биологическое оружие попало в категорию                    Для формализации отношения онтологической
     Трудовое право: C:Labour_law →                         зависимости [38–41] в РуТезе используется так
     C:Labour_relations →                                   называемый модально-экзистенциональный подход
     C:Occupational_safety_and_health →                     (modal-existential account): объект A зависит от объ-
     C:Toxicology → C:Biological_weapons.                   екта B тогда и только тогда, когда необходимо, что
                                                            если существует A, то существует и B [42, 43].
   o Расстрелянные колумбийцы попали в катего-
                                                                Модально-экзистенциональный подход имеет
     рию Арифметика: C:Arithmetic → C:Ratios →
                                                            ряд преимуществ, среди которых — простота и ма-
     C:Rates → C:Temporal_rates →
                                                            тематическая строгость. Недостатком этого подхода
     C:Acceleration → C:Force →                             является то, что его применение требует участия
     C:Motion_(physics) → C:Flight →                        человека. В связи с этим в исходном виде он не
     C:Ballistics → … → C:Projectile_weapons →              применим для решения поставленной нами задачи.
     C:Firearms →
                                                                Кроме того, модально-экзистенциональный под-
     C:People_associated_with_firearms →
                                                            ход был подвергнут критике с чисто онтологической
     C:Shooting_victims → ... →                             точки зрения. К. Файн (Kit Fine) показал, что дан-
     C:Colombian_people_executed_by_firing_squad            ный подход является слишком грубым приближени-
   Итак, нарушение транзитивности в системе кате-           ем к понятию онтологической зависимости и имеет
горий Википедии вызвано двумя группами причин.              ряд контрпримеров [44, 45]. В качестве альтернати-
К первой группе относятся причины, связанные с              вы Файн предложил эссенциальный подход
нарушением правил построения иерархии концептов             (essential account). Согласно этому подходу, A зави-
в онтологии. Эти нарушения могут быть устранены             сит от B, если A является неустранимой компонен-
самими авторами Википедии. Ко второй группе от-             той сущности B. При этом сущность объекта
носятся причины, связанные с самим принципом                (essence) понимается как набор утверждений, ис-
устройства системы категорий Википедии, главная             тинных в силу идентичности данного объекта. Эти
из которых — нетранзитивность ассоциативного                утверждения, в свою очередь, образуют реальное
отношения.                                                  определение объекта (real definition) [44, 45].




                                                       60
   Понятие быть истинным в силу идентичности                     4.3. Оценка
объекта (to be true in virtue of the identity of) требует
                                                                    Мы провели предварительное оценивание наше-
пояснения. В соответствии с интерпретацией самого
                                                                 го метода на категории C:Mathematics. Выбор этой
Файна,      основанной       на      позиции        мета-
онтологического реализма, данное понятие выража-                 категории был обусловлен решением практической
ет объективно существующее, примитивное и                        задачи по связыванию онтологии OntoMathPro [48-
неопределимое отношение между утверждением и                     50] с DBpedia [3-5]. Для этого с помощью данного
объектом. Мы предлагаем другую интерпретацию,                    метода мы исключили из этой категории предполо-
основанную на подходе Э.Л. Томассон (Amie L.                     жительно нерелевантные ей подкатегории. Список
Thomasson). Согласно Томассон, условиями суще-                   удаленных и оставленных подкатегорий был пере-
ствования и идентичности некоторого объекта A                    дан для ручной оценки. Задача асессора состояла в
являются условия применения/повторного примене-                  том, чтобы оценить, действительно ли оставленные
ния     термина      “A”     (application/co-application         категории релевантны основной категории и дей-
conditions) [46-47]. В соответствии с нашей интер-               ствительно ли удаленные – не релевантны. Резуль-
претацией, утверждение является истинным в силу                  тат оценивания представлен в Таблице 1.
идентичности объекта A, если оно является частью                 Таблица 1 Результат предварительной оценки пред-
условий применения/повторного применения тер-                    ложенного метода на категории C:Mathematics
мина “A”. И соответственно, объект A онтологиче-                        Total                    4281
ски зависит от объекта B, если условия примене-
                                                                        True positives           2136
ния/повторного применения термина “A” включают
в себя условия применения/повторного применения                         True negatives           650
термина “B”. Наша интерпретация показывает, что                         False positives          1010
эссенциальный подход не требует принятия кон-
                                                                        False negatives          485
кретных философских предпосылок.
                                                                        Recall                   0,814956
   Таким образом, использовав эссенциальный под-
ход, мы получили следующий критерий определе-                           Precision                0,678957
ния онтологической зависимости: X онтологически                         F1 score                 0,740766
зависит от Y, если Y неустранимым образом входит
в определение X. Данный критерий гораздо лучше
подходит для автоматического применения.                         5 Заключение
   В качестве аппроксимации определения объекта,                    Мы проанализировали причины нарушения
соответствующего той или иной категории, мы бра-                 транзитивности в системе категорий Википедии и
ли аннотации главной статьи данной категории и                   предложили подход к их устранению.
этой статьи на других языках. Факт вхождения объ-                   В дальнейшем мы планируем доработать данный
екта в определение другого объекта моделировался                 подход. В частности, предполагается извлекать
как наличие гиперссылки между определениями.                     определения из других страниц категории, а также
                                                                 использовать контекст ссылки внутри определения.
4.2. Опыт реализации                                                Мы планируем применить разработанный под-
   Экспериментальная реализация предложенного                    ход для извлечения тезауруса из системы категорий
подхода выглядит следующим образом:                              Википедии. В отличии от тезаурусов, построенных
                                                                 вручную (таких как РуТез или WordNet), данный
• Определяем, является ли отношение между кате-
                                                                 тезаурус будет содержать не только общие понятия,
  горией и ее подкатегорией ассоциативным. По-
                                                                 но и большое число именованных сущностей. В от-
  лагаем, что отношение является ассоциативным,
                                                                 личии от других тезаурусов, автоматически извле-
  если в нем участвует категория-топик. Тип кате-
                                                                 ченных их системы категорий Википедии, данный
  гории определяем с помощью метода из проекта
                                                                 тезаурус будет содержать не только иерархические
  WikiTaxonomy [11].
                                                                 отношения, но и подмножество ассоциативных от-
• Если отношение является ассоциативным, то с                    ношений, сохраняющих свойство транзитивности.
  помощью описанного выше критерия проверяем
                                                                    Извлеченный тезаурус будет интегрирован в
  отношение онтологической зависимости между
                                                                 RuThes Cloud, многоуровневый ресурс Лингвисти-
  подкатегорией и категорией. Если зависимость
                                                                 ческих открытых связанных данных (LLOD) для
  имеется, то сохраняем отношение между катего-
                                                                 русского языка и языков народов России [51].
  риями, если не имеется, то устраняем.
• Если отношение является не ассоциативным, а                        Благодарности. А. Кириллович благодарит проф. Сорена
                                                                 Ауэра (Sören Auer) из Боннского университета (Universität Bonn)
  таксономическим, то используем уже существу-                   за доброжелательность и ценные советы на ранней стадии работы
  ющий ресурс YAGO, содержащий очищенные                         над данным проектом.
  таксономические отношения. В случае, если от-                      Работа выполнена за счет средств субсидии, выделенной Ка-
  ношение присутствует в YAGO, сохраняем его и                   занскому федеральному университету для выполнения гос. зада-
  удаляем в противоположенном случае.                            ния в сфере научной деятельности, проект 1.2368.2017/ПЧ, а
                                                                 также при поддержке правительственной программы повышения
                                                                 конкурентоспособности Казанского федерального университета.




                                                            61
Литература                                                             et al. (eds.) 7th International Conference on Lan-
                                                                       guage Resources and Evaluation (LREC 2010), pp.
 [1] Medelyan, O., et al. Mining meaning from Wik-                     1015-1022 (2010)
     ipedia. International Journal of Human-Computer
                                                                  [14] Nastase, V., Strube, M. Transforming Wikipedia
     Studies, 67 (9), pp. 716-754. Academic Press
                                                                       into a large scale multilingual concept network.
     (2009). doi:10.1016/j.ijhcs.2009.05.004                           Artificial Intelligence, 194, pp. 62–85. Elsevier
 [2] Hovy, E., Navigli, R., Ponzetto, S.P. Collabora-                  (2013). doi:10.1016/j.artint.2012.06.008
     tively built semi-structured content and Artificial
                                                                  [15] Gangemi, A., et al. Automatic Typing of DBpedia
     Intelligence: The story so far. Artificial Intelli-
                                                                       Entities. In: Cudré-Mauroux P. et al. (eds.) 11th In-
     gence, 194, pp. 2–27. Elsevier (2013).
                                                                       ternational Semantic Web Conference (ISWC
     doi:10.1016/j.artint.2012.10.002                                  2012). LNCS, 7649, pp. 65-81. Springer (2012).
 [3] Auer, S., et al. DBpedia: A Nucleus for a Web of                  doi:10.1007/978-3-642-35176-1_5
     Open Data. In: Aberer K. et al. (eds.) 6th Interna-
                                                                  [16] Nuzzolese, A.G., et al. Towards the Natural Ontol-
     tional Semantic Web Conference, 2nd Asian Se-
                                                                       ogy of Wikipedia. In: Blomqvist E., Groza T.
     mantic Web Conference (ISWC 2007 + ASWC
                                                                       (eds.) Proceedings of the ISWC 2013 Posters &
     2007). The Semantic Web. LNCS, 4825, pp. 722-
                                                                       Demonstrations Track. CEUR Workshop Proceed-
     735. Springer (2007). doi:10.1007/978-3-540-
                                                                       ings, vol. 1035, pp. 273-276 (2013)
     76298-0_52
                                                                  [17] Flati, T., et al. Two Is Bigger (and Better) Than
 [4] Bizer, C., et al. DBpedia: A Crystallization Point
                                                                       One: the Wikipedia Bitaxonomy Project. In:
     for the Web of Data. Journal of Web Semantics, 7
                                                                       Toutanova K., Wu H. (eds.) 52nd Annual Meeting
     (3),     pp.       154–165.      Elsevier     (2009).
                                                                       of the Association for Computational Linguistics
     doi:10.1016/j.websem.2009.07.002
                                                                       (ACL 2014), vol. 1, pp. 945-955. ACM (2014).
 [5] Lehmann, J., et al. DBpedia: A Large-scale, Multi-                doi:10.3115/v1/P14-1089
     lingual Knowledge Base Extracted from Wikipe-
                                                                  [18] de Melo, G., Weikum, G. MENTA: Inducing Mul-
     dia. Semantic Web Journal, 6 (2), pp. 167-195.
                                                                       tilingual Taxonomies from Wikipedia. In: 19th
     IOS Press (2015). doi:10.3233/SW-140134
                                                                       ACM international conference on Information and
 [6] Suchanek, F. M., Kasneci, G., Weikum, G. Yago: a                  knowledge management (CIKM '10), pp. 1099-
     Core of Semantic Knowledge. In: 16th internation-                 1108. ACM (2010). doi:10.1145/1871437.1871577
     al conference on World Wide Web (WWW 2007),
                                                                  [19] Navigli, R., Ponzetto, S.P. BabelNet: Building a
     pp. 697-706 (2007). doi:10.1145/1242572.1242667
                                                                       Very Large Multilingual Semantic Network. In:
 [7] Hoffart, J., et al. G. YAGO2: A spatially and tem-                48th Annual Meeting of the Association for Com-
     porally enhanced knowledge base from Wikipedia.                   putational Linguistics (ACL 2010), pp. 216-225.
     Artificial Intelligence, 194, pp. 28–61. Elsevier                 ACL (2010)
     (2013). doi:10.1016/j.artint.2012.06.001
                                                                  [20] Navigli, R., Ponzetto, S.P. BabelNet: The automat-
 [8] Mahdisoltani, F., Biega, J., Suchanek, F.M. YA-                   ic construction, evaluation and application of a
     GO3: A Knowledge Base from Multilingual Wik-                      wide-coverage multilingual semantic network. Ar-
     ipedias. In: 7th Biennial Conference on Innovative                tificial Intelligence, 193, pp. 217–250. Elsevier
     Data Systems Research (CIDR 2015) (2015)                          (2012). doi:10.1016/j.artint.2012.07.001
 [9] Ponzetto, S.P., Strube, M. Deriving a Large Scale            [21] Moro, A., Navigli, R. WiSeNet: Building a Wik-
     Taxonomy from Wikipedia. In: 22nd National                        ipedia-based Semantic Network with Ontologized
     Conference on Artificial Intelligence (AAAI                       Relations. In: 21st ACM international conference
     2007), pp. 1440-1445. AAAI Press (2007)                           on Information and knowledge management
[10] Ponzetto, S.P., Strube, M. Taxonomy induction                     (CIKM 2012), pp. 1672-1676. ACM (2012). doi:
     based on a collaboratively built knowledge reposi-                10.1145/2396761.2398495
     tory. Artificial Intelligence, 175 (9–10), pp. 1737–         [22] Wu, F., Weld, D.S. Automatically Refining the
     1756.                  Elsevier               (2011).             Wikipedia Infobox Ontology. In: 17th international
     doi:10.1016/j.artint.2011.01.003                                  conference on World Wide Web (WWW 2008),
[11] Zirn, C., Nastase, V., Strube, M. Distinguishing                  pp.          635-644.          ACM            (2008).
     between Instances and Classes in the Wikipedia                    doi:10.1145/1367497.1367583
     Taxonomy. In: Zirn C., et al. (eds.) 5th European            [23] Ruiz-Casado, M., Alfonseca, E., Castells, P. Au-
     Semantic Web Conference (ESWC 2008). LNCS,                        tomatic Assignment of Wikipedia Encyclopedic
     5021,      pp.      376-387.     Springer     (2008).             Entries to WordNet Synsets. In: Szczepaniak P.S.,
     doi:10.1007/978-3-540-68234-9_29                                  et al. (eds.) 3rd International Conference on Ad-
[12] Nastase, V., Strube, M. Decoding Wikipedia Cate-                  vances in Web Intelligence (AWIC 2005). LNCS,
     gories for Knowledge Acquisition. In: Cohn A.                     3528,      pp.     380-386.     Springer      (2005).
     (ed.) 23rd National Conference on Artificial Intel-               doi:10.1007/11495772_59
     ligence (AAAI 2008), vol. 2, pp. 1219-1224.                  [24] Toral, A., Muñoz, R., Monachini, M. Named Enti-
     AAAI Press (2008)                                                 ty WordNet. In: 6th Conference on Language Re-
[13] Nastase, V., et al. WikiNet: A Very Large Scale                   sources and Evaluation (LREC 2008), pp. 741-747
     Multi-Lingual Concept Network. In: Calzolari N.,                  (2008)



                                                             62
[25] Niemann, E., Gurevych, I. The people’s web meets              [38] Tahko, T.E., Lowe, E.J. Ontological Dependence.
     linguistic knowledge: automatic sense alignment of                 In: Zalta E.N. (ed.) The Stanford Encyclopedia of
     Wikipedia and WordNet. In: 9th International Con-                  Philosophy                                   (2016).
     ference on Computational Semantics (IWCS                           http://plato.stanford.edu/entries/dependence-
     2011), pp. 205–214. ACL (2011)                                     ontological/
[26] Ponzetto, S.P., Navigli, R. Large-Scale Taxonomy              [39] Correia, F. Ontological Dependence. Philosophy
     Mapping for Restructuring and Integrating Wik-                     Compass, 3 (5), pp. 1013–1032. Wiley (2008). doi:
     ipedia. In: 21st International Joint Conference on                 10.1111/j.1747-9991.2008.00170.x
     Artificial Intelligence (IJCAI 2009), pp. 2083-               [40] Koslicki, K. Varieties of Ontological Dependence.
     2088. Morgan Kaufmann Publishers (2009)                            In: Correia F., Schnieder B. (eds.) Metaphysical
[27] Gella, S., Strapparava, C., Nastase, V. Mapping                    Grounding: Understanding the Structure of Reality,
     WordNet Domains, WordNet Topics and Wikipe-                        pp. 186-213. Cambridge University Press (2012)
     dia Categories to Generate Multilingual Domain                [41] Koslicki, K. Ontological Dependence: An Opin-
     Specific Resources. In: Calzolari N., et al. (eds.)                ionated Survey. In: Hoeltje M., et al. (eds.) Varie-
     9th International Conference on Language Re-                       ties of Dependence, pp. 31-64. Philosophia Verlag
     sources and Evaluation (LREC 2014), pp. 1117-                      (2013)
     1121. ELRA (2014)                                             [42] Simons, P. Parts: A Study in Ontology. Clarendon
[28] Titze, G., et al. DBpedia Domains: augmenting                      Press (1987). Ch. 8. Ontological Dependence.
     DBpedia with domain information. In: Calzolari                     doi:10.1093/acprof:oso/9780199241460.001.0001
     N., et al. (eds.) 9th International Conference on             [43] Thomasson, A.L. Fiction and Metaphysics. Cam-
     Language Resources and Evaluation (LREC 2014),                     bridge University Press. Chapter 2. The Nature and
     pp. 1438-1442. ELRA (2014)                                         Varieties of Existential Dependence, pp. 24-34
[29] ANSI-NISO Z39.19-2005                                              (1999)
[30] Loukachevitch, N. Thesauri in Information Re-                 [44] Fine, K. Essence and Modality. Philosophical Per-
     trieval Tasks. Moscow University Press (2011)                      spectives, 8, pp. 1-16. Ridgeview Publishing Com-
[31] Guarino, N., Welty, C. An Overview of OntoCle-                     pany (1994). doi:10.2307/2214160
     an. In: Staab S., Studer R. (eds.) Handbook on On-            [45] Fine, K. Ontological Dependence. Proceedings of
     tologies.    2nd     edition.    Springer      (2009).             the Aristotelian Society, 95, pp. 269-290. Wiley
     doi:10.1007/978-3-540-92673-3_9                                    (1995)
[32] Guarino, N., Welty, C. A Formal Ontology of                   [46] Thomasson, A.L. Existence Questions. Philosophi-
     Properties. In: Dieng R., Corby O. (eds.)                          cal Studies, 141(1), pp. 63-78. Springer (2008).
     Knowledge Engineering and Knowledge Manage-                        doi:10.1007/s11098-008-9263-8
     ment Methods, Models, and Tools (EKAW 2000).                  [47] Thomasson, A.L. Answerable and Unanswerable
     LNCS, 1937, pp. 97-112. Springer (2000).                           Questions. In: Chalmers D.J., et al. (eds.)
     doi:10.1007/3-540-39967-4_8                                        Metametaphysics: New Essays on the Foundations
[33] Guizzardi, G. Ontological foundations for structur-                of Ontology. Oxford University Press (2009)
     al conceptual models. CTIT (2005)                             [48] Nevzorova, O., et al. OntoMathPRO Ontology: a
[34] Loukachevitch, N., Dobrov, B. RuThes Linguistic                    Linked Data Hub for Mathematics. In: Klinov P.,
     Ontology vs. Russian Wordnets. In: Orav H., Fell-                  Mouromstev D. (eds.) 5th International Conference
     baum C., Vossen P. (eds.) 7th Conference on                        on Knowledge Engineering and Semantic Web
     Global WordNet (GWC 2014), pp. 154-162. Uni-                       (KESW 2014). CCIS, vol. 468, pp. 105–119.
     versity of Tartu Press (2014)                                      Springer, Heidelberg (2014). doi:10.1007/978-3-
[35] Loukachevitch, N., Dobrov, B., Chetviorkin, I.                     319-11716-4_9
     RuThes-Lite, a Publicly Available Version of The-             [49] Elizarov, A.M., et al. Mathematical Knowledge
     sauru of Russian Language RuThes. In: Computa-                     Representation: Semantic Models and Formalisms.
     tional Linguistics and Intellectual Technologies:                  Lobachevskii J. Math. 35(4), pp. 348–354. Pleia-
     Papers from the Annual International Conference                    des                 Publishing               (2014).
     “Dialogue”, pp. 340–349. RGGU (2014)                               doi:10.1134/S1995080214040143
[36] Loukachevitch, N., Dobrov, B. Development of                  [50] Elizarov, A., et al. Digital Ecosystem OntoMath:
     Ontologies with Minimal Set of Conceptual Rela-                    Mathematical Knowledge Analytics and Manage-
     tions. In: Lino, M.T., et al. (eds.) 4th International             ment. In: Kalinichenko L., et al. (eds.)
     Conference on Language Resources and Evalua-                       DAMDID/RCDL 2016. CCIS, vol. 706, pp. 33-46.
     tionp (LREC’04), pp. 1889-1892. ELRA (2004)                        Springer, Cham (2017). doi:10.1007/978-3-319-
[37] Loukachevitch, N., Dobrov, B. Ontological Types                    57135-5_3
     of Associative Relations in Information-Retrieval             [51] Kirillovich, A., et al. RuThes Cloud: Towards a
     Thesauri and Automatic Query Expansion. In: Ol-                    Multilevel Linguistic Linked Open Data Resource
     tramari A. et al. (eds.) Ontologies and Lexical Re-                for Russian. In: Różewski P., Lange C. (eds.)
     sources in Distributed Environments (Ontolex                       KESW 2017. CCIS, vol. 786, pp. 38-52. Springer,
     2004), pp. 24-29 (2004)                                            Cham (2017). doi:10.1007/978-3-319-69548-8_4




                                                              63