=Paper=
{{Paper
|id=Vol-2022/paper12
|storemode=property
|title=
Проблема транзитивности в системе категорий Википедии
(Problem of Transitivity of Wikipedia's Category System)
|pdfUrl=https://ceur-ws.org/Vol-2022/paper12.pdf
|volume=Vol-2022
|authors=Alexander Kirillovich,Olga Nevzorova
|dblpUrl=https://dblp.org/rec/conf/rcdl/Kirillovich17
}}
==
Проблема транзитивности в системе категорий Википедии
(Problem of Transitivity of Wikipedia's Category System)
==
Проблема транзитивности в системе категорий
Википедии
© А. В. Кириллович1 © О.А. Невзорова1,2
1
Казанский федеральный университет, Казань, Россия
2
Институт прикладной семиотики АН Республики Татарстан, Казань, Россия
alik.kirillovich@gmail.com onevzoro@gmail.com
Аннотация. Проведен анализ системы категорий Википедии. Показано, что в системе катего-
рий происходит нарушение требования транзитивности, в результате чего статья из подкатегории
некоторой категории может не относиться к основной категории. С помощью стандартных методов
онтологического моделирования проанализированы причины нарушений транзитивности. Предло-
жен подход к автоматическому устранению данных нарушений.
Ключевые слова: Википедия, система категорий, информационно-поисковой тезаурус, онто-
логическое моделирование, OntoClean, онтологическая зависимость
Problem of Transitivity of Wikipedia Category System
© Alexander Kirillovich1 © Olga Nevzorova1,2
1
Kazan Federal University, Kazan, Russia
2
Research Institute of Applied Semiotics of Tatarstan Academy of Sciences, Kazan, Russia
alik.kirillovich@gmail.com onevzoro@gmail.com
Abstract. This paper analyses a violation of the transitivity principle of Wikipedia category system.
Causes of the violation have been analyzed on base of ontological modeling methodologies such as Onto-
Clean. A new approach for elimination of the violation has been proposed.
Keywords: Wikipedia, categorization system, thesaurus, ontology engineering, OntoClean, ontologi-
cal dependence
Каждая категория может содержать подкатего-
1 Введение рии и самой находиться в родительских категориях.
Таким образом, система категорий представляет
Википедия — одно из крупнейших хранилищ собой ориентированный граф без циклов.
информации. Данные Википедии используются в
Категории могут группироваться с использова-
таких задачах как разрешение лексической много-
нием мета-категорий, например C:Writers →
значности, категоризация текста, вычисление семан-
тической близости, машинный перевод. Для автома- C:Writers_by_nationality → C:Russian_writers.
тической обработки информации из Википедии тре- Согласно правилам Википедии, статья должна
буется средство ее структурирования. находиться в наиболее специфичной категории в
Система категорий — основной инструмент иерархии. Например статья Anton_Chekhov должна
структурирования информации в Википедии. Кате- находиться не в категории C:Writers, а в ее вложен-
гории хранят статьи, объединенные общей темой. ной подкатегории C:Russian_novelists через цепочку:
C:Writers → C:Writers_by_nationality → C:Russian_
Категории бывают двух видов:
writers → C:Russian_novelists → Anton_Chekhov. По-
• Категории-множества, например C:Cities, которая этому, чтобы получить все статьи, релевантные за-
содержит статьи про конкретные города данной категории, требуется извлекать статьи из
(Москва, Казань, Лондон, Урюпинск и т. д.). всех ее вложенных подкатегорий.
• Категории-топики, например C:City, которая со- В связи с этим требуется, чтобы система катего-
держит статьи по городской тематике (Городское рий была транзитивной: статьи из вложенных под-
планирование, Урбанизация, История городов, категорий должны быть релевантны родительской
Городская культура и т.д.). категории. Однако требование транзитивности
нарушается. Так например категория Арифметика
содержит нерелевантную ей вложенную подкатего-
Труды XIX Международной конференции рию Расстрелянные колумбийцы: C:Arithmetic →
«Аналитика и управление данными в областях C:Ratios → C:Rates → C:Temporal_rates →
с интенсивным использованием данных» C:Acceleration → C:Force → C:Motion_(physics) →
(DAMDID/ RCDL’2017), Москва, Россия, 10–13
октября 2017 года
57
C:Flight → C:Ballistics → ... → C:Projectile_weapons → o C:Operating_systems → C:Unix;
C:Firearms → C:People_associated_with_firearms → o C:Fields_of_mathematics → C:Algebra;
C:Shooting_victims → ... →
o C:Axioms_of_set_theory → C:Axiom_of_choice;
C:Colombian_people_executed_by_firing_squad.
o C:Abstract_strategy_games → C:Chess;
Цель данной статьи — проанализировать про-
блему нарушения транзитивности в системе катего- o C:Engines → C:Internal_combustion_engine;
рий Википедии и предложить подход к ее решению. o C:Wars_involving_the_Soviet_Union →
Она построена следующим образом. В разделе 2 C:World_War_II;
кратко перечислены другие средства структуриро-
o C:Dystopian_novels → C:Nineteen_Eighty-Four;
вания данных Википедии и отмечены их ограниче-
ния. В разделе 3 система категорий исследована с o C:Organs → C:Brain;
помощью классических методов онтологического o C:Space_stations →
моделирования и выявлены причины потери транзи- C:International_Space_Station.
тивности. В разделе 4 предложен подход, который
исправляет систему категорий, удаляя из нее не- • Отношение часть → целое:
транзитивные цепочки. В Разделе 5 описаны o C:Moscow →
направления будущей работы. C:Cities_and_towns_under_jurisdiction_of_Mos
cow → C:Zelenograd;
2 Связанные работы o C:Yale_University → C:Yale_University_Library
Существует множество проектов по извлечению o C:United_Nations →
структурированных данных из Википедии [1, 2]: C:International_Atomic_Energy_Agency;
DBpedia [3–5], YAGO [6–8], WikiTaxonomy [9–11], o C:World_War_II → … →
WikiNet [12–14], ORA: The Natural Ontology of C:Attack_on_Pearl_Harbor;
Wikipedia [15,16], WiBi [17], MENTA [18], BabelNet
[19-20], WiSiNet [22], KOG: Kylin Ontology Generator o C:Central_nervous_system → C:Brain;
[23], а также проектов выравнивания системы кате- o C:Unix → C:Network_socket;
горий и WordNet [24–28]. Однако данные проекты o C:Internal_combustion_engine → C:Pistons.
не являются универсальными и не применимы к
категориям-топикам. • Ассоциативные отношения:
§ Наука → объект изучения:
3 Анализ причин нарушения транзитив- o C:Botany → C:Plants.
ности § Агент → контрагент:
Проанализируем систему категорий с помощью o C:Plants → C:Herbicides;
методологий онтологического моделирования и вы- o C:Violence → C:Nonviolence;
явим причины потери транзитивности.
o C:Communism → C:Anti-communism.
Систему категорий можно рассмотреть в каче-
§ Величина → инструмент для измерения:
стве тезауруса [29, 30]. Категории будут соответ-
ствовать концептам, а отношения между категорией o C:Temperature → C:Thermometers.
и подкатегорией – стандартным онтологическим § Деятельность → агент деятельности:
отношениям: o C:Hunting → C:Hunting_dogs;
• Отношение класс → подкласс: o C:Military → C:Military_personnel.
o C:Cities_in_Europe → C:Capitals_in_Europe; § Сырье → результат:
o C:Software → ... → C:Operating_systems; o C:Grape → C:Raisins;
o C:Mathematical_axioms → o C:Petroleum → C:Petroleum_products →
C:Axioms_of_set_theory; Gasoline;
o C:Machines → C:Engines; o C:Textiles → C:Textile_arts → C:Weaving.
o C:Wars → ... → § Другие ассоциативные отношения:
C:Wars_involving_the_Soviet_Union;
o C:Death → C:Death_customs → C:Funerals;
o C:Fiction_books → ... → C:Dystopian_novels.
o C:Automobiles → C:Auto_racing;
• Отношение класс → экземпляр:
o C:Books → C:Book_arts → C:Bookbinding.
o C:Capitals_in_Europe → C:Moscow;
Мета-категориям соответствует так называемые
o C:Intergovernmental_organizations → «Node labels».
C:United_Nations; Задача нахождения релевантных подкатегорий
o C:Universities_and_colleges_in_Connecticut → для заданной категории соответствует стандартной
C:Yale_University; задаче расширения поискового запроса (query ex-
pansion).
58
Представив систему категорий в виде тезауруса, биологический процесс, а другом случае – как
мы применили к ней формальную методологию социальный процесс.
проверки корректности онтологий OntoClean, а так- o Снег попал в Жидкости: C:Liquids →
же методологию построения информационно- C:Water → C:Forms_of_water → C:Snow. В
поисковых тезаурусов [29–33]. В результате оказа- одном случае Вода рассматривалась как ве-
лось, что многие случаи нарушения транзитивности щество вообще, а в другом – как вещество в
вызваны нарушениями правил построения иерархии жидком агрегатном состоянии.
концептов онтологии. Основными такими причина-
ми являются: • Несовместимые критерии идентичности:
• Неполное включение одной категории в другую: o Мусульманская святыня Кааба попала в кате-
горию Математические объекты:
o Аналоговая Кинопленка попала в категорию C:Mathematical_objects →
Цифровые технологии:
C:Geometric_shapes →
C:Digital_technology → C:Digital_media →
C:Elementary_shapes → C:Cubes →
C:Video → C:Film_and_video_technology →
C:Cubic_buildings → C:Kaaba. Ошибка нахо-
C:Film_stock. Причина в том, что категория
дится в цепочке C:Cubes → C:Cubic_buildings.
Видео не полностью входит в категорию
Кубические здания, вообще говоря, не явля-
Цифровые медиа, т.к. существует и аналого-
ются кубами, т. к. у них разные критерии
вое видео.
идентичности. Куб — это абстрактный, вне-
o Англоязычный роман «Лолита» попал в кате- временной, неизменный объект. Если куб из-
горию Русские романы: менится хотя-бы на миллиметр, то это будет
C:Russian_novels → …→ уже другой куб. Кубическое же здание — это
C:Novels_by_Vladimir_Nabokov → Lolita. Ана- конкретный объект, существующий во вре-
логично, категория Новеллы Набокова не мени и пространстве и сохраняющий иден-
полностью входит в категорию Русские рома- тичность при небольших модификациях.
ны. o Бермудский треугольник попал в категорию
o Японский язык попал в категорию Языки Ко- Геометрические объекты:
реи: C:Languages_of_Korea → C:Mathematical_objects →
C:Buyeo_languages → C:Japonic_languages → C:Geometric_shapes →
C:Japanese_language. C:Elementary_shapes → C:Triangles → Bermu-
• Ошибки при использовании нечетких понятий: da_Triangle.
o Электрические стулья попали в категорию • Смешение понятия и знака:
Потребительские товары: o Династия Габсбургов попала в категорию
C:Consumer_goods → C:Furniture → Слова и фразы: C:Words_and_phrases → ... →
C:Chairs → C:Electric_chairs. C:Surnames_of_Swiss_origin →
• Ошибки с использованием омонимичных катего- C:Swiss_families → C:Swiss_noble_families →
рий: C:House_of_Habsburg.
o Музыкальные чарты попали в Диаграмы: o Токсин попал в категорию Язык:
C:Diagrams → C:Charts → C:Record_charts. В C:Language → C:Terminology →
одном случае C:Charts использовались в зна- C:Biology_terminology → Toxin. Причина
чении диаграмм, а в другом – в значении му- ошибки в том, что токсин не является терми-
зыкальных чартов. ном. Термином является слово “токсин”.
o Строительство кораблей попало в Недви- • Наследование типов от ролей:
жимость: C:Real_estate → C:Construction → o Анальгетики попали в категорию Запрещен-
C:Ship_construction. ные наркотики: C:Illegal_drugs →
• Использование одного понятия в разных смыс- C:Morphine → C:Analgesic. Причина ошибки в
лах: том, что Запрещенные наркотики — это не
o Электронная библиотека Lib.ru попала в кате- тип, а роль, и она не должна содержать кате-
горию Здания: C:Buildings_and_structures → гории-типы.
C:Buildings_and_structures_by_type → o Бомбовые прицелы попали в категорию
C:Libraries → C:Digital_libraries → Lib.ru. В од- Офисные принадлежности:
ном случае Библиотека рассматривалась как C:Office_equipment → C:Computers → … →
тип здания, а в другом – как социальный ин- C:Analog_computers → …→
ститут. C:Optical_bombsights.
o Философское мировоззрение Нигилизм попа- o Волчья ягода (несъедобная) попала в катего-
ло в категорию Биология: C:Biology → рию Еда: C:Foods → C:Fruit → C:Berries →
C:Life → C:Philosophy_of_life → C:Nihilism. В C:Sambucus.
одном случае Жизнь рассматривалась как
59
В следующих случаях транзитивность нарушает- 4 Подход к устранению нарушений тран-
ся не вследствие ошибки, а вследствие самого прин- зитивности
ципа построения системы категорий Википедии:
• Нетранзитивность отношения класс → экзем- В данном разделе мы предложим метод, который
пляр: устраняет не транзитивные цепочки и оставляет
только транзитивные.
o Корабль «Санта-Мария» попал в категорию
Типы кораблей: C:Ship_types → ... → 4.1. Основная идея (и ее теоретическое обоснова-
C:Exploration_ships → Santa_María_(ship). ние)
o Поэма под названием «Ода» попала в катего-
Как было показано в предыдущем разделе, одна
рию Жанры литературы: C:Literary_genres →
из основных причин нарушения транзитивности
C:Poetry → ... → Ode_(poem). Этот случай
состоит в том, что некоторые категории связаны с
особенно опасен, т. к. существует настоящий подкатегориями ассоциативным отношением, кото-
литературный жанр с таким именем. рое в общем случае не является транзитивным.
• Нетранзитивность ассоциативного отношения: Существующие методы извлечения структури-
o Город Зеленоград попал в Европейские сто- рованной информации из системы категорий
лицы: C:Capitals_in_Europe → (например, YAGO или WikiTaxonomy) выявляют
C:Moscow → … → C:Zelenograd. ассоциативные связи между категориями и просто
o Собака Блонди попала в категории Нацист- устраняют их. Недостатком данных методов являет-
сиких лидеров: C:Nazi_leaders → ся то, что они исключают даже те ассоциативные
C:Adolf_Hitler → Blondi. связи, которые не нарушают транзитивность. В свя-
зи с этим возникает потребность в методе, который
o Галактическая Империя из вымышленной устраняет ассоциативные отношения, нарушающие
вселенной «Звездных войн» попала в катего- транзитивность (например, Статистика → Демо-
рию Североамериканские государства: графия), но сохраняет не нарушающие (например,
C:Northern_American_countries → Образование → Учитель). Опишем основные прин-
C:United_States → C:American_people → … → ципы этого метода.
C:George_Lucas → C:Star_Wars → … → Galac- Предлагаемый метод основан на подходе, кото-
tic_Empire_(Star_Wars). рый применяется в тезаурусе РуТез для установле-
o Языки Джибути попали в категорию Стати- ния ассоциативных отношений между концептами
стика: C:Statistics → C:Statistical_data_sets → [30, 34–37]. В соответствии с этим подходом ассо-
C:Demographics_by_country → циативное отношение между двумя концептами яв-
C:Demographics_of_Djibouti → ляется транзитивным, если между концептами су-
C:Languages_of_Djibouti. ществует отношение онтологической зависимости.
o Биологическое оружие попало в категорию Для формализации отношения онтологической
Трудовое право: C:Labour_law → зависимости [38–41] в РуТезе используется так
C:Labour_relations → называемый модально-экзистенциональный подход
C:Occupational_safety_and_health → (modal-existential account): объект A зависит от объ-
C:Toxicology → C:Biological_weapons. екта B тогда и только тогда, когда необходимо, что
если существует A, то существует и B [42, 43].
o Расстрелянные колумбийцы попали в катего-
Модально-экзистенциональный подход имеет
рию Арифметика: C:Arithmetic → C:Ratios →
ряд преимуществ, среди которых — простота и ма-
C:Rates → C:Temporal_rates →
тематическая строгость. Недостатком этого подхода
C:Acceleration → C:Force → является то, что его применение требует участия
C:Motion_(physics) → C:Flight → человека. В связи с этим в исходном виде он не
C:Ballistics → … → C:Projectile_weapons → применим для решения поставленной нами задачи.
C:Firearms →
Кроме того, модально-экзистенциональный под-
C:People_associated_with_firearms →
ход был подвергнут критике с чисто онтологической
C:Shooting_victims → ... → точки зрения. К. Файн (Kit Fine) показал, что дан-
C:Colombian_people_executed_by_firing_squad ный подход является слишком грубым приближени-
Итак, нарушение транзитивности в системе кате- ем к понятию онтологической зависимости и имеет
горий Википедии вызвано двумя группами причин. ряд контрпримеров [44, 45]. В качестве альтернати-
К первой группе относятся причины, связанные с вы Файн предложил эссенциальный подход
нарушением правил построения иерархии концептов (essential account). Согласно этому подходу, A зави-
в онтологии. Эти нарушения могут быть устранены сит от B, если A является неустранимой компонен-
самими авторами Википедии. Ко второй группе от- той сущности B. При этом сущность объекта
носятся причины, связанные с самим принципом (essence) понимается как набор утверждений, ис-
устройства системы категорий Википедии, главная тинных в силу идентичности данного объекта. Эти
из которых — нетранзитивность ассоциативного утверждения, в свою очередь, образуют реальное
отношения. определение объекта (real definition) [44, 45].
60
Понятие быть истинным в силу идентичности 4.3. Оценка
объекта (to be true in virtue of the identity of) требует
Мы провели предварительное оценивание наше-
пояснения. В соответствии с интерпретацией самого
го метода на категории C:Mathematics. Выбор этой
Файна, основанной на позиции мета-
онтологического реализма, данное понятие выража- категории был обусловлен решением практической
ет объективно существующее, примитивное и задачи по связыванию онтологии OntoMathPro [48-
неопределимое отношение между утверждением и 50] с DBpedia [3-5]. Для этого с помощью данного
объектом. Мы предлагаем другую интерпретацию, метода мы исключили из этой категории предполо-
основанную на подходе Э.Л. Томассон (Amie L. жительно нерелевантные ей подкатегории. Список
Thomasson). Согласно Томассон, условиями суще- удаленных и оставленных подкатегорий был пере-
ствования и идентичности некоторого объекта A дан для ручной оценки. Задача асессора состояла в
являются условия применения/повторного примене- том, чтобы оценить, действительно ли оставленные
ния термина “A” (application/co-application категории релевантны основной категории и дей-
conditions) [46-47]. В соответствии с нашей интер- ствительно ли удаленные – не релевантны. Резуль-
претацией, утверждение является истинным в силу тат оценивания представлен в Таблице 1.
идентичности объекта A, если оно является частью Таблица 1 Результат предварительной оценки пред-
условий применения/повторного применения тер- ложенного метода на категории C:Mathematics
мина “A”. И соответственно, объект A онтологиче- Total 4281
ски зависит от объекта B, если условия примене-
True positives 2136
ния/повторного применения термина “A” включают
в себя условия применения/повторного применения True negatives 650
термина “B”. Наша интерпретация показывает, что False positives 1010
эссенциальный подход не требует принятия кон-
False negatives 485
кретных философских предпосылок.
Recall 0,814956
Таким образом, использовав эссенциальный под-
ход, мы получили следующий критерий определе- Precision 0,678957
ния онтологической зависимости: X онтологически F1 score 0,740766
зависит от Y, если Y неустранимым образом входит
в определение X. Данный критерий гораздо лучше
подходит для автоматического применения. 5 Заключение
В качестве аппроксимации определения объекта, Мы проанализировали причины нарушения
соответствующего той или иной категории, мы бра- транзитивности в системе категорий Википедии и
ли аннотации главной статьи данной категории и предложили подход к их устранению.
этой статьи на других языках. Факт вхождения объ- В дальнейшем мы планируем доработать данный
екта в определение другого объекта моделировался подход. В частности, предполагается извлекать
как наличие гиперссылки между определениями. определения из других страниц категории, а также
использовать контекст ссылки внутри определения.
4.2. Опыт реализации Мы планируем применить разработанный под-
Экспериментальная реализация предложенного ход для извлечения тезауруса из системы категорий
подхода выглядит следующим образом: Википедии. В отличии от тезаурусов, построенных
вручную (таких как РуТез или WordNet), данный
• Определяем, является ли отношение между кате-
тезаурус будет содержать не только общие понятия,
горией и ее подкатегорией ассоциативным. По-
но и большое число именованных сущностей. В от-
лагаем, что отношение является ассоциативным,
личии от других тезаурусов, автоматически извле-
если в нем участвует категория-топик. Тип кате-
ченных их системы категорий Википедии, данный
гории определяем с помощью метода из проекта
тезаурус будет содержать не только иерархические
WikiTaxonomy [11].
отношения, но и подмножество ассоциативных от-
• Если отношение является ассоциативным, то с ношений, сохраняющих свойство транзитивности.
помощью описанного выше критерия проверяем
Извлеченный тезаурус будет интегрирован в
отношение онтологической зависимости между
RuThes Cloud, многоуровневый ресурс Лингвисти-
подкатегорией и категорией. Если зависимость
ческих открытых связанных данных (LLOD) для
имеется, то сохраняем отношение между катего-
русского языка и языков народов России [51].
риями, если не имеется, то устраняем.
• Если отношение является не ассоциативным, а Благодарности. А. Кириллович благодарит проф. Сорена
Ауэра (Sören Auer) из Боннского университета (Universität Bonn)
таксономическим, то используем уже существу- за доброжелательность и ценные советы на ранней стадии работы
ющий ресурс YAGO, содержащий очищенные над данным проектом.
таксономические отношения. В случае, если от- Работа выполнена за счет средств субсидии, выделенной Ка-
ношение присутствует в YAGO, сохраняем его и занскому федеральному университету для выполнения гос. зада-
удаляем в противоположенном случае. ния в сфере научной деятельности, проект 1.2368.2017/ПЧ, а
также при поддержке правительственной программы повышения
конкурентоспособности Казанского федерального университета.
61
Литература et al. (eds.) 7th International Conference on Lan-
guage Resources and Evaluation (LREC 2010), pp.
[1] Medelyan, O., et al. Mining meaning from Wik- 1015-1022 (2010)
ipedia. International Journal of Human-Computer
[14] Nastase, V., Strube, M. Transforming Wikipedia
Studies, 67 (9), pp. 716-754. Academic Press
into a large scale multilingual concept network.
(2009). doi:10.1016/j.ijhcs.2009.05.004 Artificial Intelligence, 194, pp. 62–85. Elsevier
[2] Hovy, E., Navigli, R., Ponzetto, S.P. Collabora- (2013). doi:10.1016/j.artint.2012.06.008
tively built semi-structured content and Artificial
[15] Gangemi, A., et al. Automatic Typing of DBpedia
Intelligence: The story so far. Artificial Intelli-
Entities. In: Cudré-Mauroux P. et al. (eds.) 11th In-
gence, 194, pp. 2–27. Elsevier (2013).
ternational Semantic Web Conference (ISWC
doi:10.1016/j.artint.2012.10.002 2012). LNCS, 7649, pp. 65-81. Springer (2012).
[3] Auer, S., et al. DBpedia: A Nucleus for a Web of doi:10.1007/978-3-642-35176-1_5
Open Data. In: Aberer K. et al. (eds.) 6th Interna-
[16] Nuzzolese, A.G., et al. Towards the Natural Ontol-
tional Semantic Web Conference, 2nd Asian Se-
ogy of Wikipedia. In: Blomqvist E., Groza T.
mantic Web Conference (ISWC 2007 + ASWC
(eds.) Proceedings of the ISWC 2013 Posters &
2007). The Semantic Web. LNCS, 4825, pp. 722-
Demonstrations Track. CEUR Workshop Proceed-
735. Springer (2007). doi:10.1007/978-3-540-
ings, vol. 1035, pp. 273-276 (2013)
76298-0_52
[17] Flati, T., et al. Two Is Bigger (and Better) Than
[4] Bizer, C., et al. DBpedia: A Crystallization Point
One: the Wikipedia Bitaxonomy Project. In:
for the Web of Data. Journal of Web Semantics, 7
Toutanova K., Wu H. (eds.) 52nd Annual Meeting
(3), pp. 154–165. Elsevier (2009).
of the Association for Computational Linguistics
doi:10.1016/j.websem.2009.07.002
(ACL 2014), vol. 1, pp. 945-955. ACM (2014).
[5] Lehmann, J., et al. DBpedia: A Large-scale, Multi- doi:10.3115/v1/P14-1089
lingual Knowledge Base Extracted from Wikipe-
[18] de Melo, G., Weikum, G. MENTA: Inducing Mul-
dia. Semantic Web Journal, 6 (2), pp. 167-195.
tilingual Taxonomies from Wikipedia. In: 19th
IOS Press (2015). doi:10.3233/SW-140134
ACM international conference on Information and
[6] Suchanek, F. M., Kasneci, G., Weikum, G. Yago: a knowledge management (CIKM '10), pp. 1099-
Core of Semantic Knowledge. In: 16th internation- 1108. ACM (2010). doi:10.1145/1871437.1871577
al conference on World Wide Web (WWW 2007),
[19] Navigli, R., Ponzetto, S.P. BabelNet: Building a
pp. 697-706 (2007). doi:10.1145/1242572.1242667
Very Large Multilingual Semantic Network. In:
[7] Hoffart, J., et al. G. YAGO2: A spatially and tem- 48th Annual Meeting of the Association for Com-
porally enhanced knowledge base from Wikipedia. putational Linguistics (ACL 2010), pp. 216-225.
Artificial Intelligence, 194, pp. 28–61. Elsevier ACL (2010)
(2013). doi:10.1016/j.artint.2012.06.001
[20] Navigli, R., Ponzetto, S.P. BabelNet: The automat-
[8] Mahdisoltani, F., Biega, J., Suchanek, F.M. YA- ic construction, evaluation and application of a
GO3: A Knowledge Base from Multilingual Wik- wide-coverage multilingual semantic network. Ar-
ipedias. In: 7th Biennial Conference on Innovative tificial Intelligence, 193, pp. 217–250. Elsevier
Data Systems Research (CIDR 2015) (2015) (2012). doi:10.1016/j.artint.2012.07.001
[9] Ponzetto, S.P., Strube, M. Deriving a Large Scale [21] Moro, A., Navigli, R. WiSeNet: Building a Wik-
Taxonomy from Wikipedia. In: 22nd National ipedia-based Semantic Network with Ontologized
Conference on Artificial Intelligence (AAAI Relations. In: 21st ACM international conference
2007), pp. 1440-1445. AAAI Press (2007) on Information and knowledge management
[10] Ponzetto, S.P., Strube, M. Taxonomy induction (CIKM 2012), pp. 1672-1676. ACM (2012). doi:
based on a collaboratively built knowledge reposi- 10.1145/2396761.2398495
tory. Artificial Intelligence, 175 (9–10), pp. 1737– [22] Wu, F., Weld, D.S. Automatically Refining the
1756. Elsevier (2011). Wikipedia Infobox Ontology. In: 17th international
doi:10.1016/j.artint.2011.01.003 conference on World Wide Web (WWW 2008),
[11] Zirn, C., Nastase, V., Strube, M. Distinguishing pp. 635-644. ACM (2008).
between Instances and Classes in the Wikipedia doi:10.1145/1367497.1367583
Taxonomy. In: Zirn C., et al. (eds.) 5th European [23] Ruiz-Casado, M., Alfonseca, E., Castells, P. Au-
Semantic Web Conference (ESWC 2008). LNCS, tomatic Assignment of Wikipedia Encyclopedic
5021, pp. 376-387. Springer (2008). Entries to WordNet Synsets. In: Szczepaniak P.S.,
doi:10.1007/978-3-540-68234-9_29 et al. (eds.) 3rd International Conference on Ad-
[12] Nastase, V., Strube, M. Decoding Wikipedia Cate- vances in Web Intelligence (AWIC 2005). LNCS,
gories for Knowledge Acquisition. In: Cohn A. 3528, pp. 380-386. Springer (2005).
(ed.) 23rd National Conference on Artificial Intel- doi:10.1007/11495772_59
ligence (AAAI 2008), vol. 2, pp. 1219-1224. [24] Toral, A., Muñoz, R., Monachini, M. Named Enti-
AAAI Press (2008) ty WordNet. In: 6th Conference on Language Re-
[13] Nastase, V., et al. WikiNet: A Very Large Scale sources and Evaluation (LREC 2008), pp. 741-747
Multi-Lingual Concept Network. In: Calzolari N., (2008)
62
[25] Niemann, E., Gurevych, I. The people’s web meets [38] Tahko, T.E., Lowe, E.J. Ontological Dependence.
linguistic knowledge: automatic sense alignment of In: Zalta E.N. (ed.) The Stanford Encyclopedia of
Wikipedia and WordNet. In: 9th International Con- Philosophy (2016).
ference on Computational Semantics (IWCS http://plato.stanford.edu/entries/dependence-
2011), pp. 205–214. ACL (2011) ontological/
[26] Ponzetto, S.P., Navigli, R. Large-Scale Taxonomy [39] Correia, F. Ontological Dependence. Philosophy
Mapping for Restructuring and Integrating Wik- Compass, 3 (5), pp. 1013–1032. Wiley (2008). doi:
ipedia. In: 21st International Joint Conference on 10.1111/j.1747-9991.2008.00170.x
Artificial Intelligence (IJCAI 2009), pp. 2083- [40] Koslicki, K. Varieties of Ontological Dependence.
2088. Morgan Kaufmann Publishers (2009) In: Correia F., Schnieder B. (eds.) Metaphysical
[27] Gella, S., Strapparava, C., Nastase, V. Mapping Grounding: Understanding the Structure of Reality,
WordNet Domains, WordNet Topics and Wikipe- pp. 186-213. Cambridge University Press (2012)
dia Categories to Generate Multilingual Domain [41] Koslicki, K. Ontological Dependence: An Opin-
Specific Resources. In: Calzolari N., et al. (eds.) ionated Survey. In: Hoeltje M., et al. (eds.) Varie-
9th International Conference on Language Re- ties of Dependence, pp. 31-64. Philosophia Verlag
sources and Evaluation (LREC 2014), pp. 1117- (2013)
1121. ELRA (2014) [42] Simons, P. Parts: A Study in Ontology. Clarendon
[28] Titze, G., et al. DBpedia Domains: augmenting Press (1987). Ch. 8. Ontological Dependence.
DBpedia with domain information. In: Calzolari doi:10.1093/acprof:oso/9780199241460.001.0001
N., et al. (eds.) 9th International Conference on [43] Thomasson, A.L. Fiction and Metaphysics. Cam-
Language Resources and Evaluation (LREC 2014), bridge University Press. Chapter 2. The Nature and
pp. 1438-1442. ELRA (2014) Varieties of Existential Dependence, pp. 24-34
[29] ANSI-NISO Z39.19-2005 (1999)
[30] Loukachevitch, N. Thesauri in Information Re- [44] Fine, K. Essence and Modality. Philosophical Per-
trieval Tasks. Moscow University Press (2011) spectives, 8, pp. 1-16. Ridgeview Publishing Com-
[31] Guarino, N., Welty, C. An Overview of OntoCle- pany (1994). doi:10.2307/2214160
an. In: Staab S., Studer R. (eds.) Handbook on On- [45] Fine, K. Ontological Dependence. Proceedings of
tologies. 2nd edition. Springer (2009). the Aristotelian Society, 95, pp. 269-290. Wiley
doi:10.1007/978-3-540-92673-3_9 (1995)
[32] Guarino, N., Welty, C. A Formal Ontology of [46] Thomasson, A.L. Existence Questions. Philosophi-
Properties. In: Dieng R., Corby O. (eds.) cal Studies, 141(1), pp. 63-78. Springer (2008).
Knowledge Engineering and Knowledge Manage- doi:10.1007/s11098-008-9263-8
ment Methods, Models, and Tools (EKAW 2000). [47] Thomasson, A.L. Answerable and Unanswerable
LNCS, 1937, pp. 97-112. Springer (2000). Questions. In: Chalmers D.J., et al. (eds.)
doi:10.1007/3-540-39967-4_8 Metametaphysics: New Essays on the Foundations
[33] Guizzardi, G. Ontological foundations for structur- of Ontology. Oxford University Press (2009)
al conceptual models. CTIT (2005) [48] Nevzorova, O., et al. OntoMathPRO Ontology: a
[34] Loukachevitch, N., Dobrov, B. RuThes Linguistic Linked Data Hub for Mathematics. In: Klinov P.,
Ontology vs. Russian Wordnets. In: Orav H., Fell- Mouromstev D. (eds.) 5th International Conference
baum C., Vossen P. (eds.) 7th Conference on on Knowledge Engineering and Semantic Web
Global WordNet (GWC 2014), pp. 154-162. Uni- (KESW 2014). CCIS, vol. 468, pp. 105–119.
versity of Tartu Press (2014) Springer, Heidelberg (2014). doi:10.1007/978-3-
[35] Loukachevitch, N., Dobrov, B., Chetviorkin, I. 319-11716-4_9
RuThes-Lite, a Publicly Available Version of The- [49] Elizarov, A.M., et al. Mathematical Knowledge
sauru of Russian Language RuThes. In: Computa- Representation: Semantic Models and Formalisms.
tional Linguistics and Intellectual Technologies: Lobachevskii J. Math. 35(4), pp. 348–354. Pleia-
Papers from the Annual International Conference des Publishing (2014).
“Dialogue”, pp. 340–349. RGGU (2014) doi:10.1134/S1995080214040143
[36] Loukachevitch, N., Dobrov, B. Development of [50] Elizarov, A., et al. Digital Ecosystem OntoMath:
Ontologies with Minimal Set of Conceptual Rela- Mathematical Knowledge Analytics and Manage-
tions. In: Lino, M.T., et al. (eds.) 4th International ment. In: Kalinichenko L., et al. (eds.)
Conference on Language Resources and Evalua- DAMDID/RCDL 2016. CCIS, vol. 706, pp. 33-46.
tionp (LREC’04), pp. 1889-1892. ELRA (2004) Springer, Cham (2017). doi:10.1007/978-3-319-
[37] Loukachevitch, N., Dobrov, B. Ontological Types 57135-5_3
of Associative Relations in Information-Retrieval [51] Kirillovich, A., et al. RuThes Cloud: Towards a
Thesauri and Automatic Query Expansion. In: Ol- Multilevel Linguistic Linked Open Data Resource
tramari A. et al. (eds.) Ontologies and Lexical Re- for Russian. In: Różewski P., Lange C. (eds.)
sources in Distributed Environments (Ontolex KESW 2017. CCIS, vol. 786, pp. 38-52. Springer,
2004), pp. 24-29 (2004) Cham (2017). doi:10.1007/978-3-319-69548-8_4
63