Управление математическими знаниями: онтологические модели и цифровые технологии © А.М. Елизаров1 © А.В. Кириллович1 © Е.К. Липачев1 © О.А. Невзорова2 1 Казанский (Приволжский) федеральный университет, 2 Институт прикладной семиотики АН Республики Татарстан, Казань amelizarov@gmail.com alik.kirillovich@gmail.com elipachev@gmail.com onevzoro@gmail.com имеющимися знаниями, организацию эффективного Аннотация доступа к ним, а также совместное и многократное Представлены основные идеи, подходы и уже использование новых видов структур знаний. полученные результаты, развиваемые в рамках В области профессиональной математики уже проекта по разработке технологий управления накоплен значительный опыт обработки и математическими знаниями на основе онтологий. использования электронного математического Ключевой идеей является разработка контента в рамках различных проектов создания специализированных онтологий в области математических электронных библиотек. Например, математики, которые составят основу в настоящее время одной из крупнейших специализированной цифровой экосистемы формальных математических библиотек является OntoMath, состоящей из совокупности онтологий, Mizar [1], которая представляет собой коллекцию инструментов текстовой аналитики и приложений Mizar-статей (документов, подготовленных на для управления математическими знаниями. формальном языке системы Mizar), содержащих определения, теоремы и доказательства [2, 3]. Выполненные исследования лежат в русле Следует также отметить важные результаты, идеологии проекта создания Всемирной цифровой связанные с формализацией уровня представлений математической библиотеки (World Digital математических статей. Для этих целей разработан Mathematical Library – WDML). Основное широкий спектр языков представления исходных назначение WDML – объединить в распределенной математических текстов – форматы LaTEX, STEX, системе взаимосвязанных хранилищ оцифрованные XML, специализированные формальные языки, а версии всего корпуса математической научной также программные средства конвертации языков литературы, включая как современные источники, (см., например, [4–6]). так и источники, ставшие историческими. Настоящая работа развивает названное направление Известны также результаты разработки исследований. В ней, в частности, представлена специализированных математических поисковых система сервисов автоматической обработки систем, например, (uni)quation [7], Springer LaTEX больших коллекций физико-математических Search [8], Wolfram Formula Search [9]. документов. Названные и многие другие реализованные 1 Введение математические проекты подготовили почву для реализации новой идеи – создания Всемирной В настоящее время благодаря широкому цифровой математической библиотеки (World Digital внедрению информационно-коммуникационных Mathematical Library – WDML; термин введен в 2006 технологий в научно-исследовательскую году на Генеральной ассамблее Международного деятельность при проведении новых исследований математического союза). стало возможным использование всего корпуса накопленных научных знаний. Последнее 2 Проект WDML предполагает создание комплекса технологий, обеспечивающих оптимальное управление Традиционные библиотеки хранят документы, связывая их библиографическими ссылками, и Труды XVIII Международной конференции помогают пользователю найти нужный документ на DAMDID/RCDL’2016 «Аналитика и управление основе его библиографического описания, ключевых данными в областях с интенсивным слов и выбранных тематических рубрик. По этой использованием данных», Ершово, 11-14 октября причине традиционные библиотеки обладают 2016 существенным ограничением – они не обеспечивают 44 пользователю непосредственного доступа к WDML, одной из важнейших задач является элементам математического знания, последний построение списков математических объектов в вынужден вручную искать в документах разных областях математики. интересующие его математические понятия и Переход к представлению внутренней структуры выявлять скрытые связи между ними. Появление математического знания создает новую парадигму электронных библиотек сделало работу с представления, в которой основные акценты документами более эффективной: они смещаются на выделение элементов (классов) и их предоставляют мгновенный доступ к документам и взаимосвязей, что позволяет создавать различные обеспечивают полнотекстовый поиск по ним. сетевые концептуальные структуры (например, граф Однако основной принцип работы электронной цитирования, граф математических концептов и др.). библиотеки по-прежнему опирается на хранение и Выделение классов математических объектов и поиск документов. Чтобы преодолеть указанное организация соответствующих репозиториев ограничение, проект WDML предлагает новую позволят создать новые вычислительные систему организации и хранения математического возможности по обработке данных, такие, как знания. В отличие от традиционных электронных извлечение и обработка формул, поиск близких математических библиотек, основными элементом результатов и т. п. этой системы являются не документы, а Семантический поиск позволит по введенному математические объекты (определения, аксиомы, описанию объекта или после выделения термина в теоремы, доказательства, уравнения и т. д.), а также статье получить дополнительную информацию логические связи между ними. Информация в (определение, свойства, связи с другими объектами, WDML должна храниться в формализованном и список документов, в которых встречается объект, понятном компьютеру виде, сформированном на указание публикации, где он впервые введен). С основе технологий Семантического Веба. Такой помощью такого поиска, например, можно найти все способ управления математическими знаниями теоремы, в доказательстве которых, прямо или позволит создать инструменты для работы косвенно, используется пятый постулат Евклида. непосредственно с объектами математического Важно отметить, что в различных документах объект знания (средства агрегации, семантического поиска, может обозначаться различными терминами. поиска по формулам и идентификации тождественных объектов) [10–13]. Инструменты агрегации позволят автоматически собирать объекты, удовлетворяющие заданному В глобальной инициативе WDML можно критерию и формировать на их основе выделить ряд важнейших направлений, связанных автоматически пополняемые списки, например, как с организационными усилиями мирового список объектов из заданной предметной области математического сообщества, в том числе издателей или список теорем, касающихся заданного математической литературы, так и математического объекта. Эти списки помогут исследовательских и технологических направлений, математикам быть в курсе последних достижений, не нацеленных на разработку и внедрение новых тратя время на мониторинг всей литературы и не (семантических) технологий представления и решая повторно уже решенную задачу. обработки математического контента. К числу последних можно отнести: C помощью инструмента поиска по формулам пользователь сможет выделить формулу и получить  агрегирование различных онтологий, о ней дополнительную информацию (название, индексов, других ресурсов, созданных список литературы и т. д.) или ввести уравнение и математическим сообществом, и получить список статей, в которых оно исследуется. обеспечение широкого доступа к ним для При этом формулы в просматриваемых документах пополнения и редактирования; могут иметь различное символьное представление.  расширение возможностей доступа к Инструменты идентификации предназначены для математическим публикациям – не только выявления тождественных объектов, которые поиск и просмотр, но и аннотирование, упоминаются под разными именами и с навигация, связывание с другими использованием различной нотации. источниками, организация вычислений, визуализация данных и т. п. Таким образом, основное назначение WDML – объединить в распределенной системе Одной из ключевых идей является разработка взаимосвязанных хранилищ оцифрованные версии классов объектов для адекватного описания и всего корпуса математической научной литературы, исследования математического содержания включая как современные источники, так и (контента). Структурированность математического источники, ставшие историческими. документа позволяет выделить некоторый набор базовых классов математических объектов В базовых документах проекта подчеркнуто, что (последовательности, функции, преобразования, необходимо также обеспечить интеллектуальное тождества, символы, формулы, теоремы, извлечение информации для последующей передачи утверждения и др.). Как отмечается в проекте пользователю [12, 13]. В качестве примера назван 45 сервис, позволяющий пользователю выделить федеральном университете (КФУ). Представители формулу, а затем обратиться к WDML для получения многих научных групп, задействованных в разъяснений и необходимых ссылок. реализации проекта WDML, приняли участие в симпозиуме, прошедшем в феврале 2016 года в Для задачи навигации по всему корпусу Филдсовском институте (г. Торонто) [18]. Доклад математических документов ожидаются новые представителей КФУ на этом симпозиуме был решения, обеспечивающие просмотр и получения посвящен модельным и программным решениям в дополнительной информации об интересующих области семантического представления объектах: разработка улучшенных механизмов математического знания [19]. Эти результаты в ранжирования документов, в том числе по запросам большой степени коррелируют с общей идеологией пользователя; поиск документа, в котором впервые проекта WDML в части семантического упоминается определенный математический представления и обработки математических знаний и результат, оперативный доступ к справочным являются стратегическим направлением ресурсам по теме запроса и т. п. исследований Казанской группы, связанным, в В целом разработчики проекта WDML полагают, частности, с построением экосистемы OntoMath, что следующий шаг в развитии и продвижении которая описана ниже. математики состоит в выходе за пределы традиционных математических публикаций и Отметим, что уровни представления построении сети информации, основанной на математического знания, соответствующие форматы знаниях, содержащихся в этих публикациях. представления и применяемые семантические Одновременно все более востребованными у модели могут быть описаны, как показано на рис. 1. ученых становятся новые способы обнаружения объектов научного знания непосредственно через Веб, а также инструменты и сервисы, обеспечивающие создание и совместное использование новых видов структур знаний. В контексте концепции связанных данных (Linked Data) и Семантического Веба такие инструменты и сервисы можно использовать для создания «графов сотрудничества» (сollaboration graph), которые полезны, например, для вычисления «расстояния сотрудничества» (collaboration distance) между авторами и выделения «близких» документов, что Рисунок 1 Уровни представления математического открывает новые возможности тонкой настройки контента [19] поиска и просмотра (см., например, [14]). Многими авторами (например, [15–17]) подчеркивается важность разработки новых онтологий предметных 3 Экосистема OntoMath областей, в частности, математики, поскольку OntoMath (http://ontomathpro.org/) – это цифровая традиционной библиографической каталогизации экосистема онтологий, инструментов текстовой сегодня уже недостаточно – требуется более аналитики и приложений, предназначенная для глубокая детализация, содержащая описания, управления математическими знаниями. В ее состав созданные с учетом разных точек зрения. на текущий момент входят: Основные задачи построения WDML и технологии, необходимые для их решения,  онтология логической̆ структуры обсуждены в 2014–2015 гг. широким кругом математических документов Mocassin; математиков и закреплены в ряде документов,  онтологии профессиональной математики принятых Всемирным математическим союзом. В OntoMathPRO; частности, одобрено, что следующим шагом в развитии проекта WDML будут выход за пределы  программная платформа для подготовки традиционных математических публикаций и математического набора связанных данных построение сети информации, основанной на для публикации в облаке Linked Open Data знаниях, содержащихся в этих публикациях. (LOD); Благодаря сочетанию методов машинного обучения и усилий редакций и редколлегий математических  сервис семантического поиска по научных журналов, значительная часть информации математическим формулам. и знаний (как связанных открытых данных) в Кратко опишем указанные основные элементы. глобальном математическом корпусе знаний станет доступной для исследователей через WDML. К Семантическое аннотирование математических реализации названных идей приглашен ряд научно- текстов базируется на онтологии, построенной в исследовательских групп по всему миру, в том числе рамках проекта Mocassin [20], и онтологии наша группа в Казанском (Приволжском) профессиональной математики OntoMathPRO [21]. 46 При разработке последней использовались знания, которая организована в виде двух иерархий различные терминологические источники: (см. рис. 3): классические книги, интернет-ресурсы (Wikipedia, журнала «Известия вузов. Математика», а также  иерархии областей математики: личный опыт работы профессиональных математическая логика, теория множеств, математиков Казанского университета. алгебра, геометрия, топология и т. д.;  иерархии математических объектов: Онтология Mocassin – это онтология логической̆ множество, функция, интеграл, структуры математических документов. Она элементарное событие, многочлен Лагранжа разработана В.Д. Соловьевым и Н.Г. Жильцовым и и т. д.). предназначена для автоматического анализа OntoMathPRO разработана на языках OWL- математических публикаций в формате LaTEX [22]. DL/RDFS и содержит 3450 классов, 6 типов свойств Эта онтология описывает семантику структурных объектов, 3630 экземпляров свойства IS-A и 1140 элементов математических документов (например, экземпляров остальных свойств. Она содержит пять теоремы, леммы, доказательства, определения и т. д.) типов отношений: Класс → Подкласс, Определяется и связей между ними. Она разработана с с помощью, Ассоциативная связь, Задача → Метод использованием языков OWL2/RDFS [23], которые решения и Область математики → обеспечили ей выразительные возможности, а также Математический̆ объект. Концепты онтологии теоретические и практические средства вывода, содержат их название на русском и английском например, с использованием таких современных языках, определение, ссылки на внешние ресурсы из машин вывода, как Pellet [24] и FaCT++ [25]. облака Linked Open Data и связи с другими Онтология Mocassin содержит типовые концепты и концептами Объектами семантического отношения, эффективно извлекаемые из текстов аннотирования также являются формулы, связанные автоматическими методами [26] (см. рис. 2). Она с формулами фрагменты текста, задающие описания включает следующие концепты: DocumentSegment переменных формул [17, 27, 28]. (Сегмент документа), Axiom (Аксиома), Claim (Утверждение), Conjecture (Гипотеза), Corollary (Следствие), Definition (Определение), Equation (Формула), Example (Пример) и др. Математический документ в этой модели рассматривается как набор связанных сегментов, которые являются частью документа, имеют начальную и конечную позиции в тексте, а также характеризуются конкретной функциональной ролью. Онтология структуры научных публикаций по математике описывает семантику сегментов и такие возможные отношения между ними, как dependsOn (зависит от), exemplifies (является примером для), hasConsequence (имеет следствие), hasSegment (содержит как сегмент), Рисунок 3 Фрагмент онтологии OntoMathPRO Одним из важных приложений, разработанным на основе указанных выше онтологических моделей, является специальная программная платформа для подготовки математического набора связанных данных для публикации в облаке LOD. Подготовка математического набора связанных данных выполняется на основе разработанных программных инструментов, реализующих комплексный технологический процесс подготовки RDF-набора данных [29]. В качестве экспериментальной коллекции использовались статьи журнала «Известия вузов. Математика» за 1997–2009 гг. Рисунок 2 Элементы онтологии Mocassin [22] Основными функциями разработанного Онтология профессиональной математики программного прототипа для публикации данных в OntoMathPRO – это онтология математического облаке LOD являются: 47  индексирование математических статей в заданное математическое понятие (например, формате LaTEX в виде LOD-совместимых формулы, содержащие обозначение угла или связь RDF-данных; давления и массы).  извлечение метаданных статьи в виде Этот сервис использует семантическое концептов онтологии AKT Ontology [30]; представление документа, построенное с помощью  извлечение логической структуры платформы семантической публикации, описанной документа с использованием онтологии выше. Названное представление отражает связи Mocassin; между элементами логической структуры  извлечение экземпляров математических документа, используемой терминологией, сущностей в виде концептов онтологии переменными и формулами. При этом пользователь OntoMathPRO и связывание с ресурсами может ограничивать контекст поиска, например, DBPedia; искать только в текстах определений и  распознавание семантики формул через формулировках теорем. связывание полученных экземпляров Еще одним приложением экосистемы OntoMath математических сущностей с является рекомендательная система для коллекций математическими выражениями и физико-математических документов, которая для формулами в тексте; каждого из них строит список «близких» документов  установление взаимосвязи между (см. [31]). Традиционно список «близких» опубликованными RDF-данными и документов формируется на основе выбранной меры существующими наборами данных LOD. близости ключевых слов, приведенных авторами, а Разработанная технология имеет следующие также библиографических ссылок, имеющихся в отличительные особенности: документах. Этот подход имеет ряд недостатков:  математический RDF-набор строится на  список ключевых слов может быть основе коллекции математических статей на неполным или отсутствовать; русском языке;  проблема омонимии: одно и то же понятие  построенный RDF-набор помимо может обозначаться разными ключевыми метаданных статей включает специальные словами, например, «полином» и семантические знания: знания, «многочлен»; формируемые в результате специальной  не учитываются родовидовые отношения обработки математических формул – между понятиями, например, статья с семантического связывания текстовых ключевым словом «пятиугольник» не будет определений переменных формул с их определена как «близкая» к статье с символьными обозначениями; знания, ключевым словом «многоугольник»; связанные с идентификацией в тексте  существенна привязка к языку, например, экземпляров онтологии OntoMathPRO; статья с ключевым словом «матрица» не также знания о структурных элементах будет «близка» к статье с ключевым словом математической статьи. «matrix». Архитектура прототипа программной системы Таким образом, авторского списка ключевых слов включает 8 модулей, которые могут быть недостаточно, и необходим более глубокий анализ сгруппированы в следующие подсистемы: содержания документа. Одним из методов такого  преобразование формата; анализа является терминологическое аннотирование,  аннотирование текста; основанное на онтологиях предметных областей (например, [32]).  семантическое аннотирование; В разработанной рекомендательной системе  аннотирование метаданных; реализуется следующие основные этапы:  генерация RDF;  связывание.  на основе онтологии OntoMathPRO Подробное описание названных модулей дано в [29]. производится извлечение ключевых слов из Другим важным инструментом является документов коллекции; разработанный нами семантический поисковик по  каждая публикации представляются в виде математическим формулам [27]. Отметим, что вектора, компоненты которого известные сегодня сервисы поиска по формулам соответствуют концептам онтологии; (такие, как (uni)quation, Springer LaTEX Search,  значение компоненты – это вес Wikipedia Formula Search, Wolfram Formula Search) соответствующего понятия в данной статье являются синтаксическими и позволяют лишь найти (вычисляется с использованием количества формулы, содержащие заданные фрагменты его упоминаний в тексте статьи и количества (например, (a+b)2). В отличие от них семантический упоминаний связанных понятий) (см. [31]); поисковый сервис системы OntoMath решает задачу поиска формул по именам ее символьных  в качестве меры близости между переменных, в частности, выполняет поиск публикациями используется косинусная формулы, содержащей переменную, обозначающую мера близости между их векторами. 48 Заключение http://www.nap.edu/catalog/18619/developing-a- 21st-century-global-library-for-mathematics- Описаны основные идеи, подходы и полученные research. результаты по разработке технологий управления [13] P. J. Olver. The World Digital Mathematics Library: математическими знаниями на основе report of a panel discussion. Proceedings of the специализированных онтологий в области International Congress of Mathematicians, August математики. Эти решения составляют основу 13–21, 2014, Seoul, Korea. Kyung Moon SA, V. 1, специализированной цифровой экосистемы p. 773–785, 2014. OntoMath, которая состоит из совокупности [14] R. Todeschini, A. Baccini. Handbook of онтологий, инструментов текстовой аналитики и bibliometric indicators: quantitative tools for приложений для управления математическими studying and evaluating research. Wiley-VCH знаниями. Выполненные исследования лежат в русле Verlag, 2016. проекта создания Всемирной цифровой [15] S. Staab, R. Studer (Eds.). Handbook on ontologies. математической библиотеки World Digital Berlin, Heidelberg: Springer Verlag, 2003, 2009. Mathematical Library. 811 p. Благодарности [16] C. Lange. Ontologies and languages for representing mathematical knowledge on the Semantic Web. Работа выполнена при финансовой поддержке Semantic Web Journal, 2010. http://www.semantic- РФФИ (проекты №№ 15-07-08522, 15-47-02472). web-journal.net/content/ontologies-and-languages- representing-mathematical-knowledge-semantic- Литература web. [1] http://www.mizar.org/. [17] A. Elizarov, A. Kirillovich, E. Lipachev, [2] A. Naumowicz, A. Kornilowicz. A brief overview O. Nevzorova, V. Solovyev, N. Zhiltsov. of Mizar. In: S. Berghofer et al. (Eds.), TPHOLs Mathematical knowledge representation: semantic 2009, Lecture Notes in Computer Science 5674, models and formalisms. Lobachevskii Journal of Springer-Verlag Berlin Heidelberg, p. 67–72, 2009. Mathematics, V. 35, No 4, p. 347–353, 2014. [3] G. Bancerek, C. Bylinski, A. Grabowski, A. Kor- [18] Semantic representation of mathematical knowledge nilowicz, R. Matuszewski, A. Naumowicz, K. Pak, workshop, 5 February 2016: https://www. J. Urban. Mizar: State-of-the-Art and Beyond. In M. fields.utoronto.ca/programs/scientific/15- Kerber et al. (Eds.), Intelligent Computer 16/semantic/. Mathematics, CICM 2015, Lecture Notes in [19] A. M. Elizarov, N. G. Zhiltsov, A. V. Kiril-lovich, Artificial Intelligence 9150, p. 261–279, 2015. E. K. Lipachev, O. A. Nevzorova, V. D. So-lovyev. [4] M. Kohlhase. Using LaTeX as a Semantic markup The OntoMath ecosystem: ontologies and format. Mathematics in Computer Science (2:2); applications for math knowledge management. p. 279–304, Birkhäuser 2008. Semantic Representation of Mathematical [5] H. Stamerjohanns, D. Ginev, C. David, D. Misev, Knowledge Workshop 5 February 2016. V. Zamdzhiev, M. Kohlhase. Conversion d'articles http://www.fields.utoronto.ca/video- en LaTeX vers XML avec MathML: une étude archive/2016/02/ 2053–14698. comparative. Cahiers GUTenberg, 51; p. 7–28, [20] Mathematical Semantic Search engINe 2010, http://cahiers.gutenberg.eu.org/cg-bin/article/ (MocaSSIN). https://code.google.com/archive/p CG_2008_51_7_0.pdf. /mocassin/. [6] M. Iancu, M. Kohlhase, F. Rabe, J. Urban. The [21] OntoMathPRO: A Hub for Math Linking Open Data Mizar Mathematical Library in OMDoc: Translation (LOD). https://github.com/CLLKazan/ and Applications; Journal of Automated Reasoning, OntoMathPro. 50:2; p. 191–202, Springer Verlag 2013. [22] V. Solovyev, N. Zhiltsov. Logical structure analysis [7] Сайт (uni)quationalpha math expression search of scientific publications in mathematics. In: engine. http://uniquation.com/en/. Proceedings of the Int. Conf. on Web Intelligence, [8] Сайт LaTeX Search Beta. http://latexsearch. com/. Mining and Semantics (WIMS'11). ACM, p. 21:1– [9] The Wolfram Functions Site. http://functions. 21:9, 2011. wolfram.com/. http://citeseerx.ist.psu.edu/viewdoc/download?doi [10] Digital Mathematics Library: a vision for the future. =10.1.1.473.9071&rep=rep1&type=pdf. International Mathematical Union, 2006. [23] OWL 2 Web Ontology Language. RDF-Based http://www.mathunion.org/fileadmin/IMU/Report/d Semantics (Second Edition). W3C ml_vision.pdf. Recommendation 11 December 2012. [11] P. J. Olver. What’s happening with the World https://www.w3.org/2012/pdf/REC-owl2-rdf- Digital Mathematics Library? based-semantics-20121211.pdf. http://www.math.umn. edu/~olver/t_/wdmlb.pdf. [24] Pellet: An Open Source OWL DL reasoner for Java. [12] Developing a 21st century global library for http://clarkparsia.com/pellet. mathematics research. Washington, D.C.: The [25] FaCT++. http://owl.man.ac.uk/ factplusplus/. National Academies Press, 2014. 131 p. [26] О. А. Невзорова, Е. В. Биряльцев, arxiv.org/pdf/1404.1905; Н. Г. Жильцов. Коллекции математических 49 текстов: аннотирование и применение в Терминологическое аннотирование и поисковых задачах. Искусственный интеллект и рекомендательный сервис в системе управления принятие решений, № 3, с. 51–62, 2012. физико-математическим контентом. Труды XVII [27] O. Nevzorova, N. Zhiltsov, A. Kirillovich, Межд. конф. DAMDID/RCDL’2015 «Аналитика E. Lipachev. OntoMathPro ontology: a linked data и управление данными в областях с hub for mathematics. Communications in Computer интенсивным использованием данных». and Information Science, V. 468, p. 105–119, 2014. Обнинск: ИАТЭ НИЯУ МИФИ, с. 347–350, [28] А. М. Елизаров, Е. К. Липачёв, О. А. Невзо-рова, 2015. В. Д. Соловьев. Методы и средства семантического структурирования электронных Mathematical knowledge management: математических документов. Докл. РАН, Т. 457 ontological models and digital technology (6), с. 642–645, 2014. Alexander M. Elizarov, Alexander V. Kirilovich, Evgeny [29] O. Nevzorova, N. Zhiltsov, D. Zaikin, O. Zhib-rik, K. Lipachev, Olga A. Nevzorova A. Kirillovich, V. Nevzorov, E. Birialtsev. Bringing This paper is discussed basic ideas, approaches and Math to LOD: a semantic publishing platform proto- the results obtained in the research project the objective type for scientific collections in mathematics. 12th of which is to develop mathematical knowledge Int. Semantic Web Conference, Sydney, NSW, management technologies based on ontologies. We are Australia, October 21–25, 2013, Proceedings, Part I. developing the digital ecosystem OntoMath for Lecture Notes in Computer Science, Vol. 8218. mathematical knowledge management, which includes a Springer Berlin Heidelberg, p. 379–394, 2013. set of specialized ontologies, text analytics tools and [30] AKT Ontology. http://dream.inf.ed.ac.uk applications for managing mathematical knowledge. The /projects/dor/akt/akt.html. results obtained are close to main problems declared in [31] А. М. Елизаров, А. Б. Жижченко, Н. Г. Жильцов, the World Digital Math Library (WDML) project. The А. В. Кириллович, Е. К. Липачёв. Онтологии main purpose of WDML is to build a global system of математического знания и рекомендательная linked repositories for saving all digital mathematical система для коллекций физико-математических documents, including contemporary and historic sources. документов. Докл. РАН, Т. 467, № 4, с. 392–395, This paper is devoted to decisions of some problems in 2016. this global initiative. In particular, we developed the [32] А. М. Елизаров, Н. Г. Жильцов, program services for processing large collections of А. В. Кириллович, Е. К. Липачёв. mathematical papers. 50