=Paper=
{{Paper
|id=None
|storemode=property
|title=Электронная коллекция биографических фактов
(Digital Collection of Biographic Facts)
|pdfUrl=https://ceur-ws.org/Vol-934/paper36.pdf
|volume=Vol-934
|dblpUrl=https://dblp.org/rec/conf/rcdl/Markova12
}}
==Электронная коллекция биографических фактов
(Digital Collection of Biographic Facts)
==
Электронная коллекция биографических фактов © Н.А.Маркова Институт проблем Информатики РАН, Москва nMarkova@ipiran.ru первых, данные, характеризующие одних лиц, Аннотация неприменимы к другим (или неизвестны для них). Во-вторых, названия тех или иных характеристик не Предложен объектно-ориентированный только изменяются во времени, но и одновременно метод формализации представления биогра- существуют в разных вариантах. Это относится к фических данных, на основе которого именам лиц, наименованиям организаций и построена модель хранения коллекции географических объектов. Наконец, как это фактов. Метод учитывает динамику измене- ния атрибутов объектов и отношений между формулировал историк Л.Н.Гумилев в своих публичных лекциях: «источники все врут». Иначе, ними, рассчитан на работу с гетерогенными источниками, искаженными данными. наличие дефектов в биографических данных, Обсуждены перспективы реализации черпаемых из источников, скорее правило, чем поддерживающего инструментария. исключение. Представим метод формализации биографии- 1 Введение ческих данных, учитывающий перечисленные особенности. Определим основные проектные Биографические исследования – будь то решения инструментария, автоматизирующего изучение биографии выдающегося деятеля или процессы ввода, хранения, организации доступа и группы лиц определенного круга; изыскания, анализа биографических данных. Реализуемый в проводимые в рамках изучения истории науки или настоящее время прототип такого инструментария краеведческие работы – обладают рядом общих рассчитан на работу индивидуального задач. Необходимо собрать и обобщить исследователя. биографические факты, под которым понимается «высказывание…, являющееся ответом на вопросы 2 Формализация представления типа кто?, что?, когда?» [1] упорядочить их определенным образом, связать между собой и с биографических данных объектами исторической реальности. Основой формализации является всем знакомая Материал, собираемый в рамках биографи- анкета. Неанкетную – повествовательную часть ческого исследования, а также результаты его биографии можно было бы существенно сократить, анализа нужно как-то сохранять. Такое хранение, если бы относительно лиц, организаций, как правило, ведется бессистемно – в виде выписок географических мест, связанных с основным лицом, на листках бумаги или в текстовых файлах. В то же тоже были бы составлены свои, пусть время, существенная часть изучаемых данных фрагментарные, анкеты, на которые можно было бы формализуема: они имеют хронологическую ссылаться. привязку, отражают достаточно определенные Подавляющее большинство характеристик, социологические представления о характеристиках фиксируемых в анкете, изменяются во времени. и связях изучаемых лиц. Все это может служить Местопребывание, род деятельности, семейное основой для систематизации хранения, и, в положение, а, возможно, и фамилия многократно конечном счете, создания методики и инструмента- меняются на протяжении жизни. То есть, для рия, обеспечивающего автоматизацию процессов полноты картины там, где в обычной анкете мы ввода, анализа, обобщения данных. ставим текущее или интегрированное значение, Три особенности биографической информации следует иметь таблицу, в которой изменяемые затрудняют построение их формальной модели. Во- значения соотнесены со временем. Существование (как минимум – значимость) Труды 14-й Всероссийской научной конференции характеристик и их возможные значения зависят от «Электронные библиотеки: перспективные методы и конкретно-исторической ситуации, следовательно, технологии, электронные коллекции» — RCDL-2012, как набор «граф» анкеты, так и списки допустимых Переславль-Залесский, Россия, 15-18 октября 2012 г. значений должны быть гибко настраиваемы. 232 Суммируя вышесказанное, определим также определяются спецификой исследований. Для формальное представление биографических данных связей лиц важнейшим классом является «Родство» как объектную модель, в которой объекты – люди и со значениями («метками»): «Родитель», «Супруг» и связанные с ними сущности – характеризуются т.п. Отношение между лицом и социальным атрибутами и связями. Причем, как объекты, так и объектом характеризуется классом «Позиция», под атрибуты и связи хронологически определены которым, в частном случае, понимается должность в (частный вид хронологической определенности – учреждении. По отношению к учебному заведению «датировка неизвестна»). Типы атрибутов и связей, лицо может выступать как «Преподаватель», «Уче- а также их значения не закреплены, а определяются ник»; по отношению к клинике – «Пациент»; по соответствующими «метками» на графе. отношению к научному обществу – «Член- Биографическая информация далеко не корреспондент». исчерпывается формализуемой частью. Но и Необходимо допустить многозначность атрибу- относительно данных, не подлежащих формали- тов и отношений, а также их взаимную зависимость. зации, необходимо сохранять вполне определенную, Например, один объект может обладать двумя идентифицирующую их информацию: источник, разными атрибутами «Имя» с пересекающимися хронологические и географические рамки, датировками: «Покрова Пресвятой Богородицы, что сопряженные объекты. на Рву» и «Василия Блаженного». Не менее важно Определим основные составляющие формаль- иметь возможность анализировать случайные и ной модели биографических данных. намеренные искажения биографических данных, содержащихся в разных источниках. Так отечест- 2.1 Объекты, атрибуты, отношения венные документы учета в 18-м – начале 20-го веках фиксировали не год рождения, а возраст. При Целевым объектом биографического сопоставлении данных одного и того же лица за исследования является человек или группа людей, разные годы выявляются существенные расхожде- принадлежащих к определенному кругу, ния. Часть из которых носит намеренный характер. информация о которых сохранилась в источниках. Социальные статусы (в частности, возможность Изучаемое лицо связано с какими-то людьми, поступить в учебное заведение или занять организациями, обществами, а также географии- должность) имели возрастные цензы, что служило ческими и материальными объектами. В круг причиной «поправления» возраста в нужную рассмотрения биографа включены документальные сторону. объекты – источники данных, а также документы, по отношению к которым изучаемое лицо является 2.2 Представление биографических фактов автором или адресатом. Обобщенная трактовка понятия «объект» позволяет применить ее и для Представим сведения об объекте формально, в таких категорий, как событие (например, «Великая виде совокупности фактов, фиксирующих модель отечественная война», в которой персонаж участ- изучаемого мира (конкретно-исторической вовал) или концепция (по отношению к которой ситуации) в терминах объект-атрибут-отношение. персонаж автор или приверженец). По ходу работы исследователь пополняет коллекцию фактов, как за счет интерпретации В конкретных исследованиях могут быть источников, так и в результате анализа – обобщения востребованы те или иные классы рассматриваемых ранее накопленных данных. Определим основные объектов, под которыми будем понимать: виды фактов. Лица (индивидуумы, персоны, личности); Дефиниция объекта - утверждение о существо- Социальные объекты (семьи, организации, вании объекта некоторого класса в определен- общества, группы); ный промежуток времени. Географические объекты (места); Документальные объекты (документы, их Атрибут объекта - оценка значения атрибута совокупности и фрагменты); объекта в определенный промежуток времени. Материальные объекты (природные, Отношение объектов - констатация наличия технические, художественные); определенного отношения между двумя объек- События (явления, процессы, активность, тами в определенный промежуток времени и, деятельность); возможно, оценка его значения (метка на ребре Концепции (абстрактные понятия, идеи, области графа). знания, дисциплины, методы, технологии). Связь фактов - высказывание, сопоставляющее Каждому объекту сопоставляется датировка – факты логически, хронологически и т.п. время жизни, существования. Датировка необходи- Дефиниция объекта является точкой привязки ма также и для атрибутов объекта и для отношений остальных фактов. Атрибут связан с одним между объектами. В такое-то время Иванов служил объектом, отношение – с двумя (Рис. 1). Связь на Почтамте, тогда-то был женат на Петровой, фактов соотносит любую пару в терминах «рань- тогда-то болел чахоткой. ше/позже» или «следует/противоречит» и т.п. Классы атрибутов и отношений зависят от классов определяемых (связываемых) объектов и 233 исследования целесообразно фиксировать и то, что эти данные пока неизвестны. Прежде всего, речь идет об отсутствии данных и необходимости их выявления, то есть, о формировании исследователь- ского вопроса. Могут быть известны некоторые ограничения, тогда речь идет об уточнении. Наконец, при расхождениях в данных различных источников – что типично – ставится вопрос о Рис. 1 Виды фактов выявлении корректного значения. Например, воз- Определим информационное содержание фактов, – раст Василия в «Исповедных ведомостях» 1743 года точнее, их записей в цифровой среде – в обобщен- был – 1 год, в документе 1746 года ему 9 лет. ном виде. Аппарат фактов может быть также использован для Представление факта помечается идентифика- формулировки гипотез. тором, для того, чтобы на него можно было бы В работе [3] был предложен способ представле- сослаться. Для каждого факта фиксируется класс ния формализуемых биографических данных в виде (соответственно, объекта, атрибута, отношения). логических формул, в которых помимо равенства Дополнительно, возможно, определяется некоторое для значений характеристик объектов применяются уточняющее значение. также неравенство, принадлежность подмножест- Дефиниция для удобства использования вам, а для упорядоченных значений еще и содержит (основное) имя объекта. Отдельные больше/меньше. компоненты имени (для лица в отечественной При определении связей между фактами традиции – личное имя, отчество, фамилия) применяются категории «раньше/позже», «причи- представимы и в виде отдельных атрибутов, без на/следствие». Наконец факт, как логическое чего не обойтись, в случае изменчивости имен на утверждение, подлежит оценке, которая может протяжении жизни лица. иметь как точную (ИСТИНА/ЛОЖЬ), так и Взаимная зависимость, содержательная избыточ- промежуточную оценку правдоподобия в виде числа ность сохраняемого набора фактов – важнейшая, в диапазоне от 0 (ЛОЖЬ) до 1 (ИСТИНА). практически значимая для биографических иссле- Представление биографических фактов в дований черта. В случае с именами это особенно предложенном виде позволит интегрировать актуально. Один и тот же населенный пункт может данные, получаемые из разных источников, многократно менять название или (что соответ- проверять непротиворечивость, интерполировать, ствует отечественной практике) иметь одновремен- корректно ставить новые исследовательские но разные варианты наименований. вопросы. Представление факта должно содержать его датировку – период времени, в течение которого 2.4. Другие модели представления представленное фактом утверждение справедливо. В биографических данных работе [2] была предложена универсальная форма Готовых концептуальных моделей, в полном представления датировки, в которой учтены все объеме отражающих специфику биографических возможные сочетания хронологических сведений: исследований, учитывающих темпоральные зависи- точно определенный диапазон дат или оценки мости, наличие искажений, разнородность источни- верхних/нижних границ начала/конца периода. ков, вариативность названий – все «неудобные» для Факты определяются на основании интерпрета- реализации особенности исторических изысканий, ции источников или выводятся путем умозаклю- найти не удалось. чения из других фактов. В любом случае, сохраняя В наиболее близкой к рассматриваемой пробле- факт, необходимо сохранить и ссылку на его проис- матике отрасли исторической информатики – про- хождение - отражающий объект, в качестве кото- сопографических базах данных – задачи построения рого могут выступать: обобщенной объектной модели, судя по публи- Источник документ, вещественный объект, кациям, не ставятся. Реализации рассчитаны на кон- лицо-информатор; кретный вид исследований и/или на конкретный Интерпретатор – конечный исследователь («я») круг источников. или предшествующее исследование, через Стандартом де-факто для представления документ–публикацию, что позволит просле- биографической информации при обмене данными дить цепочку выводов от первоисточников; между генеалогическими программами является Автомат, выводящий факт из других фактов и давно устаревшая модель Genealogical Data правил вывода. Communications (GEDCOM). Усовершенствованный вариант GEDCOM 6.0, основанный на xml, [4] был 2.3 Логика биографических фактов выпущен в 2002 году, но до сих пор, фактически, никем не используется. Конкурентом GEDCOM, Помимо точных характеристик, как значений тоже определяемым, как спецификация формата атрибутов и отношений, так и их датировки, в ходе обмена, является стандарт GenXML[5]. Помимо 234 более строгой, структурной упорядоченности, он несет в себе несколько принципиально новых положений, отражающих практику биографических исследований. В частности, в нем явным образом определяется процесс исследования: введены понятия «свидетельство» и «заключение». Но главное, GenXML открыт для добавления новых типов атрибутов и событий. К сожалению, ни в GEDCOM, ни в GenXML не отражены важнейшие Рис. 2 Архитектура биографического инструментария свойства биографической информации: временная изменчивость и взаимная зависимость характерис- использовать предложенные решения по форму- тик. лировке биографических фактов. Ограничимся сфе- Важным шагом в сторону эффективного рой деятельности индивидуального исследователя, представления биографических сведений является то есть на текущем этапе не будем рассматривать стандарт «Функциональных требований к проблемы взаимодействия в группе пользователей, а авторитетным данным» – FRAD [6]. Сопоставим также вопросы работы с крупномасштабными FRAD с предлагаемой в данной работе моделью. хранилищами данных. (Учтем терминологические расхождения: во FRAD Центральный компонент инструментария – под «объектами» понимаются абстрактные катего- хранилище – содержит коллекцию фактов, к рии, которые в настоящей работе названы «классами которым помимо собственно исторических сведений объектов»; соответственно, «пример объекта» FRAD отнесем данные о происхождении этих сведений – соответствует «объекту» в нашем рассмотрении). библиографическую и археографическую инфор- В целом, модели весьма схожи. На уровне мацию. Информация о существовании некоторого концепции сущность-атрибут-отношение значимым документа, времени его создания, авторства, места различием является то, что для FRAD «имя» - это хранения – по сути, и является набором истории- объект, в нашем рассмотрении имя – это атрибут. ческих фактов, и, как мы уже констатировали, Авторы FRAD справедливо замечают, что нечто документ – это один из классов исследуемых интерпретируется как атрибут или объект в объектов. зависимости от использования. А для систем Коллекция фактов, в которую оперативно каталогизации, на которые, в основном, рассчитаны интегрируются данные из различных источников, FRAD, традиционно центральной сущностью представляет единый ресурс биографического является «имя». В биографической модели исследования - «виртуальный метаисточник» по целесообразно рассматривать имя, как один из терминологии специалистов в области исторической атрибутов, многозначный и изменяемый во времени. информатики [7]. Что покрывает множество вводимых FRAD понятий («псевдонимы», «духовные», «светские» имена, Специфика биографического исследования, связь прежнее/ более позднее имя и др.). Кроме особенно, если изучаются лица из прошлого, того, учет вариативности компонентов имени документов о которых сохранилось немного, (личного имени, отчества) целесообразно состоит в том, что невозможно заранее отсечь предусматривать для всех возможных их «ненужную» информацию. Изучая некоторый использований, а не только для конкретного имени источник, например, список выпускников учебного конкретного лица. заведения, и найдя интересующее нас лицо, целесообразно сохранять не только факт его Принципиальным преимуществом предлагаемой обучения там-то в такие-то годы, но и сведения о биографической модели перед FRAD для задач его однокашниках. Впоследствии из «их» доку- исторических реконструкций является ее ментов, вполне вероятно, можно будет почерпнуть «историзм»: всем объектам, атрибутам, связям данные, если не непосредственно об изучаемом сопоставлены хронологические рамки. Другая лице, то об окружающей его среде. Коллекция важная черта биографической модели, чрезвычайно фактов – это ресурс, независящий ни от конкретных существенная для представления данных в процессе источников, ни от текущих исследовательских исследования (а не конечных результатов, как задач. Его содержание – все возможные FRAD) – это возможность отражения оценки характеристики объектов исследования и их правдоподобия сведений, их логической связности, окружения, сохраняемые, возможно, «про запас», в наличия противоречий - логики биографических расчете на будущие исследовательские вопросы. фактов. В то же время, ввод данных, по возможности, 3. Основные проектные решения должен соответствовать конкретному документу- источнику, а анализ целям конкретного исследо- Рассмотрим архитектуру инструментария, вания. В первом случае необходимо опираться на поддерживающего процессы сбора, хранения и источнико-ориентированную, во втором на про- анализа биографических данных (Рисунок 2). В блемно-ориентированную информационную модель. качестве модели представления данных будем Вопрос о приоритете того или иного подхода 235 является одним из основных направлений дискуссий в исторической информатике [8]. Опора на предло- женную объектно-ориентированную формальную модель позволяет разрешить противоречия между подходами. Трансформация представлений между моделями, при условии, что центральной является объектно-ориентированная, – несложная техничес- кая задача, решение которой позволит реализовать максимальную наглядность данных на разных этапах работы исследователя. При вводе пользова- тель будет видеть визуальный аналог изучаемого источника, при анализе фактов – структурные формы (таблицы, схемы), в которых вычленяются изучаемые в конкретном исследовании аспекты. В качестве иллюстрации рассмотрим представление в Рис. 3 Концептуальная модель данных из «Исповедных ведомостей» терминах формальной модели биографических фактов данных, извлекаемых из типового привлечь автомат, например, для вычисления года источника. рождения по возрасту и дате фиксации. 4. Пример интерпретации данных 5. Нормали биографического источника исследования То, что предложенный формализм, столь Биографические факты взаимозависимы. В обобщенно обращающийся с объектами разного ограниченной хронологическими, географическими, рода, пригоден для представления содержания предметными рамками сфере конкретного исторического источника, покажем на примере исследования действует конкретный набор правил интерпретации одних из наиболее значимых регламентирующих эти зависимости. Такие правила источников формальных биографических сведений будем называть Нормалями. К нормалям отнесем России 18 - 19 веков – «Исповедных ведомостей». словари классов и возможных значений фактов, Ведомость представляла собой таблицу, ограничения на их сочетания, синонимию имен и заполняемую причтом конкретной церкви, их компонентов и т.п. Сведения о структуре и перечисляющую всех жителей прихода. Данные о правилах интерпретации источников, а также каждом лице соответствовали графам таблицы, и шаблоны выводных форм, используемых для включали: номер дома, пол, «звание», возраст и анализа накопленных фактов, являются нормалями. собственно «показание действа», то есть, Нормали представляют формулировки законов исповедовался ли, и если нет, то по какой причине. природы (например, ограничения на разницу между «Звание» включало имя (фамилию, личное имя возрастом родителей и ребенка), юридические отчество), сведения о роде занятий и статусе, а нормы, уставы организаций, обобщения ранее также о родственных отношениях с проживающими накопленных фактов. Типичной нормалью явля- вместе лицами. ется список должностей некоторого предприятия. Служебные отношения лиц с данным предприятием Представим данные из «Исповедной ведомости» определяются выбором из этого списка. Другой в терминах предлагаемой формальной модели пример нормали – список соответствий имя отца– (Рисунок 3). отчество. Нормаль – список личных имен-сино- Рассматриваемыми объектами являются: лица, нимов поможет идентифицировать лица при места (географические местности), приходская вариативности их имен. Например, личное имя церковь и сам документ – «Исповедная ведомость». «Иван» могло быть зафиксировано, как «Иоанн»; Кроме того могут быть указаны места службы «Акулина» – «Акилина»; «Ксения» – «Аксинья»; упоминаемых лиц или/и их социальные статусы. «Георгий» – «Егор», «Егорий», «Юрий». Для лиц указываются атрибуты – пол и возраст (на Так же, как и конкретные факты, нормали и их момент фиксации). Между лицами определены компоненты хронологически определены. Наличие родственные отношения. Кроме того фиксированы той или иной должности или звания ограничено отношения местопребывания с точностью до дома, конкретным временным промежутком. Например, входящего в некоторое географическое образование. «Табель о рангах» применялась с 1722 по 1917 гг., а Тонкие стрелки показывают связь фактов с входящий в нее чин «Сенатский регистратор» с 1764 объектом отражения. по 1834. Представленные таким образом сведения носят Сложностью правила, формулируемого нор- объектно-ориентированный характер и уже не малью, определяется возможная форма ее подклю- зависят от источника, что позволяет сопоставлять их чения к коллекции фактов. В простейшем случае с фактами, полученными из других источников, нормаль – это словарь значений. Его использование возможно, другого вида. При этом мы можем способствует автоматизации ввода данных. Вместо 236 набора текста исследователь выбирает значение из принципиальным – подошла бы любая реляционная списка допустимых в данном контексте значений. база, а обусловлено ее доступностью. План реализа- Более сложные правила, фиксируемые нормалями, ции предусматривает формирование унифициро- либо подлежат анализу/обработке с помощью ванных средств, поддерживающих функционирова- дополнительно вводимых программных модулей, ние ядра коллекции фактов, а также формирование либо представляют «памятки» для ручного контроля нормалей и пробные наполнения коллекции для исследователем. двух видов биографических исследований. Структура и правила интерпретации источника Первый вид – исследование биографии ученого, определенного вида – это и структурная организа- на основе изучения архивных документов и ция «родового» документального объекта (своего публикаций, касающихся как его самого, так и лиц и рода шаблон), и правила интерпретации данных организаций, с ним связанных. Второй вид исследо- конкретного источника. С точки зрения вводящего вания – просопографическое – объединение данных, данные исследователя было бы удобно, чтобы полученных из разнообразных документов отображение архивного источника выглядело церковно-приходского учета, в территориально- максимально «близко к тексту». Рационально ограниченной области для нескольких поколений заполнять форму с графами, соответствующими родственных семей. Во втором случае предстоит графам интерпретируемого документа. При этом разработать формы ввода для типовых видов там, где это возможно, автомат может учесть учетных документов. Оценка масштаба коллекции типовые последовательности ввода и словарные фактов для выбранных примеров исследований дает ограничения, существенно сократив время занесе- сотни лиц (если изучается биография ученого – его ния данных и повысив его надежность. коллеги, учителя, ученики, родня), и десятках тысяч В общей структуре инструментария биогра- фактов. фического исследования нормали занимают Пробная эксплуатация инструментария должна промежуточное положение между универсальной выявить проблемы и перспективы его дальнейшего формой представления коллекции фактов и ее развития. Вполне вероятно, что предложенный специализированным, предназначенным для реше- подход может быть востребован не только для ния конкретного комплекса исследовательских изучения биографий, но и для других конкретных задач наполнением. исторических дисциплин: истории отрасли, Повышение эффективности работы исследова- организации, общества, края, где фокусом внимания теля, достигаемое при использовании автоматизиро- будут не лица, а объекты другой природы. ванных средств отслеживания правил, фиксируемых нормалями, приходится сопоставлять с трудоем- Литература костью разработки этих средств. [1] В. Л. Валевский. Биографика как дисциплина гуманитарного цикла // Лица: биографический 6. Заключение альманах. - СПб. : Феникс, 1995. - Вып. 6. - Предложенную модель представления биографи- С.33-68. ческих данных отличают следующие черты: [2] Н. А. Маркова. Формализация представления рассматриваются не только лица, но и объекты биографических данных: рабочее поле биогра- иной природы вместе с их структурой и исто- фического исследования //Системы и средства рией; информатики, 2011, вып.21:2, С. 162–170. [3] Н. А. Маркова. Логика биографических помимо атрибутов объекта анализируются фактов //Информатика и её применения, 2012, характеристики отношений между объектами; Т. 6. Вып. 2. С. 49–58. все характеристики рассматриваются в дина- [4] GEDCOM XML Specification, Release 6.0. мике изменения их значений; http://xml.coverpages.org/Gedcom-XMLv60.pdf наличие характеристик, их возможные значения [5] GenXML 3.0 16.06.2010. и взаимозависимости определяются конкретно http://www.cosoft.org/genxml/GenXML30.pdf историческими знаниями – нормалями, кото- [6] Функциональные требования к авторитетным рые также изменяются во времени; данным. Концептуальная модель: рабочая для представления совокупности установлен- группа ИФЛА по разработке функциональных ных фактов, намеченных к рассмотрению требований к авторитетным записям и их вопросов, а также гипотез предложена единая нумерации (FRANAR): заключительный отчет, форма. декабрь 2008 / Междунар. Федерация библ. Представление биографических сведений в виде ассоц. и учреждений, Рос. библ. ассоц. ; под коллекции фактов открывает новые возможности ред. Г. Е. Паттона. - СПб. : Российская для эффективного хранения, поиска, анализа и национальная библиотека, 2011. - 115 с. интеграции данных. В настоящее время осущест- [7] Ю.Ю. Юмашева. Историография просопогра- вляется прототипная реализация соответствующего фии //Известия уральского государственного инструментария. В качестве среды хранения университета. - Екатеринбург : № 39.- 2005. - выбрана СУБД MS Access, что не является Гуманитарные науки. Вып. 10. С. 95-127. 237 [8] Проблемно-ориентированный и источнико- base for the model of a collection of facts repository. ориентированный подход – противоречие или The method takes into account the dynamics of change синтез. http://www.yartel.ru/old/stat/pdisscas.html attributes of objects and relationships between them. It is designed to operate with data (that may be faulty) Digital Collection of Biographic Facts obtained from heterogeneous sources. The article discusses prospects for the implementation of Natalia A. Markova supporting tools. This article suggests an object-oriented method for formalizing biographical data. The method serves as a 238