=Paper=
{{Paper
|id=None
|storemode=property
|title=Метаданные, их свойства, функции, классификация и средства представления
(Metadata, their Properties, Functions and Classifications)
|pdfUrl=https://ceur-ws.org/Vol-934/paper3.pdf
|volume=Vol-934
|dblpUrl=https://dblp.org/rec/conf/rcdl/Kogalovsky12
}}
==Метаданные, их свойства, функции, классификация и средства представления
(Metadata, their Properties, Functions and Classifications)
==
Метаданные, их свойства, функции, классификация и средства представления © М.Р. Когаловский Институт проблем рынка РАН Москва kogalov@cemi.rssi.ru Аннотация ность данных, обеспечивают более широкие воз- можности их использования. Важную роль в современных информацион- Метаданные начали использоваться задолго до ных системах играет особый вид информа- появления компьютерных систем и до введения ционных ресурсов, называемых метадан- этого термина в научно-техническую лексику. ными. Свойства метаданных, их состав и Библиографические описания использованных функции существенно зависят от техноло- источников в публикациях, библиотечные каталоги, гий реализации систем, в которых они различные классификаторы, аннотации статей – все используются, особенностей описываемых это примеры метаданных. В данной работе, однако, ими ресурсов, а также от области примене- нас будут интересовать метаданные, используемые в ния и конкретных приложений. Метадан- компьютерных системах. В этой сфере метаданные ным посвящено огромное количество пуб- начали использоваться уже на ранней стадии ее ликаций. Тем не менее, трактовка термина развития. Когда начали создаваться языки и техно- «метаданные» все еще не устоялась. логии программирования, термин «метаданные» Большинство работ посвящено обсуждению еще не существовал. Однако в исходном коде различных стандартов метаданных. При программы на языке программирования должно обсуждении частных видов метаданных было содержаться описание типов данных, нередко не делаются необходимые оговор- которыми эта программа оперирует. На их основе ки, и тем самым их свойства и функции компилятор обеспечивает требуемое для этих дан- неправомерно распространяются на общий ных распределение оперативной памяти, оценивает случай. Наряду с этим встречаются ошибоч- правомерность выполнения над ними предусмотрен- ные представления и исторические заблуж- ных в программе операций. Если программа дения. В данной работе анализируются оперирует данными во внешней памяти, то в ее распространенные трактовки термина исходном коде, а для некоторых операционных «метаданные», рассматриваются общие систем и в языках управления заданиями, должны свойства и функции метаданных, обсужда- описываться свойства файлов, в которых хранятся ются их классификации, а также вырази- эти данные. Указанные описания, несомненно, тельные средства их представления. являются примерами видов метаданных. Работа поддержана грантом РГНФ 11-02- Рождение технологий баз данных и информа- 12026-в ционно-поисковых систем также потребовало использования метаданных. При проектировании 1 Введение конкретной базы данных необходимо сформировать концептуальную схему предметной области, пред- Хранение и обработка данных в компьютерных ставляя ее средствами какого-либо языка концеп- системах, обмен данными между ними и доступ к туального моделирования. На ее основе нужно ним пользователей невозможны без явно представ- создать описание структуры базы данных, ограниче- ленных описаний свойств этих данных. Эти описа- ний целостности, полномочий пользователей и т.д. ния необходимы программным средствам, выпол- Для этой цели используется язык описания данных няющим указанные функции, а также пользователям СУБД, выбранной для реализации системы базы для формулировки запросов, анализа данных и данных. Указанное описание представляется в виде интерпретации их содержания. Описания такого схемы создаваемой базы данных, которая, также как рода называются метаданными и являются особым и концептуальная схема предметной области, явля- видом информационных ресурсов. Их создание ется метаданными. часто требует значительных усилий и существенных В ранних документальных информационно-поис- затрат. Однако они существенно повышают цен- ковых системах каждый документ представлялся его поисковым образом, который идентифицировал этот документ, характеризовал его содержание набором Труды 14-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и дескрипторов и заменял этот документ в процессах технологии, электронные коллекции» — RCDL-2012, обработки пользовательских запросов. Поисковый Переславль-Залесский, Россия, 15-18 октября 2012 г. образ исходного документа является его метадан- 3 ными. Метаданными текстовых публикаций в элект- данных (на «логическом» уровне) в форме набора ронных библиотечных каталогах служат также их системных таблиц базы данных, которыми можно библиографические описания и аннотации, рубрики оперировать с помощью обычных средств языка. В тематических классификаторов, к которым относит- результате базы данных SQL стали самоописывае- ся содержание данных публикаций, и другие их мыми — они содержат пользовательские данные характеристики. вместе с описывающими их метаданными. В 1960-1970 гг. были довольно широко Развитие информационных технологий и сферы распространены генераторы отчетов с разработан- их применения привело к существенному расшире- ным и впервые реализованным компанией IBM нию функций метаданных и их многообразия. входным языком PRG (Report Program Generator). Средства представления метаданных и управления Этот язык позволяет описывать формат генериру- ими созданы и развиваются как для информаци- емого отчета. Такие описания также, несомненно, онных, так и для других компьютерных систем. являются метаданными. Содержание метаданных, их функции и средства их Появление гипертекстовых технологий, а затем и представления зависят от используемых информа- Всемирной паутины, предусматривает использова- ционных технологий, функциональных возможнос- ние описаний гипертекстовой разметки исходного тей и предметной области использующих их систем, текста в гипертекстовых издательских системах и в природы описываемых ресурсов, контекста и харак- веб-страницах. Совокупность тегов разметки также тера их использования, а также от многих других представляет собой метаданные таких ресурсов. факторов. Создание систем, основанных на знаниях, и В последние два десятилетия метаданные стали Семантического Веба, позволило явным образом объектом для многих исследований, главным обра- представлять и использовать для поиска и логи- зом, в связи с развитием технологий Семанти- ческого вывода семантику данных, а также онто- ческого Веба, электронных библиотек и ряда других логию предметной области. Для их описания в новых пластов информационных технологий. Кроме последние годы активно используются, в частности, того, стала актуальной необходимость обеспечения язык RDF, языки описания онтологий RDFS, OWL и обмена метаданными между различными система- OWL2, а также профили языка OWL2. Такие описа- ми, обеспечения интероперабельности и повторного ния также являются примерами метаданных. использования информационных ресурсов. Все это В научных информационных системах необходи- вызвало активную деятельность по стандартизации мо описывать свойства используемых в них данных, метаданных, которой занимаются международные связанные с особенностью предметной области органы стандартизации, индустриальные консорци- исследований. Вместе с тем, могут быть необхо- умы, научные и другие сообщества (см., например димы описания характеристик научных приборов, с [2, 3, 8, 11, 12, 17, 24, 25, 28, 29, 31]). В результате помощью которых они получены, место и время были созданы многочисленные стандарты описания регистрации этих данных и т.п. метаданных горизонтальной и вертикальной сферы. Метаданные необходимы в современных элект- Активно используются на практике стандарты ронных библиотеках. Они описывают контент биб- платформы XML, Дублинское ядро, дескриптивное лиотеки в целом, составляющие его коллекции подмножество языка SQL, большое число схем информационных ресурсов, отдельные ресурсы, метаданных для различных областей применения, содержащиеся в коллекциях, их классификаторы, стандарты языков концептуального моделирования, организации, владеющие информационными ресур- многочисленные стандарты метаданных в науке — сами библиотеки, ее пользователей (их профили), геоданных, астрономических данных, а также науч- ряд других информационных объектов и сервисов ных данных в других областях исследований. таких систем. Использование термина «метаданные» сущест- Осознание необходимости метаданных привело к венно активизировалось в последние годы. Однако, созданию инструментария управления этим специ- к сожалению, не сложилось однозначное понимание фическим видом информационных ресурсов. Впер- этого термина. Широко распространенная абстракт- вые серьезное внимание проблемам управления ная формула «метаданные – это данные о данных» метаданными начало уделяться в 1970-е годы в не раскрывает многообразия свойств и функций это- контексте информационных систем, оперирующих го вида информационных ресурсов. Хотя метадан- структурированными данными. Была предложена ным в последние годы посвящено огромное коли- концепция системы словаря-справочника данных. чество публикаций, в них мало внимания уделяется Появился ряд систем такого рода [9, 28]. Несколько систематическому обсуждению их общих свойств и позднее была реализована концепция интегрирован- функций. Чаще всего обсуждаются проблемы, свя- ных словарей-справочников данных — систем занные с созданием систем метаданных для конк- управления базами данных, выполняющих ретных областей научных исследований, бизнеса и традиционные функции СУБД и одновременно других сфер деятельности, разработок электронных функции системы словаря-справочника данных. библиотек, разнообразных репозиториев цифровых Идея интеграции системы словаря-справочника информационных объектов, информационных сис- данных и СУБД, хотя и в ограниченной форме, тем для конкретных сфер применения. При этом во позднее нашла воплощение в стандарте языка SQL. многих работах, посвященных электронным биб- В нем предусмотрено представление схемы базы лиотекам или приложениям, основанным на стан- 4 дартах Семантического Веба, доминирует весьма Определение 1. Метаданные — это данные о ограниченный взгляд на функции метаданных. данных (см., например, [21, 26, 30, 37]). Метаданные рассматриваются в них лишь как сред- Определение 2. Метаданные — это информация, ство описания контента (содержания) информацион- которая делает данные полезными [21]. ных ресурсов, хотя это только одна из многих Определение 3. Метаданные — это машино-обра- возможных функций метаданных. батываемые данные, которые описывают некоторые Формирование адекватного и достаточно полно- ресурсы, цифровые и нецифровые [22]. го представления о независимых от конкретной Определение 4. Метаданными называется допус- области применения свойствах и функциях метадан- кающая компьютерную обработку и интерпретацию ных является, на наш взгляд, актуальной проблемой. человеком информация о цифровых и нецифровых В данной работе предлагается систематический объектах [31]. взгляд на метаданные как на информационный Определение 5. Метаданные — это структуриро- ресурс особого рода, анализируются распростра- ванные данные, которые описывают характеристики ненные трактовки этого термина, приводятся при- некоторого ресурса [39]. меры метаданных, используемых в различных видах Определение 6. Метаданными называется струк- компьютерных систем, рассматриваются общие турированная информация, которая описывает, поя- (независимые от сферы применения) свойства мета- сняет, указывает местоположение и иным образом данных и их функции, выразительные средства для облегчает поиск, использование информационного их представления, обсуждаются вопросы их обоб- ресурса, а также управление им [42]. щенной классификации. Определение 7. Метаданные — это структуриро- ванные данные, представляющие собой характери- 2 Определения термина «метаданные» стики описываемых сущностей для целей их иден- тификации, поиска, оценки, управления ими [38]. Как уже отмечалось, сосуществуют различные Определение 8. Метаданные — это описание не точки зрения на содержание термина только состава данных, их структуры (формата) «метаданные». В работе [14] отмечается, что неод- представления, места хранения и других их приз- нозначность в понимании смысла и функций мета- наков, но и поддерживающих их информационных данных связана с доминирующими в настоящее вре- систем, технологий, пользователей, методов доступа мя двумя подходами. Первый из них свойственен [1]. библиотечному сообществу. Он связан с созданием Определение 9. Во Всемирной паутине метадан- и использованием документальных ИПС, электрон- ные – это слабоструктурированные данные, как пра- ных каталогов библиотечных фондов, а в последние вило, соответствующие согласованным моделям, годы – с разработками репозиториев цифровых обеспечивающим операционную интероперабель- объектов, представляющими собой основную проб- ность в неоднородной среде [27]. лематику электронных библиотек. При этом предс- Определение 10. Метаданными называется любая тавители библиотечного сообщества имеют в виду, дескриптивная информация о других источниках главным образом, текстовые информационные данных, которая способствует организации, иденти- объекты. Истоки этого подхода авторы [14] видят в фикации, представлению, определению местополо- библиотечной науке (Library Science). В отличие от жения, обеспечению интероперабельности, управле- него, истоки второго подхода, по их мнению, нию и использованию этих данных [18]. относятся к «компьютерным наукам» (Computer Определение 11. Метаданные — это данные, от- Sciences). К этой сфере, относятся развивающиеся носящиеся к некоторому элементу данных, т.е. мета- уже около полувека технологии баз данных и другие данные – это данные о данных. Для элемента дан- области информатики, связанные с управлением ных спецификация, определяющая, каким образом данными и знаниями. он может создаваться, в каких контекстах он может Нужно заметить, что на достигнутой стадии использоваться, как его трансформировали или как развития электронных библиотек, технологии их он может интерпретироваться либо обрабатываться разработки широко используют самые разнооб- [26]. разные достижения «компьютерных наук», которые Определение 12. Метаданные обычно определя- далеко выходят за рамки предлагаемых «библио- ются как «данные о данных», которые предназна- течной наукой». Это в первую очередь связано с чены для выражения семантики информации, следо- расширением разнообразия видов информационных вательно, для улучшения ее поиска и выборки, по- ресурсов, составляющих контент современных нимания и использования [15]. электронных библиотек, и с расширением объема Определение 13. Метаданные — это данные из требований пользователей к функциональности этих более общей формальной системы, описывающей информационных систем. заданную систему данных [44]. Сосуществование двух указанных подходов, а Проанализируем кратко этот довольно также огромное многообразие видов метаданных и представительный набор определений. сфер их использования, в значительной мере опре- Определения 1 и 2 являются чрезмерно общими, деляют разнообразие имеющихся трактовок термина и не дают конструктивного представления о сущест- «метаданные». Приведем и обсудим некоторые ве метаданных. наиболее распространенные из них. 5 В определении 3 декларируется универсальный В определении 12 указывается еще одна важная характер (цифровой и нецифровой) информаци- функция метаданных – описание семантики инфор- онных ресурсов, которые могут описываться мета- мационных ресурсов, которое является основой для данными. Отмечается важное свойство метаданных реализации ряда существенных функций поддержи- - возможность их компьютерной обработки. Однако вающих их систем. при этом не указывается предназначение метадан- Наконец, важное свойство метаданных отмеча- ных – ориентированы ли они на поддержку систем- ется в весьма лаконичном определении 13. Описа- ных функций или на конечного пользователя. ние свойств данных и других ресурсов любой Напротив, в определении 4 явно указывается, что природы может осуществляться лишь в терминах метаданные могут описывать как цифровые, так и более абстрактной системы понятий. Так, в системе нецифровые информационные ресурсы, и должны базы данных описание хранимых данных осущест- быть воспринимаемыми человеком. вляется не в терминах значений этих данных, а в Определение 5 имеет такой же неконструктив- таких терминах, как хранимая запись, элемент ный характер, как и первые два, но его авторы данных, ключ записи, указатель, тип хранимой дополнительно отмечают, что метаданные предста- записи, ключ индексирования, область памяти, и вляют собой структурированные данные. Такая др., т.е. в системе терминов модели данных среды точка зрения высказывается во многих источниках. хранения базы данных. Однако метаданные могут быть не только структу- Завершая анализ приведенных определений рированными данными (см. разд. 4). термина «метаданные», можно констатировать, что В определениях 6 и 7 метаданные также тракту- они характеризуют разные точки зрения на ются как структурированные данные. Но эти метаданные, акцентируют отдельные их свойства определения более конструктивны по сравнению с и/или функции. Некоторые из них являются слиш- предыдущими, поскольку в них предлагается неко- ком абстрактными и в силу этого малопродук- торая конкретизация функций метаданных. тивными. Другие относятся к частному виду В определении 8 делается акцент на функции метаданных и поэтому не носят общего характера. описания представления данных. Кроме того, важно, Хотя такие определения предлагаются авторами в что в нем расширяется «область действия» мета- конкретном контексте, в ряде случаев их специфика данных. В соответствии с этим определением, явным образом в определении не оговаривается. В описываемым ресурсом могут быть не только результате приписываемые метаданным свойства собственно данные, но и поддерживающие их систе- или функции либо категория описываемых ресурсов мы, используемые в них технологии, пользователи неправомерно обобщаются. рассматриваемых данных и др. Авторы определения 9 полагают, что метадан- 3 Ресурсы, описываемые метаданными ные в Вебе — это слабоструктурированные данные. На наш взгляд, однако, эти метаданные могут быть При рождении термина «метаданные» имелось в и неструктурированными, например, текстами на виду, что они предназначены для описания свойств естественных языках. В этом определении акцен- данных. По прошествии времени разнообразие ре- тируется важная функция метаданных — обеспе- сурсов, описание свойств которых стало необходи- чение интероперабельности в неоднородных средах мым в современных компьютерных системах, суще- информационных ресурсов, описываемых мета- ственно расширилось. Помимо собственно данных, данными. требуются описания систем, обеспечивающих их В определении 10 также отмечается эта функция хранение, доступ к ним и их обработку, описания наряду с другими существенными функциями характеристик пользователей (их полномочий дос- метаданных - обеспечение организации, идентифи- тупа, их профиля, определяющего, в частности, ха- кации, поиска (определения местоположения) и, рактер их информационных потребностей и т.п.). вообще, управления описываемыми данными. При Возникли также потребности описания концепту- этом авторы не ограничиваются представлением о альных схем и онтологий, разнообразных сервисов, метаданных как о структурированных данных. средств вычислительной техники, научных прибо- В определении 11 описываемым ресурсом ров и других технических устройств, потоков работ, является элемент данных. Поскольку элемент дан- бизнес-процессов, а также организаций – владель- ных – категория, свойственная структурированным цев, генераторов и пользователей информационных данным, данное определение относится лишь к ресурсов. метаданным, описывающим структурированные Нужны описания не только структурированных, данные. Нужно заметить при этом, что метаданные но и неструктурированных данных. С помощью ме- элементов данных – лишь только составная часть таданных должны описываться различного рода ог- метаданных структурированных данных. В рассмат- раничения, которым должны удовлетворять данные, риваемом определении не охватываются такие, доступ к ним и их использование. Метаданные в например, аспекты их описания, как структурные бизнесе описывают специфические для этой сферы характеристики данных, ограничения целостности, деятельности ограничения, называемые бизнес- полномочия доступа, семантика данных и другие их правилами [23]. Бизнес-правила характеризуют свойства. «правила игры» в бизнесе, своего рода руководство для бизнес-деятельности. 6 Следует упомянуть также использование мета- хии метаданных обозначаются терминами «мета- данных для описания разрабатываемых програм- метаданные», «мета-мета-метаданные» и т.д. мных систем и процессов их функционирования. Ресурсы, описываемые метаданными. Как уже Некоторые такие метаданные формируются CASE- отмечалось (см. разд. 3), метаданные могут исполь- инструментами и представляются диаграммами на зоваться для описания свойств не только данных, но языке UML. Работа [20] напоминает об исполь- и многих других ресурсов различных видов. зовании метаданных для описания программ, их Автономные/встроенные метаданные. Мета- фрагментов, различного рода процессов и их данные могут быть автономными (отчужденными) компонентов, сред функционирования систем, сово- от описываемого ресурса или встроенными в него. купностей событий и отдельных событий, уже отме- Примеры автономных метаданных: схемы баз дан- чавшихся ранее ограничений, людей и их ролей в ных (они отчуждены от описываемого ими наполне- ИТ-системах, организаций, их подразделений, инди- ния базы данных); DTD, описывающие тип XML- видуумов или индивидуумов в определенной роли. документов и хранимые в Вебе вне конкретных эк- Перечисленными примерами отнюдь не исчер- земпляров XML-документов; репозиторий метадан- пывается множество видов ресурсов, описываемых ных открытого архива в технологии открытых архи- метаданными. Поэтому наряду с метаданными вов OAI [35, 41]; полнотекстовый индекс коллекции информационных ресурсов будем обсуждать далее и текстовых документов электронной библиотеки. метаданные ресурсов произвольного вида. Примеры встроенных метаданных: HTML-разметка веб-страницы; разметка веб-страницы средствами 4 Свойства метаданных микроформатов; DTD, специфицированное в теле XML-документа; аннотация статьи, содержащаяся в Конкретный состав функций метаданных зависит ее тексте; глоссарий, содержащийся в тексте специ- от особенностей использующей их системы, от ха- фикации официального стандарта. Если неструкту- рактера описываемых метаданными ее ресурсов, от рированные метаданные встроены в текстовый до- базовых информационных технологий системы, по- кумент, то для компьютерной обработки необходи- требностей ее пользователей и от многих других мо извлечь их из текста. Методам решения этой факторов. В этом разделе рассматриваются общие сложной задачи посвящен в последнее время ряд ис- свойства метаданных, не специфичные для какого- следований. Информационные ресурсы со встроен- либо конкретного случая их применения или для ка- ными описывающими их метаданными естественно кого-либо вида описываемых ресурсов. называть самоописываемыми. Относительный характер метаданных. Разде- Метаданные независимые и зависимые от ление информационных ресурсов на данные и контента описываемых информационных ресур- метаданные является относительным. Информаци- сов. Различаются метаданные, независимые от кон- онные ресурсы, играющие роль метаданных в одних тента описываемого информационного ресурса и случаях, являются данными в других, и наоборот. зависимые от контента. Примерами метаданных, Действительно, совокупность тегов гипертекстовой независимых от контента, могут служить: дата соз- разметки веб-страницы, название публикации или ее дания и место хранения текстового документа; тип аннотация, содержащаяся в ее тексте, могут исполь- файла, в котором он содержится; URL веб- зоваться в качестве метаданных, описывающих страницы. Примеры метаданных, зависимых от кон- перечисленные ресурсы. Вместе с тем, все они тента описываемого ресурса: аннотация текста; его являются составными частями соответствующих статистические характеристики (частотные характе- ресурсов и тем самым являются данными. ристики вхождений слов словаря, длина текста в ли- Многоуровневость метаданных. Как уже отме- терах и т.п.). Некоторые из таких метаданных могут чалось, что описание свойств данных и любого дру- продуцироваться автоматически из текста данного гого ресурса может осуществляться только в терми- документа, другие формируются вручную. нах более абстрактной системы понятий. Такие сис- Метаданные независимые и зависимые от темы понятий и их связей воплощают модели более предметной области. Метаданные первой из этих абстрактного уровня (метамодели) по отношению к категорий обычно описываются выразительными моделям, в терминах которых представлены описы- средствами стандартов горизонтальной сферы ваемые ресурсы. При этом метаданные, как и дан- (стандартов, не ориентированных на какую-либо ные, являются информационными ресурсами. Для конкретную область применения). Метаданные вто- них также могут существовать метаданные, пред- рой категории характеризуются большим разнооб- ставляющие собой мета-метаданные по отношению разием. Существуют собственные системы метадан- к исходным описываемым ресурсам. Такая иерархия ных в различных областях научных исследований, в метаданных может включать любое число уровней. музейном деле, в образовательной сфере и т.д. Так, стандарт Meta Object Facility (MOF) [33] кон- Системные и пользовательские метаданные. сорциума OMG предусматривает три уровня, спе- Метаданные могут быть предназначены для компь- цификация стандартов Дублинского ядра [12, 24] - ютерной обработки, связанной с исполнением сис- два уровня: предназначенный непосредственно для темных функций (системные метаданные). Они мо- практических целей и обеспечивающий его описа- гут быть также предназначены для пользователей ние. Спецификации более высоких уровней иерар- информационной системы. Метаданные, предназна- ченные для пользователей, могут служить, напри- 7 мер, для информирования пользователей о свойст- бой совокупность тегов гипертекстовой разметки, вах информационных ресурсов, свойствах систем- которую можно видеть в исходном коде страницы. ных сервисов, контекста использования системы В то же время, на «логическом» уровне, в том виде, или предоставляют пользователю инструкцию о по- как браузер воспроизводит эту страницу на экране рядке выполнения требуемых ему операций. Суще- компьютера, с этой страницей ассоциируются со- ствуют системы, служащие для поддержки всей со- всем иные метаданные, например, ее URL и описа- вокупности метаданных информационной системы, ние ее контента в различного рода каталогах для называемые системами словарей-справочников дан- пользователей Веба. В системах баз данных мета- ных [9, 28]. Их компонент справочник данных данные среды хранения описывают структуру хра- управляет метаданными, предназначенными для нимых данных и ее свойства, индексы, характери- системы, а словарь данных — метаданными, предна- стики пространства памяти и другие элементы сре- значенными для пользователей. ды хранения. В то же время, метаданные на «ло- Структурированные и неструктурированные гическом» уровне представления данных описывают метаданные. Для поддержки системных функций, их видение пользователем. В реляционной системе как правило, используются структурированные ме- базы данных метаданные описывают состав таблиц таданные. Метаданные, предназначенные для поль- базы данных, свойства каждой таблицы, связи ме- зователей, могут быть как структурированными, так жду таблицами, полномочия пользователей и т.п., но и неструктурированными, например, они могут быть не организацию хранения базы данных. обычными текстами. В отличие от структурирован- Явное и неявное представление метаданных. ных метаданных, для неструктурированных мета- Многие свойства различных ресурсов информаци- данных не существует каких-либо общепринятых онных и других систем описываются явным образом стандартов их представления. Структурированные представленными метаданными. Эти метаданные метаданные привлекают большое внимание. Им по- поддерживаются в форме текстовых документов, священа масса публикаций. Структурированные ме- иллюстраций или изображений, сообщений по элек- таданные, так же как и неструктурированные, могут тронной почте, в электронных таблицах, в базах описывать и структурированные, и не структуриро- данных и в различных ИТ-инструментах, например, ванные данные. в репозиториях метаданных CASE-инструментов Уровень гранулярности описания ресурсов. Ме- или открытых архивов. Вместе с тем, некоторые их таданные могут описывать информационные и дру- свойства могут быть не представлены в системах гие ресурсы на любом требуемом уровне их грану- явными описаниями. Такая ситуация имеет место, лярности. Например, в электронных библиотеках например, в научных публикациях. Для содержа- используются метаданные, описывающие коллекции щихся в них ссылок на использованные источники информационных ресурсов в целом, а также отдель- не указывается семантика [6] этих связей. ные входящие в них информационные объекты. В Средства представления метаданных. Для системах баз данных схема базы данных описывает представления метаданных могут использоваться не только структуру базы данных в целом, но и разнообразные выразительные средства: естествен- свойства ее структурных компонентов — в реляци- ные и искусственные языки, наборы элементов ме- онных базах данных отдельных таблиц, данных, со- таданных (схемы метаданных), графические схемы держащихся в их столбцах и т.д. и диаграммы, а также другие средства (см. разд. 7). Статические и динамические метаданные. В данном разделе мы ограничились рассмо- Метаданные могут быть как статическими, так и ди- трением только основных свойств метаданных, намическими. Так, в системах баз данных от- которые не зависят от предметной области, в носительно неизменна схема базы данных. В то же которой они применяются. Как уже отмечалось, время каталоги коллекций в электронной библио- разнообразие метаданных, используемых в кон- теке изменяются при включении в них новых ин- кретных областях применения, чрезвычайно велико. формационных объектов. Во многих направлениях научных исследований Степень формализованности метаданных. существуют собственные, специфичные для них Для представления метаданных могут служить в системы метаданных. Составляющие их виды мета- различной степени формализованные выразитель- данных позволяют описывать многообразие свойств ные средства — естественные языки, полуформаль- исследуемых объектов, явлений, процессов. Напри- ные языки, например, набор элементов метаданных мер, это - характеристики измерительных приборов, Дублинского ядра, а также формальные языки в де- обеспечивающих получение научных данных, дуктивных базах данных интенсионал описывается разнообразных компьютерных и иных моделей, в средствами логики. Язык OWL для описания онто- соответствии с которыми вычислены или оценены логий Веба основан на дескриптивной логике. значения используемых данных, характеристики Зависимость метаданных от информацион- публикаций, источников информационных ресурсов ной архитектуры системы. Состав и содержание и многое другое. метаданных зависит от того уровня информацион- ной архитектуры информационной системы, кото- 5 Функции метаданных рому принадлежит ресурс, описываемый метадан- ными. Действительно, метаданные, описывающие Метаданные выполняют разнообразные функции веб-страницы на уровне хранения, представляют со- в системах, их использующих. Конкретные их 8 функции и состав существенным образом зависят от Описание семантики информационных ис- информационных технологий, на которых базирует- точников, информационных объектов или их ся система, от ее функциональности, свойств под- фрагментов. Метаданные, используемые для этой держиваемых в ней информационных ресурсов, спо- цели, называются семантическими. В простейших собов их организации в системе, особенностей задач случаях семантика информационных источников их обработки и от многих других факторов. или отдельных информационных объектов описыва- Рассмотрим кратко основные функции, выпол- ется с помощью рубрикаторов, например, россий- няемые метаданными, не исчерпывающие всех их ских ГРНТИ или ББК, либо международных УДК возможностей. Приведенные ниже примеры вырази- или JEL (Journal of Economic Literature Classification тельных средств представления метаданных, выпол- System). Другим более многоаспектным, но нефор- няющих обсуждаемые функции, относятся к числу мальным средством описания семантики является «универсальных», не специфичных для какой-либо набор элементов метаданных Дублинского ядра конкретной предметной области или деятельности (Dublin Core, DC). Для текстовых документов в какого-либо профессионального сообщества. электронных библиотеках и коллекций информаци- Описание моделей предметной области. Важ- онных ресурсов электронных библиотек, для струк- нейшая функция метаданных - описание абстракт- турных элементов баз данных, для веб-страниц, а ных моделей предметной области. С разработки также для электронных библиотек или других ин- этих моделей начинается проектирование информа- формационных репозиториев в целом используют ционных систем. Это - концептуальная схема пред- также семантическое аннотирование, заключаю- метной области, дополняемая в системах семанти- щееся в ассоциировании с описываемым ресурсом ческого уровня онтологией [5]. Такие модели не за- некоторой информации (семантической аннота- висят от технологий реализации разрабатываемой ции), характеризующей его семантику [36]. Семан- информационной системы. Для спецификации кон- тическая аннотация может быть встроена в описы- цептуальной схемы используются языки концепту- ваемый ресурс или автономна от него. Одним из ального моделирования различного уровня фор- простейших средств встроенного семантического мальности, например, диаграммы UML или фор- аннотирования, используемого для описания семан- мальные языки представления знаний, основанные тики фрагментов веб-страниц, являются так назы- на математической логике. Тем самым концепту- ваемые микроформаты [32]. Некоторые из них под- альная схема может в различной степени удержи- держиваются популярными поисковыми машинами вать семантику предметной области. Онтологии Веба. Например, Яндекс поддерживает микрофор- также могут представляться различными средствами маты: hCard - для разметки контактной информации — от классификаторов до формальных языков опи- (адресов, телефонов и т. д.); hRecipe - для описания сания онтологий. В последние годы языки описания кулинарных рецептов; hReview - для разметки ре- онтологий OWL и OWL2 консорциума W3C стали цензий, отзывов; hProduct – для разметки описаний иногда использоваться для описания концептуаль- товаров. ной схемы предметной области. Для семантического аннотирования могут ис- Описание источников данных. Эти функции пользоваться различные средства — от естествен- метаданных выполняют, в частности, схемы баз ных до формальных искусственных языков. Могут данных, определения типа XML-документов, XML- использоваться, например, управляемые словари и схемы для репозиториев информационных объектов, тезаурусы, таксономии и формальные онтологии. онтологии источников информации. Метаданные Частным случаем семантического аннотирования этого вида представляются, соответственно, языка- является онтологическое аннотирование. В этом ми описания данных (например, дескриптивный случае описание семантики ресурса осуществляется подъязык языка SQL, язык описания объектов ODL в терминах некоторой онтологии. объектных баз данных), подъязык языка XML и Онтологии, как и другие средства представления язык XML-схем, языки описания онтологий (напри- знаний, используются также для автономного фор- мер, RDFS, OWL2). мального описания семантики информационных ис- Описание информационных объектов. Эта точников. В настоящее время для этого чаще всего функция необходима в электронных библиотеках, служат разработанные консорциумом W3C языки системах отрытых архивов и других репозиториях RDF, RDFS, OWL, OWL2 и его профили. информационных объектов с гранулярностью дос- Следует отметить, что вопреки мнению, выска- тупа к их информационным ресурсам на уровне от- занному в [13] и ряде других публикаций, метадан- дельного объекта. В последнее время для представ- ные могут описывать семантику не только структу- ления таких метаданных часто используются описа- рированных, но и неструктурированных данных. В тели, представленные в форме XML-документов, указанной работе утверждается: «Структурирован- библиотечных каталожных записей различных диа- ные данные обладают метаданными, которые позво- лектов стандарта MARC. Эти метаданные описыва- ляют нам понять, что они означают. Для неструкту- ют структурные свойства описываемых информаци- рированных данных не существует какого-либо эк- онных объектов, различные другие их характери- вивалента». Это утверждение ошибочно хотя бы по- стики. В «интеллектуальных» системах описывается тому, что для любых информационных ресурсов, семантика информационных объектов (см. далее). структурированных и неструктурированных, могут использоваться семантические аннотации. 9 Описание представления данных на разных логия SQL-системы базы данных в системах доступа уровнях информационной архитектуры. В систе- к данным, основанным на онтологиях [4], позволяет мах баз данных метаданные описывают представле- обнаруживать неполноту и противоречивость дан- ние хранимых данных (внутренняя схема базы дан- ных в базе данных. ных), «логическое» представление полной базы Предоставление пользователям сведений об данных (концептуальная схема базы данных) и описываемых ресурсах. Метаданные могут быть представления для пользователей или приложений предназначены не только для поддержки системных необходимых им фрагментов базы данных или пол- функций, но и для информирования пользователей о ной базы данных (внешние схемы). Такие метадан- свойствах информационных ресурсов, сервисов, ко- ные определяются на языках описания данных торые обеспечивают доступ к ним и о других опи- СУБД. В среде Веба разметка хранимых HTML- сываемых ресурсах. Ориентированные на пользова- файлов описывает, каким образом веб-браузер дол- теля метаданные могут быть как структурирован- жен формировать представление веб-страниц на эк- ными, так и неструктурированными данными. По- ране пользовательского компьютера и какие другие следние могут представляться в виде текстов на ес- файлы из Интернет нужно для этого использовать. тественных языках, схем, чертежей, фрагментов Идентификация описываемых ресурсов. Мета- карт местности и др. Метаданные рассматриваемого данные описывают, какие встроенные в экземпляры назначения могут описывать генезис описываемых ресурсов их элементы или ассоциированные с ними ресурсов, связанные с ними предположения, спосо- атрибуты обеспечивают их идентификацию. Приме- бы доступа и условия их использования, их семан- рами встроенных идентифицирующих элементов тику, используемую терминологию, а также иные являются первичные и вторичные ключи строк таб- сведения. Примерами таких метаданных являются лиц в системах баз данных. Их значения уникаль- инструкции для пользователей по работе с систе- ным образом идентифицируют отдельные строки мой, оглавление или аннотация книги. или, соответственно, некоторые их множества. Управление доступом. Метаданные позволяют XML-документы при наличии DTD или XML-схемы описывать ограничения доступа и полномочия поль- идентифицируются их встроенными идентификато- зователей на доступ к информационным ресурсам рами. В электронных библиотеках текстовых доку- или на выполнение иных операций используемой ментов могут использоваться их уникальные иден- системы. Эти полномочия и ограничения проверя- тификаторы. Часто они генерируются системой, не- ются системными механизмами при попытке поль- доступны в явном виде пользователям, и служат для зователя выполнить защищенную операцию. В сис- ссылок на эти документы в генерируемых системой темах баз данных ограничения доступа описы- каталогах. Для идентификации текстовых докумен- ваются в схеме базы данных. тов могут также использоваться наборы значений Описание характеристик пользователей и их дескрипторов или ключевых слов. В Вебе в качестве информационных потребностей. Во многих ин- уникальных идентификаторов веб-страниц исполь- формационных системах имеется возможность под- зуются указатели URL или URI [43]. Первый из них держивать сведения о пользователях и их информа- идентифицирует страницу по ее местоположению в ционных потребностях, необходимые для учета их Интернет. В ГИС точки земной поверхности иден- работы и сбора статистических данных об использо- тифицируются их широтой и долготой. Наконец, вании системных ресурсов. Совокупность таких ме- нужно упомянуть индексы УДК и ISBN, идентифи- таданных называется профилем пользователя. каторы цифровых объектов DOI, элементы метадан- Обеспечение обнаружения и поиска информа- ных Дублинского ядра. Существуют и другие при- ционных ресурсов. Это — одна из главных функций меры видов метаданных, используемых для иденти- метаданных, предусматривающая использование их фикации информационных ресурсов. в критериях поиска. При этом могут использоваться Управление структурированными данными. не только идентифицирующие, но и другие виды Это комплекс задач, связанных с обеспечением эф- метаданных. Обнаружение требуемых информаци- фективного хранения и обработки структурирован- онных ресурсов может также осуществляться путем ных данных, а также доступа к ним. Чаще всего для навигации в каталогах, предметных указателях, руб- решения этих задач используют технологии баз рикаторах. Использование семантических метадан- данных. Метаданные, представленные в виде схемы ных в процессе поиска позволяет существенно сни- баз данных, обеспечивают механизмы СУБД в про- зить уровень информационного шума. цессе ее функционирования необходимой информа- Распространение информационных ресурсов. цией об организации базы данных, ограничениях Поддерживаемые в информационной системе мета- целостности данных и управления доступом. данные (например, в профилях пользователей), ха- Верификация данных. Метаданные структури- рактеризующие информационные потребности рованных данных (например, схема базы данных) пользователей, позволяют обеспечить избира- позволяют контролировать их форматы и типы дан- тельное распространение информации средствами ных, проверять соблюдение ограничений целостно- системы. сти. Эти задачи решают механизмы СУБД. Для Тематическая систематизация информаци- XML-документов с заданным определением типа онных ресурсов. Эта функция выполняется путем документов (DTD) используемый XML-процессор формирования каталогов и предметных указателей может проверить корректность их структуры. Онто- содержащихся в системе информационных ресур- 10 сов, индексирования ресурсов с помощью рубрика- нять и иные специфические функции, обсуждение торов. которых не входит в задачу этой работы. Обеспечение анализа данных. Эта функция ха- рактерна для систем многомерных или реляционных 6 Классификации метаданных баз данных и хранилищ данных и связана с исполь- зованием методов OLAP. Используемые метаданные Возможны различные подходы к классификации содержатся в схемах баз данных. метаданных. Имеют право на существование клас- сификации метаданных по их функциям, по уровням Обеспечение интероперабельности и повтор- семантической абстрактности, по их свойствам, по ного использования информационных ресурсов. Техническая и/или семантическая интероперабель- уровням информационной архитектуры, к которым ность и на этой основе повторное использование относятся описываемые ресурсы, а также по ряду информационных ресурсов может обеспечиваться других критериев. Выше (разд. 4, 5) фактически бы- путем унификации представления метаданных сред- ли рассмотрены детальные классификации метадан- ствами открытых стандартов. Например, база дан- ных, независимых от предметной области примене- ных, описанная схемой, представленной на дескрип- ния, по их функциям, а также по их свойствам. Од- тивном подъязыке языка SQL или на языке описа- нако в литературе чаще всего предлагаются агреги- ния объектов ODL стандарта ODMG, может повтор- рованные функциональные классификации. но использоваться другой СУБД, поддерживающей Пожалуй, наиболее популярна классификация, стандарт SQL или, соответственно, ODMG. рассмотренная в [42]. C небольшими вариациями она приводится и во многих других источниках. В Интеграция данных из многих источников. Рассмотрим эту функцию на примере создания и этой классификации различаются описательные, функционирования системы виртуальной интегра- структурные и административные метаданные. ции информационных ресурсов из множества ис- Описательные метаданные описывают контент точников. Здесь необходимы метаданные, которые ресурса (например, это — набор значений элементов описывают: локальные схемы интегрируемых ис- метаданных Дублинского ядра), библиографические точников, глобальную схему, отображения между его данные (если это — публикация), аннотацию, локальными схемами и глобальной схемой. В сис- идентификаторы ресурса (например, URI [43] или темах семантической интеграции данных необ- DOI [16]) и т. п. ходимы также метаданные, включающие онтологии Структурные метаданные характеризуют об- локальных источников, общую онтологию системы щую структуру ресурса и ее компоненты, объем и интеграции, а также отображения онтологий. В сис- другие подобные свойства описываемого ресурса. темах виртуальной интеграции данных с архитекту- Административные метаданные описывают рой адаптеров-посредника необходимы также мета- даты создания и обновления ресурса, кем он создан данные, которые описывают регистрационные дан- или модифицирован, кто владелец прав на этот ре- ные источников в посреднике – центральном ком- сурс, полномочия доступа пользователей, сведения поненте архитектуры систем интеграции данных. об имеющихся версиях и/или копиях ресурса, где Описание авторских прав на интеллектуаль- они хранятся и другие сведения, необходимые для ную собственность. Эту функцию поддерживают администрирования и управления ресурсом. метаданные, предоставляющие информацию об ав- Авторы отчета [42] полагают при этом, что ад- торских правах на описываемые ресурсы. министративные метаданные состоят из нескольких Наукометрия в научных электронных биб- подмножеств, два из которых иногда рассматрива- лиотеках. Идентифицирующие метаданные (автор, ются как самостоятельные классы метаданных. Это организация, название работы), описания рубрик — метаданные управления правами на интеллекту- классификаторов и ссылок цитирования в описаниях альную собственность, а также метаданные, описы- научных публикаций в электронных библиотеках вающие различные аспекты деятельности, связанной позволяют оценивать цитируемость работ отдель- с сохранением ресурсов. ных авторов или организаций, в которых они рабо- В материалах проекта [40], посвященного созда- тают, анализировать тематическую структуру кон- нию цифровых архивов, предлагается та же класси- тента библиотеки, формировать рейтинги востребо- фикация. Однако в состав административных мета- ванности и цитируемости работ по авторам и по от- данных авторы включают технические метаданные дельным публикациям. Благодаря классификации (описание ИТ-аспектов информационных ресурсов и связей между публикациями, авторами и публика- используемых информационных технологий), мета- циями, организациями и авторами, и осуществляе- данные управления правами (декларации прав на мой на ее основе семантической структуризации ресурс и ограничения доступа к нему), а также ме- контента научных электронных библиотек с под- таданные цифрового происхождения (сведения о держкой метаданных, описывающих сформирован- создании и последующей обработке цифрового ре- ную семантическую структуру [6], можно получать сурса, в том числе, подробности об ответственности многоаспектную наукометрическую и науковедче- за каждое событие на протяжении его жизни). скую информацию. В работе [20] предлагается несколько более рас- Рассмотренные в этом разделе функции мета- ширенная классификация, предусматривающая сле- данных используются наиболее часто. Однако в не- дующие классы метаданных. которых компьютерных системах они могут выпол- 11 Административные метаданные. Служат для чивают однозначности и строгости интерпретации управления и администрирования электронными метаданных, представленных их средствами. Такие коллекциями и другими информационными ресур- неструктурированные метаданные в малой степени сами. Предоставляют информацию о сборе данных, пригодны для компьютерной обработки и предна- их местоположении, правах и способах репродуци- значены, главным образом, для пользователей. На рования ресурсов, условиях легального доступа. естественных языках представляются, например, Описательные метаданные. Используются для аннотации публикаций, различные сведения об опи- идентификации и описания свойств коллекций и сываемых ресурсах и их авторах. связанных с ними информационных ресурсов. К та- Искусственные языки. Это большой пласт раз- ким метаданным относятся каталожные записи, ин- нообразных языков. К их числу относятся языки формация для помощи при поиске, описания версий описания данных СУБД, концептуального модели- ресурсов, специализированные индексы, кура- рования, описания онтологий, бизнес-процессов, по- торская информация, гипертекстовые связи между токов работ. К этой категории относятся, например, ресурсами, аннотации создателей и пользователей. дескриптивный подъязык языка SQL, язык описания Метаданные сохранения. Предназначены для объектов ODL, язык описания интерфейсов IDL управления сохранением коллекций и других ин- стандарта CORBA, языки консорциума W3C: OWL, формационных ресурсов. К этому классу метадан- OWL2, RDF, RDFS, язык XML-схем. Сюда же сле- ных относятся документация о физических условиях дует отнести языки разметки, схемы метаданных, сохранения ресурсов, о предпринятых действиях для визуальные языки, которые рассматриваются ниже, физического сохранения, о цифровых версиях ре- и многие другие языки в различных областях ин- сурсов, об изменениях, которые были произведены формационных технологий. во время их оцифровки и сохранения. Языки разметки. Среди этих искусственных Технические метаданные. Включают, в частно- языков наиболее популярны XML, HTML, XHTML, сти, описание функционирования систем, докумен- Tex (язык разметки математических текстов) и его тацию по оборудованию и программному обеспече- оболочка LaTex. Во многих системах метаданные нию, технологическую информацию о проведенной представляются в виде XML-документов с опреде- оцифровке, данные аутентикации и обеспечения ленной XML-схемой. информационной безопасности (ключи шифрова- Схемы метаданных. Средства этой категории ния, пароли). представляют собой особый вид искусственных Метаданные об использовании. Описывают ха- языков, который стал в последние годы чрезвы- рактер использования ресурсов, в том числе, по- чайно популярным. Прототипом для их разработок в вторного использования, версии ресурсов, авторские значительной мере стал набор элементов метадан- права на ресурсы, включают журнал регистрации ных Дублинского ядра [12, 17, 24] — стандарта поиска и др. структурированных метаданных с нетипизирован- Предпринимались также попытки создания ными значениями элементов. Попытки типизации обобщенной классификации научных метаданных. значений элементов метаданных Дублинского ядра Так, предлагаемая в работе [19] классификация привели к дополнению в его спецификацию описа- включает следующие классы научных метаданных: телей типов для значений некоторых его элементов, Описание трансформаций данных (описание называемых квалификаторами. научных моделей, компьютерных программ и др.) Термин «схема метаданных» широко использу- Описание семантики данных ется в литературе и, по сути, является синонимом Описание структуры данных термина «набор элементов метаданных». Схема Описание атрибутов данных метаданных — это набор элементов метаданных, Описание значений данных. каждый из которых обладает некоторым именем и Эта классификация, к сожалению, является семантикой, принимает значения с установленной довольно узкой. Она не включает метаданные, семантикой, иногда — значения из управляемого описывающие научные приборы, процессы исследо- словаря. Существуют схемы метаданных, созданные вательской деятельности, ее инфраструктурные и различными профессиональными сообществами для другие ресурсы, связанные с наукой и научной многих сфер применения. Метаданные описывае- деятельностью. мых ресурсов, выраженные средствами схем мета- данных, часто кодируются в виде XML-документов. 7 Средства представления метаданных Визуальные языки. Визуальные языки давно на- чали использоваться в CASE-технологиях. Наиболее Для представления метаданных могут использо- популярным в этой области в настоящее время стал ваться естественные языки, а также различные ис- язык объектного анализа и проектирования UML кусственные языки, такие как языки разметки, схе- [42]. Основным средством представления метадан- мы метаданных, графические средства. Рассмотрим ных в этом языке являются графические диаграммы кратко указанные категории выразительных средств. нескольких типов, которые на стадии проектирова- Естественные языки. Такие языки обладают ния позволяют описать различные аспекты созда- наиболее богатыми выразительными возможно- ваемой сложной программной системы. стями по сравнению с другими средствами пред- ставления метаданных. Однако они не обеспе- 12 8 Стандартизация метаданных [2] Когаловский М.Р. Энциклопедия технологий баз данных. М.: Финансы и статистика, 2002. Для обеспечения интероперабельности и повтор- 800 с. ного использования метаданных важное значение [3] Когаловский М.Р. Перспективные технологии имеет стандартизация средств их представления. информационных систем. М.: ДМК Пресс, Деятельность в этой области активно проводится с Компания АйТи, 2003. 288 с. давнего времени официальными органами стандар- [4] Когаловский М.Р. Доступ к реляционным ба- тизации, индустриальными консорциумами, различ- зам данных, основанный на онтологиях /Про- ными профессиональными сообществами. Разрабо- граммирование, МАИК/Наука «Интерперио- тано большое число стандартов метаданных как дика». 2012. № 4. независимых от сферы применения, так и предна- [5] Когаловский М.Р., Калиниченко Л.А. Концеп- значенных для специфических применений. К туальное и онтологическое моделирование в первой группе относятся, например, дескриптивный информационных системах //Программирова- подъязык языка SQL, язык описания объектов ODL ние. МАИК “Наука”/ Интерпериодика. 2009. консорциума ODMG, стандарты консорциума OMG: № 5. язык UML, язык описания интерфейсов CORBA [6] Когаловский М.Р., Паринов С.И. Семантичес- IDL, Common Warehouse Model (CMW); стандарты кое структурирование контента научных элект- консорциума W3C: XML Schema, RDF, RDFS, OWL, ронных библиотек на основе онтологий OWL2 с его профилями и язык описания интер- /«Сборники Президентской библиотеки им. фейсов веб-сервисов WSDL; набор элементов Б.Н. Ельцина. Серия «Электронная библио- Дублинского ядра (Dublin Core, DC), поддержи- тека». Санкт-Петербург: ФГБУ «Президент- ваемый Директоратом Дублинского ядра; язык ская библиотека имени Б.Н. Ельцина», 2011. - моделирования бизнес-процессов BPML. Другие Вып.2: Электронная библиотека: современные примеры стандартов «общих» метаданных можно технологии интеграции информационных найти в [2, 11, 42]. Среди стандартов второй группы ресурсов. значительное место занимают многочисленные [7] Когаловский М.Р., Паринов С.И. Метрики стандарты научных метаданных, созданные во онлайновых информационных пространств многих областях исследований. //Экономика и математические методы. 2008. Вып. 2. 9 Заключение [8] Когаловский М.Р., Хохлов Ю.Е. Стандарты XML для электронного правительства. М.: В данной работе предпринята попытка предста- Институт развития информационного обще- вить богатый мир метаданных, важнейшего вида ства, 2008. 416 с. информационных ресурсов. Анализ обширного мас- [9] Леонг-Хонг Б., Плагман Б. Системы словарей- сива публикаций показывает, что существо мета- справочников данных /Пер. с англ.: Предисло- данных, их свойства и возможные функции пока вие В.М. Савинкова. М.: Финансы и статис- еще не осознаны многими специалистами в доста- тика, 1986. 311 с. точной мере. Именно это обстоятельство послужило [10] Паринов С.И., Ляпунов В.М., Пузырев Р.Л. поводом для подготовки данной статьи. Система Соционет как платформа для разра- Множество определений термина «метаданные» ботки научных информационных ресурсов и существует не случайно. Причина не только в тех онлайновых сервисов //Электронные библио- факторах, которые отмечались выше, но и в том, что теки. 2003. Том 6. Выпуск 1. довольно сложно дать качественное и лаконичное [11] Хохлов Ю.Е., Арнаутов С.А. Обзор форматов определение этого термина. метаданных. http://www.elbib.ru/index.phtml? Проблематика метаданных в компьютерных сис- env_page=methodology/metadata/md_review/md_ темах является непреходящей. В последние годы все review.html более активно используются семантические мета- [12] ANSI/NISO Z39.85 - The Dublin Core Metadata данные. Разработки новых технологий и новых ви- Element Set. дов приложений по необходимости потребуют соз- [13] Blur R. The Information Oriented Architecture. дания и использования новых видов метаданных. В The Blur Group, 2011. связи с этим будут, естественно, создаваться и но- http://www.bloorgroup.com/ вые выразительные средства для их представления. [14] Burnett K., Kwong Bor Ng, Park S. A comparison Однако обсуждаемые в данной статье свойства и of the two traditions of metadata development /J. функции метаданных будут присущи и вновь созда- of the American Society for Information Science. ваемым их видам. Special issue on integrating multiple overlapping metadata standards, Vol. 50, Issue 13, 1999, Литература pp.1209-1217. http://comminfo.rutgers.edu/~kbng/ publications/1999JASISPark.pdf [1] Воройский Ф.С. Информатика. Новый система- [15] Corcho O. Ontology based document annotation: тизированный словарь-справочник (Вводный trends and open research problems /Intern. Journal курс по информатике и вычислительной техни- of Metadata, Semantics and Ontologies. - Volume ке в терминах). - 2-е изд., перераб. и доп. М.: 1, Issue 1, January 2006. http://oa.upm.es/5638/2/ Либерия, 2001. 536 с. IJMSO_Corcho_FinalVersionPrintedInJournal.pdf 13 [16] DOI (Digital Object Identifier). Number: formal/2011-08-05. http://www.doi.org/ http://www.omg.org/ [17] Dublin Core Metadata Element Set, Version 1.1: spec/UML/2.4.1/Infrastructure/ PDF/ Reference Description, 2003-06-02. [34] Open Archives Initiative (2000). http://dublincore.org/documents/dces/ http://www.openarchives.org/ [18] Feng L., Brussee R., Blanken H. and Veenstra M. [35] Oren E., Moller K.H., Scerri S., Handschuh S., Languages for Metadata. In: Multimedia Retrieval. and Simtek M. What are Semantic Annotations? Data-Centric Systems and Applications, Springer, http://www.siegfried-handschuh.net/pub/2006/ 2007, 23-51. http://www.springerlink.com/ whatissemannot2006.pdf content/m276p88003533q86/ [36] Scientific Data Management. http://personal.cscs. [19] Galhardas H., Simon E., Tomasic A. A ch/~mvalle/sdm/scientific-data-management.html Framework for Classifying Scientific Metadata. [37] Task Force on Metadata. Summary Report. //Ame- INRIA, 1998. http://www.aaai.org/Papers/ rican Library Association. Committee on Catalog- Workshops/1998/WS-98-14/WS98-14-015.pdf ing: Description and Access. June1999. [20] Gill T., Gilliland A.G., Whalen M., Woodley M.S. http://www.libraries.psu.edu/ tas/jca/ccda/tf- Introduction to Metadata. Online Edition, Version meta3.html 3.0. Ed. by Murtha Baca. Getty Research Institute, [38] Taylor C. An Introduction to Metadata. The 2008. - 96 p. http://www.getty.edu/research/ University of Queensland, Australia. publications/electronic_publications/intrometadata http://www.library.uq.edu.au/papers/ctmeta4.html /index.html [39] The Making of America II. [21] Grotschel M., Lugger J. Scientific Information http://sunsite3.berkeley.edu/MOA2/ System and Metadata. Konrad-Zuse-Zentrum fur [40] The Open Archives Initiative Protocol for Metada- Informationstechnik, Berlin. http://www.zib.de/ ta Harvesting. http://www.openarchives.org/OAI/ groetschel/pubnew/paper/groetschelluegger openarchivesprotocol.html 1999.pdf [41] Understanding metadata. National Information [22] Halshofer B. and Klas W. A Survey of Techniques Standards Organization (NISO), 2004. for Achieving Metadata Interoperability /ACM http://www.niso.org/standards/resources/Understa Computing Surveys, Vol. 42, No. 2, Article 7, ndingMetadata.pdf February 2010. [42] Uniform Resource Identifier (URI): Generic [23] Inmon, William H. Business metadata: the quest Syntax. http://tools.ietf.org/html/rfc3986 for business clarity /W.H. Inmon, Bonnie O’Neil, [43] Wikipedia. Метаданные. Lowell Fryman. Elsevier Inc., 2008. – 314 p. http://ru.wikipedia.org/wiki/Метаданные [24] ISO 15836:2009. Information and documentation - - The Dublin Core metadata element set. Metadata, their Properties, Functions [25] ISO/IEC Information technology – Information and Classifications Resource Dictionary System (IRDS) Framework. International Standard ISO/IEC 10027:1990, Mikhail Kogalovsky 1990. In modern information systems the important role is [26] Jeusfeld M.A. Metadata. In: Encyclopedia of played with a special kind of the information resources Database Systems, Springer, 2009. – pp. 1723- named by metadata. Properties of metadata, their 1724. http://www.springerlink.com/content/ composition and functions depend essentially on h241167167r35055/ [27] Lagose C. Metadata for the Web. Cornell technologies used for implementation of systems in University. CS 431 – March 2, 2005. which they are used. They depend also on features of [28] Lefkovits H.C. Data Dictionary Systems. Q. E. D. resources being described as well as on area of use and Information Sciences. – Inc. Wellesley concrete applications. The huge quantity of publications Massachusetts, 1977. – 491 p. is devoted to metadata. Nevertheless, the treatment of [29] Metadata Standards. http://www.chin.gc.ca/ the term "metadata" still has not stabilized. The English/Standards/metadata_intro.html majority of publications are devoted to discussion of [30] Metadata. U.K. Office for Library and Information concrete standards of metadata. In many publications Networking (UKOLN). http://www.ukoln.ac.uk/ necessary provisos are not done and as a result metadata/ properties and functions of special kinds of metadata are [31] Metadata Standards and Applications. Introduc- extended groundlessly on the general case. There are tion: Background, Goals, and Course Outline. erroneous points of view and historical mistakes. In the ALCTS. http://www.loc.gov/catworkshop/courses/ article the widespread treatments of the term "metadata" metadatastandards/pdf/MSA Instructor are analyzed, the general properties and functions of Manual.pdf metadata are considered; their classifications and [32] Microformats. http://microformats.org/ expressive means for their representation are discussed. [33] OMG Meta Object Facility (MOF) Core Specifi- cation. Version 2.4.1. OMG Document Number: formal/2011-08-07 OMG Unified Modeling Language (OMG UML) Infrastructure. Version 2.4.1. OMG Document 14