=Paper=
{{Paper
|id=Vol-1752/paper20
|storemode=property
|title=
Инфраструктура обеспечения данными специалистов в неорганической химии и материаловедении
(Inorganic Chemistry and Materials Science Data Infrastructure for Specialists)
|pdfUrl=https://ceur-ws.org/Vol-1752/paper20.pdf
|volume=Vol-1752
|authors=Nadezhda Kiselyova,Victor Dudarev
|dblpUrl=https://dblp.org/rec/conf/rcdl/KiselyovaD16
}}
==
Инфраструктура обеспечения данными специалистов в неорганической химии и материаловедении
(Inorganic Chemistry and Materials Science Data Infrastructure for Specialists)
==
Инфраструктура обеспечения данными специалистов в неорганической химии и материаловедении © Н. Н. Киселева1 © В. А. Дударев1,2 1 Федеральное государственное бюджетное учреждение науки Институт металлургии и материаловедения им. А.А. Байкова Российской академии наук (ИМЕТ РАН), 2 Национальный исследовательский университет «Высшая школа экономики» (НИУ ВШЭ), Москва kis@imet.ac.ru vic@imet.ac.ru Аннотация используются не самые лучшие по потребительским и прочим параметрам вещества, что приводит к Проведен анализ реализуемых в мире крупных снижению качества продукции, росту затрат на ее инфраструктурных проектов информационного производство и, в конечном счете, к утрате рыночной обеспечения специалистов в области привлекательности выпускаемого продукта. материаловедения (MGI, MDF, NoMaD и т.д.). Дан Одним из путей ускорения поиска, разработки и краткий обзор российских информационных внедрения новых материалов является создание ресурсов в области неорганической химии и развитой инфраструктуры информационного материаловедения. Предложен проект обеспечения специалистов, в первую очередь, инфраструктуры для обеспечения данными распределенной виртуально интегрированной сети российских специалистов в этой области. баз данных и баз знаний, содержащих информацию о Авторы благодарят А.В. Столяренко, В.В. Рязанова, свойствах веществ и материалов и технологиях их О.В. Сенько, А.А. Докукина за помощь в создании получения и обработки, а также систем информационно-аналитической системы. компьютерного конструирования и моделирования Работа выполнена при частичной финансовой материалов, доступных из Интернет специалистам поддержке РФФИ, проекты 16-07-01028, 14-07- самого разного профиля: научным работникам, 00819 и 15-07-00980. инженерам, технологам, бизнесменам, госслужащим, студентам и т.д. 1 Введение В последние годы в развитых странах были выдвинуты и поддержаны правительствами Конкурентные требования глобального рынка инициативы, направленные на организацию требуют постоянного обновления и улучшения инфраструктуры доступа к экспериментальным и потребительских свойств продукции. Качество и расчетным данным о материалах. Краткий обзор новизна выпускаемой продукции в значительной некоторых инициатив ранее был дан в [2]. степени определяется материалами, используемыми при ее производстве. В связи с этим ускорение поиска, исследования и внедрения новых материалов 2 Стратегическая инициатива Геном с заданными функциональными свойствами является материалов критически важной задачей развития В 2011 г в США была начата разработка промышленности и всей экономики стран в целом. В проекта, названного Инициативой Геном настоящее время, по мнению американских Материалов (Materials Genome Initiative (MGI)) [3]. специалистов [1], между открытием нового Цели MGI - ускоренное создание новых материала и началом его практического материалов, обладающих заданными свойствами, использования проходит более 20 лет. Это связано с что критично для достижения высокого тем, что очень часто потребители не имеют уровня конкурентоспособности промышленности достаточной информации даже об очень США и будет способствовать поддержке их перспективных материалах, работы по лидирующей роли во многих секторах исследованию и созданию технологии получения и современного материаловедения и обработки материалов необоснованно дублируются, промышленности: от энергетики до электроники, от обороны до здравоохранения. Особое внимание в MGI уделяется поддержке Труды XVIII Международной конференции прорывных исследований в теории, DAMDID/RCDL’2016 «Аналитика и управление моделировании свойств материалов и data mining как данными в областях с интенсивным средств достижения существенного прогресса в использованием данных», Ершово, 11-14 октября материаловедении, что приведет к снижению затрат 2016 121 на разработку, исследование и получение новых библиографические источники. MDF станет рычагом материалов. Задачи MGI – обеспечение разработки и для создания национальной инфраструктуры внедрения новых материалов, в том числе и за счет коллективного использования информации, включая координации исследований и предоставления разработанные в мире БД по свойствам материалов и доступа к расчетным моделям и инструментарию для информационные системы для расчета и оценки свойств и поведения материалов, а также моделирования, а также будет способствовать использования прорывных методов моделирования и организации обмена данными о материалах, в том анализа данных. Реализация проекта MGI позволит числе и еще не опубликованными. Доступность создать механизмы, способствующие обмену данных и средств расчета обеспечивается данными и знаниями о материалах не только между современной информационной и исследователями, но и между академической наукой телекоммуникационной инфраструктурой, которая и промышленностью. Основой MGI является позволяет предоставить данные исследователям Инфраструктура инноваций в материаловедении материалов для многоцелевого использования, (Materials Innovation Infrastructure), которая дополнительного анализа и проверки. Помимо NIST, обеспечивает интеграцию методов и средств среди исполнителей MDF необходимо выделить современного моделирования и экспериментальных University of Chicago, Argonne National Laboratory, исследований. Инфраструктура включает комплекс The University of Illinois, Northwestern University, взаимосвязанных обслуживающих структур и Center for Hierarchical Materials Design и т.д. объектов (в том числе и установок megascience), Репозиторий MDF сейчас включает [8], помимо составляющих и/или обеспечивающих основу многочисленных БД NIST [9], информационные функционирования материаловедения как науки и системы с результатами квантовомеханических прикладной области. На первом этапе на реализацию расчетов: AFLOW [5, 6], The Open Quantum Materials программы MGI выделено около 400 млн. долларов. Database (OQMD) [10] и т.д. В Подкомитет MGI Национального научно- технического Совета США (The National Science and 4 Программа поиска новых материалов Technology Council (NSTC)) входят представители Эта программа был ответом Евросоюза на Министерства обороны, Министерства энергетики, американскую стратегическую инициативу MGI. National Institute of Standards and Technology (NIST), Проект NoMaD [11, 12] направлен на создание National Science Foundation (NSF), National Европейских центров превосходства (European Aeronautics and Space Administration (NASA), Centres of Excellence) и предполагает разработку National Institutes of Health (NIH), United States сети БД (Materials Encyclopedia) по свойствам Geological Survey (USGS), Defense Advanced веществ и материалов (в первую очередь, Research Projects Agency (DARPA) и т.д. [4]. Среди содержащих результаты расчетов), а также средств успешных поддержанных проектов этой инициативы анализа этих данных и расчета веществ. Цель можно выделить систему AFLOW [5, 6], - ускорение разработки и использования содержащую БД с результатами материалов с заданными функциональными квантовомеханических расчетов веществ и свойствами. Программа стартовала в ноябре оснащенную компьютерным пакетом программ для 2015 г. в рамках проекта ЕС HORIZON2020 проведения таких расчетов, и открытие нового вида (объем финансирования около 5 млн. евро) [12]. высокопрочного и износостойкого стекла [7], Существенным недостатком NoMaD является осуществленного путем широкого использования ориентация на информационные ресурсы США теоретических расчетов. (главным образом, БД NIST по свойствам веществ и материалов) и информационные системы 3 Средства организации данных о с расчетными данными. В настоящее время материалах репозиторий NoMaD [13] содержит только Учитывая важность материалов для достижения результаты квантовомеханических расчетов уже высокого уровня конкурентоспособности полученных соединений. Программа NoMaD во промышленности США, в июне 2014 г. многом коррелирует с проектом Евросоюза национальный Консорциум сервисов данных Materials design at the eXascale (MaX) [14], (National Data Service (NDS)) объявил о пилотном включающим создание инфраструктуры для проекте разработки средств для организации данных проведения квантовомеханических расчетов с о материалах: The Materials Data Facility (MDF) [8], использованием высокопроизводительных поддерживаемом NIST. Этот проект является компьютерных систем (объем финансирования – ответом на инициативу MGI Белого дома по свыше 4 млн. евро). Среди исполнителей NoMaD ускорению разработки современных материалов. следует отметить ведущие организации Европы, MDF обеспечит материаловедов масштабируемым такие как Humboldt University, Fritz-Haber-Institute репозиторием для хранения экспериментальных и of the Max Planck Society, King's College London, расчетных данных, в том числе и до их публикации, University of Barcelona, Aaalto University, Max снабженных ссылками на соответствующие Planck Institute for the Structure of Dynamics of Matter, Technical University of Denmark, 122 Max Planck Computing and Data Facility, Barcelona наименее перспективными. Ориентация на Supercomputing Centre и т.д. американские БД по свойствам веществ и только квантовомеханические расчеты значительно 5 Инициатива исследования материалов снижают потенциал и возможности этих путем интеграции информации инфраструктурных проектов. Тем не менее, следует отметить, что объективной предпосылкой для Эта инициатива была предложена в 2015 г. успешной реализации предложенных в США, ЕС и японским правительством, которое создало на базе Японии инициатив являются, с одной стороны, Национального института материаловедения успехи в разработке и применении методов расчета (National Institute for Materials Science (NIMS)) свойств веществ, и, с другой стороны, наличие Center for Materials Research by Information множества баз данных по свойствам веществ и Integration [15]. В отличие от европейских материалов, разработанных в последние годы в программ созданный центр ставит своей задачей разных странах (обзор имеющихся БД в области не только широкое использование неорганический химии и материаловедения дан в квантовомеханических расчетов, но и поддержку и статье [20] и в БД IRIC (Information Resources on развитие имеющихся в Японии БД по свойствам Inorganic Chemistry) [21]). Несмотря на то, что на веществ и материалов [16], их интеграцию с создание и поддержку таких информационных зарубежными информационными системами и систем затрачены сотни миллионов долларов, их применение методов искусственного интеллекта для использование экономически выгодно, т.к. они прогноза новых веществ [17, 18]. позволяют значительно сократить затраты на разработку новых материалов за счет уменьшения 6 Анализ реализуемых в мире крупных дублирования исследований и предоставления инфраструктурных проектов химикам и материаловедам оперативной и информационного обеспечения в области достоверной информации о свойствах веществ. В материаловедения свою очередь, расчетные методы дают возможность еще до экспериментов оценить параметры веществ, Следует отметить общие тенденции в разработке указать перспективные для применений составы и систем информационного обеспечения в разработать технологию получения и обработки материаловедческих областях: материалов. Следствием решения этих задач является резкое сокращение затрат и времени на разработку и внедрение новых материалов. К создание интегрированной сети БД по сожалению, из-за введенных санкций против РФ, свойствам веществ и материалов; предполагаемой высокой цены доступа к разработка и широкое применение расчетных разрабатываемым информационным системам, методов; наличия в них информации о материалах и создание БД с расчетной информацией. технологиях двойного назначения, доступ Анализ целей и предлагаемых в вышеуказанных российских специалистов к этим информационным инициативах методов и технологий их достижения ресурсам будет крайне ограничен. Это может показывает, что наиболее перспективны проекты привести к серьезному отставанию в темпах США. Именно они позволят создать полноценную разработки и внедрения новых материалов, что инфраструктуру информационной поддержки приведет к резкому уменьшению инновационной деятельности в разработке и конкурентоспособности российской продукции, внедрении новых материалов, обеспечив науку и особенно в наукоемких отраслях. Единственный промышленность достоверными и полными путь решения этой проблемы – это создание данными о свойствах веществ и материалов и собственной инфраструктуры, обеспечивающей разнообразным инструментарием (пакеты науку, образование, промышленность, бизнес, квантовомеханических расчетов, data mining и т.д.) административные органы данными о материалах, для расчетов параметров веществ. Японская технологиях их получения и обработки, сферах инициатива более ограничена. Она основана на применения, производителях и потребителях использовании системы БД по свойствам веществ и материалов, а также средствами обработки и анализа материалов NIMS, а также использует имеющийся у накопленной информации, компьютерного исполнителей задел по применению уже известных моделирования и конструирования новых веществ и расчетных методов (например, широко известного материалов, позволяющими принимать решения о пакета квантовомеханических расчетов VASP [19]). выборе материалов для конкретных применений, Начаты работы по применению методов перспективности разработки и использования искусственного интеллекта [17, 18]. К тому же конкретного вещества, о технологических японские специалисты ограничили сферу особенностях производства, использования, деятельности материалами для электроники утилизации и т.д. материалов и т.п. Средства, (источники питания, магнитные, вложенные в такую импортозамещающую термоэлектрические и спинтронные материалы) [15]. программу, достаточно быстро окупятся за счет Проекты ЕС на их начальном этапе выглядят сокращения затрат на разработку и исследование 123 новых материалов и прибыли от реализации известных веществах, хранящуюся в БД, можно наукоемкой продукции, конкурентной на мировом прогнозировать еще не синтезированные соединения рынке. и оценивать некоторые их свойства, зная только хорошо известные параметры компонентов 7 Опыт разработки интегрированной (химических элементов или более простых информационной системы по свойствам соединений). Для решения этой задачи в ИМЕТ РАН разработана специальная информационно- неорганических веществ и материалов аналитическая система (ИАС) (рис.1), включающая Предпосылкой для успешного выполнения такого интегрированную систему БД по свойствам инфраструктурного проекта в России является опыт неорганических веществ и материалов, подсистему в разработке и интеграции БД по свойствам поиска закономерностей в данных, прогнозирования неорганических веществ и материалов, доступных из новых соединений и оценки их свойств, базу знаний, сети Интернет, также методов и программных базу прогнозов и другие подсистемы [22]. средств для компьютерного конструирования новых веществ и материалов, основанных на использовании 7.1 Интегрированная система баз данных по технологий data mining, и, в первую очередь, методов свойствам неорганических веществ и распознавания образов по прецедентам [20, 23]. материалов Следует отметить, что интерес к применению методов data mining в неорганическом Интегрированная система баз данных по материаловедении связан с объективными свойствам неорганических веществ и материалов в трудностями, возникающими при настоящее время объединяет информационные квантовомеханических расчетах еще не полученных системы, разработанные в ИМЕТ РАН [20]: по многокомпонентных неорганических веществ, фазовым диаграммам полупроводниковых систем особенно в твердой фазе. Например, для того, чтобы («Диаграмма»), по свойствам акустооптических, рассчитать электронную структуру неорганического электрооптических и нелинейнооптических веществ соединения с использованием пакета VASP [19], («Кристалл»), по ширине запрещенной зоны необходимо знать его кристаллическую структуру, неорганических веществ («Bandgap»), по свойствам т.е. нужно получить и исследовать это соединение. неорганических соединений («Фазы») и по свойствам химических элементов («Elements»), а также БД «AtomWork» по свойствам неорганических веществ, разработанную в National Institute for Materials Science (Япония), и БД ТКВ по термическим константам веществ, разработанную в ОИВТ РАН и МГУ. БД по свойствам неорганических соединений «Фазы» [25, 26] в настоящее время содержит информацию о свойствах более 52 тыс. тройных соединений (т.е. соединений, образованных тремя химическими элементами) и более 31 тыс. четверных соединений, почерпнутую из более 32 тыс. литературных источников. Она включает краткую информацию о наиболее распространенных свойствах неорганических соединений: кристаллохимических (тип кристаллической структуры с указанием температуры и давления, выше которых реализуется указанная структура, сингония, пространственная группа, число формульных единиц в элементарной ячейке, параметры кристаллической решетки) и теплофизических (тип и температура плавления, температура распада соединения в твердой или газообразной фазах и температура кипения при атмосферном давлении). Помимо этого, БД содержит информацию о сверхпроводящих свойствах Рисунок 1 Схема информационно-аналитической соединений. БД «Фазы» формируется на основе системы для конструирования неорганических анализа сведений, почерпнутых из периодических соединений изданий, справочников, монографий, отчетов, а также реферативных журналов (более половины С помощью же методов распознавания образов, источников хранятся в виде pdf-документов). Объем проанализировав имеющуюся информацию об уже БД «Фазы» превышает 25 Гбайт, и она доступна 124 зарегистрированным пользователям из сети образованных практически всеми химическими Интернет [25]. элементами. БД «Elements» [20, 26] включает информацию о 90 наиболее распространенных свойствах 7.2 Система компьютерного конструирования химических элементов: теплофизических неорганических соединений (температура плавления и кипения при 1 атм, Основу системы компьютерного стандартные теплопроводность, молярная конструирования неорганических соединений теплоемкость, энтальпия атомизации, энтропия и составляют алгоритмы и программы распознавания т.д.), размерных (ионные, ковалентные, образов по прецедентам, входящие в металлические, псевдопотенциальные радиусы, многофункциональную систему объем атома и т.д.), других физических свойствах «РАСПОЗНАВАНИЕ», разработанную в ВЦ РАН (магнитной восприимчивости, электропроводности, [39] и объединяющую, помимо широко известных твердости, плотности и т.д.), положении в методов линейной машины, линейного Периодической таблице элементов и т.д. БД дискриминанта Фишера, k-ближайших соседей, доступна из сети Интернет [26]. опорных векторов, нейросетевых и генетических БД «Диаграмма» [27, 28] содержит информацию, алгоритмов, также уникальные алгоритмы, собранную и оцененную разработанные в ВЦ РАН: алгоритмы распознавания, высококвалифицированными экспертами, о фазовых основанные на вычисления оценок, алгоритмы P-T-x-диаграммах двух- и трехкомпонентных голосования по тупиковым тестам, алгоритмы полупроводниковых систем и о физико-химических голосования по логическим закономерностям, свойствах образующихся в них фаз. Объем БД алгоритмы статистического взвешенного превышает 2 Гбайт. БД доступна голосования и т.д. В систему также интегрирована зарегистрированным пользователям из сети программа обучения ЭВМ процессу формирования Интернет [27]. понятий ConFor, разработанная в Институте БД «Bandgap» [29, 30] включает информацию кибернетики НАН Украины [38], в основу которой (более 0.7 Гбайт) о ширине запрещенной зоны более положена оригинальная организация данных в 3 тыс. неорганических веществ. БД доступна памяти ЭВМ в виде растущих пирамидальных сетей. пользователям из сети Интернет [30]. По Для отбора информативных свойств компонентов предложению японской стороны эта БД будет химических соединений в ИАС были включены интегрирована с японской БД «Computational программы, основанные на алгоритмах [39-41]. Electronic Structure Database (CompES-X)», Использование методов распознавания образов содержащей информацию об электронной структуре позволило получить прогнозы тысяч новых веществ [31]. неорганических соединений [22, 23, 29]. БД «Кристалл» [32, 33] включает информацию о свойствах (пьезоэлектрических (пьезоэлектрические коэффициенты, упругие постоянные и т.д.), 8 Проект инфраструктуры обеспечения нелинейно-оптических (нелинейно-оптические данными российских специалистов в коэффициенты, компоненты тензора Миллера и т.д.), области неорганической химии и кристаллохимических (тип кристаллической материаловедения структуры, сингония, пространственная и точечная группа, число формульных единиц в элементарной ИАС является, своего рода, пилотным проектом ячейке, параметры кристаллической решетки), для создания информационной инфраструктуры для оптических (показатели преломления, область неорганического материаловедения. В ней прозрачности и т.д.), теплофизических (температура виртуально интегрированы наиболее известные плавления, теплоемкость, теплопроводность и т.д.) и российские БД в этой области, а также начата их т.д.), более 140 акустооптических, интеграция с зарубежными информационными электрооптических и нелинейно-оптических системами. Большинство российских БД содержат веществ, собранную и оцененную ссылки на полные тексты публикаций, из которых высококвалифицированными экспертами в данной извлечена информация, хранящаяся в БД. предметной области. Объем БД превышает 4 Гбайт. Подсистема компьютерного конструирования Она имеет русско- и англоязычную версии, соединений позволяет найти закономерности в доступные зарегистрированным пользователям из информации БД и использовать их для сети Интернет [32]. прогнозирования еще не полученных соединений и БД «Inorganic Material Database – AtomWork» [34, оценки их свойств. Следует отметить, что на этапе 35] содержит информацию о более чем 82 тыс. прогнозирования используются только данные о кристаллических структур, 55 тыс. значений свойств свойствах компонентов соединений (химических материалов и 15 тыс. фазовых диаграмм. БД элементов или более простых соединений). доступна пользователям из сети Интернет [35]. Полученные прогнозы хранятся в специальной базе БД по термическим константам веществ «ТКВ» прогнозов, что расширяет функциональные [36] содержит доступную из сети Интернет возможности традиционных баз данных информацию об около 27 тыс. веществ, (пользователь получает не только известные 125 экспериментальные данные, но и прогнозы еще не ведущих издательских корпораций (Наука, Elsevier, синтезированных соединений и оценки некоторых их Springer, Wiley, American Chemical Society, American свойств). Institute of Physics, Science и т.д.), а также базы еще При разработке российского проекта не опубликованных в открытой печати сообщений инфраструктуры информационного обеспечения (ВИНИТИ, ЦИТИС и т.д.), патентные базы специалистов в области неорганического (Роспатент, Questel, USPTO и т.д.), базы материаловедения нужно учитывать все потребителей и производителей неорганических многообразие возможных запросов пользователей. материалов и т.д. Необходимо выделять средства на Вполне естественно, что запросы академических ежегодное продление лицензий для пользования ученых могут кардинально отличаться от запросов зарубежными базами и организовать единый портал инженеров-конструкторов или производителей бесплатного для российских пользователей доступа материалов. Однако общий проект информационной к ним (сейчас такие базы доступны для инфраструктуры должен включать в качестве ограниченного числа организаций). Необходимо необходимых элементов виртуально всячески поддерживать перевод в электронную интегрированную систему российских и зарубежных форму коллекций наиболее известных в мире баз данных по свойствам неорганических веществ и российских журналов, что несомненно будет материалов, технологиям их получения и обработки, способствовать повышению их авторитета и потребителям и производителям материалов и т.д., цитируемости. комплекс пакетов расчета и моделирования Оснащение исследовательских организаций материалов, пользователями которых в большинстве системами расчета необходимо начинать, в первую случаев являются академические ученые, и очередь, с обучения студентов и аспирантов виртуально интегрированную систему баз данных пользованию наиболее известными пакетами уже рассчитанных значений (рис. 2). Следует квантовомеханических, термодинамических, подчеркнуть, что технологии обработки, хранения, статистических и т.д. расчетов. К сожалению, за организации поиска необходимых сведений требуют последние четверть века отток специалистов в разработки и использования самых современных области теоретической химии сильно обескровил программных средств и создания мощных центров всемирно известные школы российских обработки данных (ЦОД). университетов и академических институтов, что значительно усложняет решение проблемы квалифицированного обучения молодых специалистов, а также использования расчетных методов. Нужно разрабатывать российские базы данных расчетных значений и интегрировать их с зарубежными информационными системами, которые сейчас еще открыто доступны в Интернет (например, [13, 30]), что позволит частично решить проблему квалифицированных расчетов веществ. Постановка экспериментов должна включать проведение или использование расчетов в качестве начального этапа исследований, что позволит сократить время и затраты на поиск и разработку новых материалов. Важным компонентом разрабатываемого инфраструктурного проекта должна стать подсистема анализа запросов пользователей, особенно, специалистов в прикладных областях. Именно она позволит выявить группы материалов, на изучение которых нужно направить экспериментальные исследования. Статистика отказов в выдаче значений того или иного параметра Рисунок 2 Схема инфраструктуры обеспечения вещества может стать стимулом к дополнительному данными российских специалистов в области экспериментальному исследованию запрашиваемого неорганической химии и материаловедения свойства. Система БД должна виртуально интегрировать наиболее важные для российских пользователей 9 Заключение фактографические БД по неорганическим веществам Переход российской экономики на и материалам (российские БД ИМЕТ РАН, ОИВТ инновационный путь развития и повышение РАН, МГУ и т.д и зарубежные БД NIMS [16], NIST конкурентоспособности продукции во многом [9], STN [42], Springer Materials [43], Materials Science определяется качеством, новизной и International (MSI) [44] и т.д.), документальные БД функциональными возможностями материалов. На 126 современном этапе развития технологий поиск, [4] Materials Genome Initiative. исследование и внедрение новых материалов требует https://www.mgi.gov/partners создания развитой инфраструктуры, включающей [5] Curtarolo S., Setyawan W., Wang S., et al. академические организации с их потенциалом AFLOWLIB.ORG: A distributed materials теоретических и экспериментальных исследований properties repository from high-throughput ab initio новых веществ, организации, ведущие прикладные calculations. Comp. Mat. Sci., 58, p.227-235, 2012. исследования по разработке и внедрению новых [6] Taylor R. H., Rose F., Toher C., et al. RESTful API материалов и технологий их получения и обработки, for exchanging materials data in the центры коллективного пользования с комплексами AFLOWLIB.org consortium. Comp. Mat. Sci., 93, дорогостоящих установок, включая объекты p. 178-192, 2014. megascience, и т.д. В последние годы в развитых [7] Сайт University of Chicago странах инициированы стратегически важные для http://www.uchicago.edu/features/microscopic_ani обеспечения технологического превосходства mals_inspire_innovative_glass_research/ проекты (MGI, MDF, NoMaD и т.п.) создания инфраструктуры для ускорения разработки и [8] National Data Service. The Materials Data Facility. внедрения новых материалов, обладающих http://www.nationaldataservice.org/mdf/ заданными функциональными свойствами. Особое [9] NIST Data Gateway. внимание в этих проектах уделено инфраструктуре http://srdata.nist.gov/gateway/gateway?dblist=0 информационного обеспечения. Российским ответом [10] Saal, J. E., Kirklin, S., Aykol, M., et al. Materials на стратегические инициативы США, ЕС, Японии в Design and Discovery with High-Throughput плане информационной инфраструктуры может Density Functional Theory: The Open Quantum являться создание федерального информационного Materials Database (OQMD), JOM. 65, p. 1501– центра, обеспечивающего специалистов 1509, 2013. информацией о свойствах веществ и материалов, [11] The Novel Materials Discovery (NOMAD) технологиях их производства, а также расчетными Laboratory. http://nomad-lab.eu/ данными, патентной информацией и т.д. В связи со [12] The Novel Materials Discovery (NOMAD) спецификой предметной области основу такого Laboratory. информационного центра коллективного http://cordis.europa.eu/project/rcn/198339_en.html пользования должна составлять распределенная [13] The NoMaD Repository. http://nomad- виртуально интегрированная сеть отечественных и repository.eu/cms/ зарубежных баз данных и баз знаний по веществам и материалам. Создание федерального [14] Materials design at the eXascale. информационного центра, интегрирующего http://cordis.europa.eu/project/rcn/198340_en.html/ информационные ресурсы в области [15] Center for Materials Research by Information материаловедения, будет способствовать резкому Integration. ускорению поиска, разработки и внедрения новых http://www.nims.go.jp/eng/research/MII- материалов, в сочетании со значительным I/index.html сокращением затрат за счет уменьшения [16] NIMS Materials Database (MatNavi). дублирования исследований и предоставления http://mits.nims.go.jp/index_en.html химикам и материаловедам оперативной и [17] Lee J., Seko A., Shitara K., Tanaka I. Prediction достоверной экспериментальной и расчетной model of band-gap for AX binary compounds by информации о веществах и материалах. combination of density functional theory calculations and machine learning techniques. Phys. Литература Rev., B93(11), p. 115104, 2016. [1] Materials Genome Initiative. Strategic Plan. [18] Toyoura K., Hirano D., Seko A., et al. Machine- National Science and Technology Council. learning-based selective sampling procedure for Committee on Technology. Subcommittee on the identifying the low-energy region in a potential Materials Genome Initiative. December 2014. 55 p. energy surface: A case study on proton conduction https://www.whitehouse.gov/sites/default/files/micr in oxides. Phys. Rev., B93(5), p. 054112, 2016. osites/ostp/NSTC/mgi_strategic_plan_- [19] VASP-site. https://www.vasp.at/ _dec_2014.pdf [20] Киселева Н.Н., Дударев В. А., Земсков В. С. [2] Калиниченко Л.А., Вольнова А.А., Гордов Е.П., Компьютерные информационные ресурсы Киселева Н.Н. и др., Проблемы доступа к неорганической химии и материаловедения. данным в исследованиях с интенсивным Успехи химии. 79(2), с. 162-188, 2010. использованием данных в России. Информатика [21] БД IRIC (Information Resources on Inorganic и ее применения, 10(1), с. 3-23, 2016. Chemistry). http://iric.imet-db.ru/ [3] Materials Genome Initiative for Global [22] Киселева Н.Н. Компьютерное конструирование Competitiveness/ June 2011. 18 p. неорганических соединений. Использование баз http://www.whitehouse.gov/sites/default/files/micr данных и методов искусственного интеллекта. osites/ostp/materials_genome_initiative-final.pdf М.: Наука, 2005. 127 [23] Киселева Н.Н., Дударев В.А., Столяренко А.В. [36] БД “ТКВ”. http://www.chem.msu.su/cgi- Интегрированная система баз данных по bin/tkv.pl?show=welcome.html/welcome.html свойствам неорганических веществ и [37] Журавлев Ю. И., Рязанов В. В., Сенько О. В. материалов. Теплофизика высоких температур, «РАСПОЗНАВАНИЕ». Математические 54(2), с. 228–236, 2016. методы. Программная система. Практические [24] Киселева Н., Мурат Д., Столяренко А. и др. База применения. М.: ФАЗИС, 2006. данных по свойствам тройных неорганических [38] Гладун В. П. Процессы формирования новых соединений «Фазы» в сети Интернет. знаний. София: СД "Педагог-6", 1995. Информационные ресурсы России, 4, с. 21-23, [39] Senko O. V. An Optimal Ensemble of Predictors in 2006. Convex Correcting Procedures // Pattern [25] БД «Фазы». www.phases.imet-db.ru Recognition and Image Analysis, 19(3), p. 465-468, [26] БД «Elements». http://phases.imet-db.ru/elements 2009. [27] Христофоров Ю. И., Хорбенко В. В., Киселева Н. [40] Yuan G.-X., Ho C.-H., Lin C.-J. An Improved Н. и др. База данных по фазовым диаграммам GLMNET for L1-regularized Logistic Regression // полупроводниковых систем с доступом из J. Machine Learning Research, 13, p. 1999-2030, Интернет. Изв. ВУЗов. Материалы электронной 2012. техники, 4, с. 50-55, 2001. [41] Yang Y., Zou H. A Coordinate Majorization [28] БД "Диаграмма". http://diag.imet-db.ru Descent Algorithm for L1 Penalized Learning // J. Statistical Computation&Simulation, 84(1), p. 1-12, [29] Киселева Н.Н., Дударев В.А., Коржуев М.А. База 2014. данных по ширине запрещенной зоны [42] Сайт STN. http://www.stn- неорганических веществ и материалов. international.de/stn_home.html?&L=snavidlizydky Материаловедение, 7, с. 3-8, 2015. faz [30] БД «Bandgap». http://www.bg.imet-db.ru [43] Сайт Springer Materials. [31] DB CompES-X. http://compes- http://materials.springer.com/welcome x.nims.go.jp/index_en.html [44] Сайт MSI. http://www.msiport.com/. [32] Киселева Н. Н., Прокошев И. В., Дударев В. А. и др. Система баз данных по материалам для Inorganic Chemistry and Materials Science электроники в сети Интернет. Неорган. Data Infrastructure for Specialists материалы, 42(3), с.380-384, 2004. [33] БД "Кристалл". http://crystal.imet-db.ru Nadezhda N. Kiselyova, Victor A. Dudarev World-wide materials science infrastructure projects [34] Xu Y., Yamazaki M., Villars P. Inorganic Materials are analyzed (MGI, MDF, NoMaD, etc.). Short overview Database for Exploring the Nature of Material. Jap. of the Russian information resources on inorganic J. Appl. Phys., 50(11), p.11RH02-1-5, 2011. chemistry and materials science is given. Infrastructure [35] БД “AtomWork”. project is proposed for Russian specialists in the domain http://crystdb.nims.go.jp/index_en.html to provide them with data. 128