<?xml version="1.0" encoding="UTF-8"?>
<TEI xml:space="preserve" xmlns="http://www.tei-c.org/ns/1.0" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://www.tei-c.org/ns/1.0 https://raw.githubusercontent.com/kermitt2/grobid/master/grobid-home/schemas/xsd/Grobid.xsd"
 xmlns:xlink="http://www.w3.org/1999/xlink">
	<teiHeader xml:lang="ru">
		<fileDesc>
			<titleStmt>
				<title level="a" type="main"></title>
			</titleStmt>
			<publicationStmt>
				<publisher/>
				<availability status="unknown"><licence/></availability>
			</publicationStmt>
			<sourceDesc>
				<biblStruct>
					<analytic>
					</analytic>
					<monogr>
						<imprint>
							<date/>
						</imprint>
					</monogr>
					<idno type="MD5">644BC8D2CBA99DC20259471C5C27EDE0</idno>
				</biblStruct>
			</sourceDesc>
		</fileDesc>
		<encodingDesc>
			<appInfo>
				<application version="0.7.2" ident="GROBID" when="2023-03-24T04:06+0000">
					<desc>GROBID - A machine learning software for extracting information from scholarly documents</desc>
					<ref target="https://github.com/kermitt2/grobid"/>
				</application>
			</appInfo>
		</encodingDesc>
		<profileDesc>
			<abstract/>
		</profileDesc>
	</teiHeader>
	<text xml:lang="ru">
		<body>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Система мониторинга загрузки суперкомпьютеров ЮУрГУ</head><p>А.Ю. Сафонов, П.С. Костенецкий, К.В. Бородулин, Ф.М. Мелехин Южно-Уральский государственный университет В Лаборатории суперкомпьютерного моделирования Южно-Уральского государственного национального исследовательского университета разработана и активно развивается система мониторинга и обработки данных с суперкомпьютеров. Система позволяет администраторам и руководителям лаборатории получать различные отчеты о состоянии суперкомпьютеров и предоставляет инструменты для быстрого разрешения возникающих проблемных ситуаций. Работа посвящена проблемам сбора и отображения статистических данных, получаемых администраторами с суперкомпьютеров ЮУрГУ.</p><p>В современном суперкомпьютерном центре одной из самых важных задач являются задачи наблюдения за эффективностью использования вычислительных ресурсов и своевременного реагирования на возможные неполадки и проблемы на суперкомпьютере. Не менее важно также постоянно следить за количеством задач в очереди, составе запрашиваемых ресурсов и иметь возможность оценить динамику изменения этих и других статистических данных за определенный период. В Лаборатории суперкомпьютерного моделирования Южно-Уральского государственного национального исследовательского университета разработана и активно развивается система сбора и отображения статистических данных о загрузке суперкомпьютеров <ref type="bibr" target="#b0">[1]</ref>.</p><p>На суперкомпьютере «Торнадо ЮУрГУ» установлено две параллельные системы хранения данных: Panasas ActiveStor 11 и Axus YB. СХД кластера используют параллельные файловые системы PanFS и Lustre соответственно. Пользователям вычислительного кластера по умолчанию доступна СХД Panasas, а Lustre используется для отдельных расчетов, требующих выделения до 40 Тб места на хранилище либо требующих iSCSI доступ (при решении задач в ОС Windows).</p><p>СХД Panasas имеет собственную встроенную систему мониторинга с широкими возможностями и надстройки над ней не требуются, в то же время мониторинг СХД на базе Lustre ведется постоянно при помощи Nagios. Хранилище на базе файловой системы Lustre как правило вызывает ошибки двух видов: 1) переход в режим «Только чтение» при аппаратных неисправностях или ошибках в файловой системе; 2) деградация производительности при заполнении хранилища более чем на 85%. Отслеживание данных неполадок осуществляется при помощи Nagios.</p><p>Одним из способов организации мониторинга является подход на основе ситуационного экрана суперкомпьютера. Основная задача ситуационного экрана при анализе данных -это предоставление актуальной информации о состоянии системы: отказы оборудования или компонентов программного обеспечения должны быть немедленно отображены на ситуационном экране <ref type="bibr" target="#b1">[2]</ref>. Однако в разных суперкомпьютерных центрах кроме решения основных задач существуют собственные требования к системе мониторинга и информационным сервисам.</p><p>Необходимость разработки собственной системы была вызвана потребностью в регулярном формировании множества специфических отчетов о загрузке суперкомпьютеров и о деятельности структурного подразделения университета. При возникновении новых требований к отчетам, процедура формирования дополнительных статистических выборок и графиков встраивается в функционал системы и в дальнейшем повторное создание аналогичного отчета многократно упрощается и ускоряется. Система строит графики и помогает системным администраторам формировать отчеты о загрузке суперкомпьютеров. Администраторам доступна функция просмотра информации о пользователях и их расчетах на суперкомпьютере, о текущей загрузке кластеров, количестве задач в очереди, информации о работающих и неработающих узлах. Также возможно автоматическое формирование отчетов о загрузке суперкомпьютеров за определенный период. Рядовым пользователям суперкомпьютера доступна информация о сво-бодных узлах в очереди, о задачах данного пользователя, как о завершенных, так и о выполняющихся. </p></div><figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_0"><head>Рис. 1 .Рис. 2 . 3 .Рис. 4 .</head><label>1234</label><figDesc>Веб-интерфейс системы мониторинга загрузки суперкомпьютеров Очередь задач SLURM настроена на хранение данных о задачах в базе данных MySQL. С помощью Django Framework информация о загрузке суперкомпьютера извлекается из базы, обрабатывается, после чего генерируется веб-страница с подготовленными для визуализации данными. Поскольку Django Framework построен по технологии MVT (Model-View-Template), он позволяет быстро разрабатывать гибкие и надежные веб-приложения, сосредотачиваясь непосредственно на реализации внутренней логики. На рис. 1 показана главная страница веб-интерфейса системы мониторинга загрузки суперкомпьютеров ЮУрГУ. На данной странице собрана основная информация, интересующая руководителя и системных администраторов Лаборатории суперкомпьютерного моделирования ЮУрГУ, как например: 1) статистика по узлам в процентном соотношении (работающие, свободные, зарезервированные для определенных пользователей, выключенные); 2) статистика по количеству задач и узлов, запрошенных в рамках этих задач: a. количество уже выполняющихся задач; b. количество задач, находящихся в очереди на расчет; c. количество заблокированных задач (например, превышено максимальное суммарное количество запрашиваемых узлов по всем задачам в очереди; или запрошена лицензия, которая в данный момент уже используется в другом расчете); d. узлы, которые освобождаются и в скором времени вернутся обратно в очередь; 3) пользователи, которые находятся «онлайн» в данный момент времени (то есть запустившие терминал удаленного доступа и работающие в нем); 4) динамика загруженности суперкомпьютера за определенный период; 5) вывод консольной команды «sudo squeue», показывающей подробную информацию о всех задачах, работающий в данный момент с очередью задач. Пример графика загрузки суперкомпьютера по неделям для квартального отчета Рис. Пример отчета о текущем состояние узлов суперкомпьютера Кроме вышеописанных возможностей, система позволяет формировать отчеты с ограниченным доступом. На рис. 2 можно увидеть динамику изменения загруженности суперкомпьютера за определенный период, на рис. 3 представлен отчет о текущем состоянии узлов суперкомпьютера, а на рис. 4 -пример вывода информации о текущих и завершившихся расчетах выбранного пользователя суперкомпьютера за указанный период. Пример вывода информации о текущих и завершившихся расчетах выбранного пользователя суперкомпьютера за указанный период Часто перед администратором стоит задача организовать формирование новых видов отчетов о загрузке суперкомпьютеров. Обычно это вызвано появлением новых требований к отчету подразделения в рамках программы развития Национального исследовательского университета, либо появлением новых сервисов на базе суперкомпьютеров. Создание системы многократно упростило данную задачу, позволив свести задачу к написанию нового модуля в рамках системы мониторинга. Например, в 2015 году был добавлен учет ресурсов, занятых под систему Персональный Виртуальный Компьютер [3,4,5], а также учет загрузки динамически выделенных частей суперкомпьютера [6].Литература 6. Мелехин Ф.М., Бородулин К.В., Костенецкий П.С. Разработка системы динамического разделения вычислительных ресурсов суперкомпьютера на изолированные части // Научный сервис в сети Интернет: многообразие суперкомпьютерных миров: Труды Международной суперкомпьютерной конференции (22-27 сентября 2014 г., Новороссийск). М.: Изд-во МГУ, 2014.</figDesc></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0"><head></head><label></label><figDesc></figDesc><graphic coords="3,166.56,271.06,262.70,243.56" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0"><head></head><label></label><figDesc></figDesc><graphic coords="4,100.90,70.90,394.03,282.97" type="bitmap" /></figure>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" xml:id="foot_0">Суперкомпьютерные дни в России 2015 // Russian Supercomputing Days 2015 // RussianSCDays.org</note>
		</body>
		<back>
			<div type="annex">
<div xmlns="http://www.tei-c.org/ns/1.0"><head>A monitoring system for supercomputers of SUSU</head><p>Alexander Safonov, Pavel Kostenetskiy, Kirill Borodulin and Fedor Melekhin Keywords: supercomputer, management, slurm, mysql A new system capable of monitoring and processing data for the Supercomputer Simulation Laboratory of South Ural State University is described. This system allows administrators and managers to create many different reports and provides tools to robust reaction to problems of an urgent character. This article is devoted to issues concerning with collecting and visualizing statistical data obtained from supercomputers.</p></div>			</div>
			<div type="references">

				<listBibl>

<biblStruct xml:id="b0">
	<monogr>
		<author>
			<persName><forename type="first">А</forename><forename type="middle">Ю</forename><surname>Сафонов</surname></persName>
		</author>
		<author>
			<persName><forename type="first">П</forename><surname>Костенецкий</surname></persName>
		</author>
		<title level="m">С. Система сбора и отображения статистики о загрузке суперкомпьютеров ЛСМ ЮУрГУ / Параллельные вычислительные технологии (ПаВТ&apos;2015): труды международной научной конференции (30 марта -3 апреля 2015 г</title>
				<imprint>
			<publisher>Издательский центр ЮУрГУ</publisher>
			<date type="published" when="2015">2015</date>
			<biblScope unit="page">516</biblScope>
		</imprint>
	</monogr>
	<note>г. Екатеринбург</note>
</biblStruct>

<biblStruct xml:id="b1">
	<monogr>
		<title level="m" type="main">Ситуационный экран суперкомпьютера // Открытые системы</title>
		<author>
			<persName><forename type="first">В</forename><surname>Воеводин</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2014">2014</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b2">
	<analytic>
		<author>
			<persName><forename type="first">В</forename><forename type="middle">И</forename><surname>Козырев</surname></persName>
		</author>
		<author>
			<persName><forename type="first">П</forename><surname>Костенецкий</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Опыт использования VDI-системы «Персональный виртуальный компьютер» в ЮУрГУ // Научный сервис в сети Интернет: поиск новых решений: Труды Международной суперкомпьютерной конференции (17-22 сентября 2012 г</title>
				<imprint>
			<publisher>Изд-во МГУ</publisher>
			<date type="published" when="2012">2012</date>
			<biblScope unit="page" from="285" to="286" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b3">
	<monogr>
		<author>
			<persName><forename type="first">П</forename><forename type="middle">С</forename><surname>Костенецкий</surname></persName>
		</author>
		<author>
			<persName><forename type="first">А</forename><forename type="middle">И</forename><surname>Семенов</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Л</forename><forename type="middle">Б</forename><surname>Соколинский</surname></persName>
		</author>
		<title level="m">Создание образовательной платформы &quot;Персональный виртуальный компьютер&quot; на базе облачных вычислений // Научный сервис в сети Интернет: экзафлопсное будущее: Труды Международной суперкомпьютерной конференции</title>
				<imprint>
			<publisher>Издательство МГУ</publisher>
			<date type="published" when="2011">2011</date>
			<biblScope unit="page" from="374" to="377" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b4">
	<monogr>
		<author>
			<persName><forename type="first">П</forename><forename type="middle">С</forename><surname>Костенецкий</surname></persName>
		</author>
		<author>
			<persName><forename type="first">А</forename><surname>Семенов</surname></persName>
		</author>
		<title level="m">Организация виртуальных персональных компьютеров студентов на базе суперкомпьютера // Параллельные вычислительные технологии (ПаВТ&apos;2011): Труды международной научной конференции (28 марта -1 апреля 2011 г</title>
				<imprint>
			<publisher>Издательский центр ЮУрГУ</publisher>
			<date type="published" when="2011">2011</date>
			<biblScope unit="page">699</biblScope>
		</imprint>
	</monogr>
	<note>г. Москва</note>
</biblStruct>

				</listBibl>
			</div>
		</back>
	</text>
</TEI>
