Визуальная аналитика многомерных динамических данных © Д.Д. Попов1 © И.Е. Мильман1 © В.В. Пилюгин1 © А.А. Пасько2 1 Национальный исследовательский ядерный университет «МИФИ», Москва, Россия 2 Британский национальный центр компьютерной анимации при университете Борнмута, Борнмут, Великобритания dpopovmephi@gmail.com igalush@gmail.com VVPilyugin@mephi.ru apasko@bournemouth.ac.uk Аннотация перспективные методы визуальной аналитики. Под визуальной аналитикой понимается решение задач В статье рассматривается задача анализа изменения анализа данных с использованием способствующего некоторых объектов. Каждый объект интерактивного визуального интерфейса. Этот характеризуется набором из n численных термин ввёл Джеймс Томас (James Thomas) в [3], чем параметров. Инструментом проведения анализа обратил внимание научной общественности на роль является метод визуализации. Получение визуального представления данных в решении интересующих аналитика суждений о исследовательских задач. рассматриваемых объектах осуществляется за Одной из форм визуальной аналитики является несколько шагов. На первом шаге строится решение задач анализа данных методом геометрическая интерпретация исходных данных. визуализации. Теоретические обобщения этого Затем построенная математическая модель метода на примере научных данных рассмотрены в подвергается ряду преобразований. Эти работе [7]. Этот метод заключается в преобразования соответствуют решению первой последовательном, в общем случае многократном, задачи метода визуализации – непосредственно решении двух задач: визуализации исходных данных. Далее человеку 1. задачи визуализации исходных данных; предлагается провести анализ полученных 2. задачи анализа полученных графических изображений и интерпретировать результаты по изображений с последующей отношению к рассматриваемым объектам. Иными формулировкой суждений относительно словами, решение задачи анализа осуществляется с исходных данных. помощью пространственного моделирования исходных данных и последующего исследования В данной работе рассмотрен ряд вопросов теории аналитиком построенных пространственных и практики дальнейшего развития этого метода объектов. применительно к анализу многомерных Предложен алгоритм решения задачи. Описана динамических данных. Здесь многомерными разработанная интерактивная прикладная программа динамическими данными мы называем числовые визуализации, реализующая этот алгоритм. данные, представляемые в табличном виде. Они Продемонстрировано, как в процессе работы с описывают некоторые изменения состояния программой пользователь может построить рассматриваемой совокупности объектов, суждения об образовании и разрушении кластеров и происходящие с течением времени. сгустков из объектов, а также найти инварианты в изменении исходных данных. 2 Подходы к визуализации многомерных данных 1 Введение За последние 30 лет появилось большое Среди различных методов анализа данных в количество научных статей и книг, посвящённых настоящее время важное место занимают подходам к визуализации. Преимущественно данную тему освещают зарубежные авторы. Труды XVIII Международной конференции Найдены публикации европейских и американских DAMDID/RCDL’2016 «Аналитика и управление исследователей, которые датируются 70-ми, 80-ми данными в областях с интенсивным годами XX века. Отечественные учёные активно использованием данных», Ершово, 11-14 октября подключились к изучению данного вопроса 2016 51 значительно позже (основной информационный выявления схожих объектов среди рассматриваемой массив российского авторства относится к 2000-2005 совокупности. Изучается, как изменяются множества гг.). подобных объектов, а также, что остаётся Среди работ об анализе многомерных неизменным с течением времени. динамических данных можно обнаружить большое количество статей посвящённых динамике 3 Постановка задачи наноструктур, как, например, [1] и [2]. В [5] проводится визуальный анализ свойств Пусть имеется множество из m объектов, каждый пространственно-временных структур. Данные об из которых характеризуется n параметрами. объектах, указанных в этих статьях, имеют Мы предполагаем, что в рамках рассматриваемой трёхмерную геометрическую интерпретацию. Также задачи исходно задано k таблиц вида: в [5] констатируется существование проблемы Таблица 1 j-ая таблица с данными об объектах визуализации данных, имеющих размерность более Параметр 1 Параметр 2 … Параметр n 41, адекватной восприятию пользователя. Нас будут Объект 1 … интересовать пространства размерности больше 3. Объект 2 … В [8] предложен способ визуализации … Объект m … … … … … многомерных данных о состоянии пациента. Производится анализ одного объекта, Каждая таблица содержит значения параметров характеризующегося множеством (мощность этого объектов в некоторый момент времени. То есть j-ая множества > 3) числовых параметров, значения таблица содержит данные для момента времени . которых изменяются с течением времени. Метод, описываемый в статье, направлен на решение задачи При этом будем считать, что ⋯ . – анализа изменений множества многомерных значение l-ого параметра i-ого объекта в объектов. При чём наибольший практический соответствующий j-ой таблице момент времени интерес представляют множества большой ( 1, , 1, , 1, ). размерности. В работе [4] специфика визуализируемых 3.1 Геометризация данных многомерных динамических данных заключается в Для решения задачи анализа перейдём к её следующем: 2 или 3 числовые компоненты этих геометрической интерпретации. Будем считать, что данных имеют пространственную природу. В исходные данные являются точками многомерного русскоязычных трудах также рассматриваются способы визуального анализа данных, имеющих евклидова пространства с заданной метрикой такую особенность. Рассматриваемые в них , . При этом: программные комплексы называются  Строка таблицы интерпретируется как точка геоинформационными системами (ГИС). В ГИС многомерного евклидова пространства. каждому объекту ставится в соответствие некоторый  Столбцы таблиц интерпретируются как геометрический образ, изображающийся на плоской координаты точек многомерного евклидова или объёмной карте местности. В качестве таких пространства. геометрических образов могут выступать круги,  Расстояние в евклидовом пространстве квадраты, шары, кубы, линии, показывающие трактуется как мера различия объектов. траектории движения исследуемых объектов. Используя введённое в пространстве расстояние, Числовые компоненты данных, не пространственной можем выделить подмножества точек: сгустки и природы представляются в отдельных окнах кластеры. Определения этих подмножеств даны в [6]. визуального пользовательского интерфейса либо Координаты точек известны в моменты времени поочерёдно, в соответствии с запросом пользователя, отражаются на карте местности за счёт изменения , ,…, . оптических параметров геометрических объектов Введём понятие геометрического процесса. (например, цвет, прозрачность) или их размеров, Геометрический процесс – это множество точек формы. В данной статье числовые характеристики пространства, координаты которых зависят от объектов имеют произвольную природу. времени. Таким образом, изначально имеем Указанные выше программы и методы анализа дискретный геометрический процесс . многомерных динамических данных, задан на множестве , ,…, . предполагающие их использование, различаются не , ,…, , только моделями исходных данных и подходами к их где - n-мерная точка. визуализации. Упомянутые различия обусловлены , ,…, , поставленными задачами анализа этих данных. Нас будет интересовать исследование данных с целью 1 В случае данных, имеющих размерность 4 в задают координаты точек привычного для человека качестве графической интерпретации выступают трёхмерного пространства, и точки с одинаковым изоповерхности, то есть 3 числовые характеристики значением 4-го параметра выделяют одним цветом. 52 Рисунок 1 Метод визуализации 𝑗𝑗 где 𝑝𝑝𝑖𝑖𝑙𝑙 �𝑡𝑡𝑗𝑗 � = 𝑥𝑥𝑖𝑖𝑙𝑙 – l-ая координата i-ой точки. В случае требования непрерывности 𝑓𝑓𝑖𝑖𝑙𝑙 в результате интерполяции исходного дискретного Для каждой пары точек определено расстояние геометрического процесса получаем непрерывный 𝜌𝜌 �𝑝𝑝𝑖𝑖1 �𝑡𝑡𝑗𝑗 �, 𝑝𝑝𝑖𝑖2 �𝑡𝑡𝑗𝑗 �� ≥ 0, 𝑖𝑖1 , 𝑖𝑖2 = 1, 𝑚𝑚, 𝑖𝑖1 ≠ 𝑖𝑖2 геометрический процесс 𝑃𝑃(𝑡𝑡). 𝜌𝜌�𝑝𝑝𝑖𝑖 , 𝑝𝑝𝑗𝑗 � ≥ 0 Пусть 𝑓𝑓𝑖𝑖𝑙𝑙 является алгебраическим двучленом, Стоит отметить, что расстояние, то есть метрику тогда при любом 𝑡𝑡 ∈ [𝑡𝑡ℎ , 𝑡𝑡ℎ+1 ] , 1 ≤ ℎ ≤ 𝑘𝑘 − 1, fil евклидова пространства, целесообразно выбирать будет рассчитываться по формуле: исходя из известных особенностей исходных 𝑝𝑝𝑖𝑖𝑙𝑙 (𝑡𝑡ℎ+1 ) − 𝑝𝑝𝑖𝑖𝑙𝑙 (𝑡𝑡ℎ ) данных. Существует множество исследовательских 𝑓𝑓𝑖𝑖𝑙𝑙 (𝑡𝑡) = 𝑝𝑝𝑖𝑖𝑙𝑙 (𝑡𝑡ℎ ) + (𝑡𝑡 − 𝑡𝑡ℎ ). 𝑡𝑡ℎ+1 − 𝑡𝑡ℎ работ, описывающих ситуацию, когда в процессе изучения некоторого набора данных эмпирически Интерполяция алгебраическим двучленом или кусочно-линейная интерполяция является самым подбиралась метрика, которая наилучшим образом простым видом интерполяции для которого справляется с поставленной задачей анализа, выполняется свойство непрерывности. например с задачей кластеризации. В разработанной программе, подробно о которой будет сказано позже, За неимением априорной информации об имеется возможность использовать евклидову изменении исходных данных с течением времени метрику, расстояние Минковского, расстояние выбор способа интерполяции делается в сторону Чебышева, в частности, и расстояние Махаланобиса. кусочно-линейной, так как она не требует сложных вычислений и при достаточно малых интервалах 4 Преобразования геометрических времени между имеющимися данными хорошо описывает наблюдающуюся зависимость. процессов Для решения поставленной задачи возникает 4.2 Дискретизация непрерывных геометрических необходимость в преобразованиях исходного процессов дискретного геометрического процесса. Пусть 𝑃𝑃(𝑡𝑡) – непрерывный геометрический 𝑃𝑃�𝑡𝑡𝑗𝑗 � представляет собой упорядоченный по процесс, тогда 𝑃𝑃(𝑡𝑡0 ) – его временное сечение. 𝑡𝑡0 времени набор описаний известных состояний принадлежит области определения 𝑃𝑃(𝑡𝑡). множества исследуемых объектов. Сами же объекты Из 𝑃𝑃(𝑡𝑡) можно построить дискретный существуют и изменяются непрерывно. Исходя из геометрический процесс, заданный в 𝑘𝑘′ моментах этого факта, необходимо иметь инструмент времени. Для этого выберем моменты времени преобразования дискретного процесса в ф1 , ф2 , … , ф𝑘𝑘′ и определим 𝑃𝑃′(фℎ ) как совокупность непрерывный. Таким инструментом служит временных сечений 𝑃𝑃(𝑡𝑡): 𝑃𝑃′(фℎ ) ≔ {𝑃𝑃(фℎ )|фℎ ∈ интерполяция. {ф1 , ф2 , … , ф𝑘𝑘′ }}. 4.1 Интерполяция 5 Метод визуализации в рамках Задача интерполяции состоит в поиске такой решаемой задачи функции 𝐹𝐹 из заданного класса функций, что: 𝐹𝐹�𝑡𝑡𝑗𝑗 � = 𝑃𝑃(𝑡𝑡𝑗𝑗 ), где 𝑡𝑡𝑗𝑗 ∈ 𝑇𝑇. Метод визуализации подразумевает последовательное решение двух задач, Так как представленных на рисунке 1. 𝑃𝑃�𝑡𝑡𝑗𝑗 � = �𝑝𝑝1 �𝑡𝑡𝑗𝑗 �, 𝑝𝑝2 �𝑡𝑡𝑗𝑗 �, … , 𝑝𝑝𝑚𝑚 �𝑡𝑡𝑗𝑗 ��, Для описания первой задачи вводится важнейшее понятие метода – пространственная сцена. 𝑝𝑝𝑖𝑖 �𝑡𝑡𝑗𝑗 � = �𝑝𝑝𝑖𝑖1 �𝑡𝑡𝑗𝑗 �, 𝑝𝑝𝑖𝑖2 �𝑡𝑡𝑗𝑗 �, … , 𝑝𝑝𝑖𝑖𝑛𝑛 �𝑡𝑡𝑗𝑗 ��, Пространственная сцена – это совокупность то поиск 𝐹𝐹 заключается в поиске таких 𝑓𝑓𝑖𝑖𝑙𝑙 , пространственных объектов с заданными принадлежащих заданному классу, что геометрическими и оптическими параметрами. Описание геометрических параметров объектов 𝑓𝑓𝑖𝑖𝑙𝑙 �𝑡𝑡𝑗𝑗 � = 𝑝𝑝𝑖𝑖𝑙𝑙 �𝑡𝑡𝑗𝑗 �. сцены, например, их форма, размеры, 53 пространственное расположение называется где 𝑆𝑆𝑆𝑆ℎ𝐶𝐶1 (𝑡𝑡) = ⋯ = 𝑆𝑆𝑆𝑆ℎ𝐶𝐶𝑚𝑚 (𝑡𝑡) = 𝑆𝑆𝑆𝑆ℎ𝐶𝐶 – цвета сфер, геометрической моделью сцены. Оптической 𝑆𝑆𝑆𝑆ℎ𝐶𝐶 так же в процессе решения задачи задаётся моделью сцены называется описание оптических аналитиком, 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶1 (𝑡𝑡), … , 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑒𝑒 (𝑡𝑡) – цвета цилиндров. параметров, например, цвет, прозрачность объектов. Значение цвета в кодировке RGB рассчитывается Решение первой задачи подразумевает по формулам: построение отображения исходных данных на с�𝑝𝑝l1 (𝑡𝑡), 𝑝𝑝l2 (𝑡𝑡)� пространственную сцену. Успех проведения анализа 𝑅𝑅(𝑡𝑡) = 255 �1 − �, напрямую зависит от того насколько удачным 𝑑𝑑 окажется построенное отображение. На этом этапе необходимо выбрать такие модели, которые бы с�𝑝𝑝l1 (𝑡𝑡), 𝑝𝑝l2 (𝑡𝑡)� способствовали выявлению закономерностей в 𝐺𝐺(𝑡𝑡) = 150 , данных о рассматриваемых объектах. С одной 𝑑𝑑 стороны они должны соответствовать целям с�𝑝𝑝l1 (𝑡𝑡), 𝑝𝑝l2 (𝑡𝑡)� визуального анализа, например, анализа формы или 𝐵𝐵(𝑡𝑡) = 255 . взаимного расположения, а с другой обеспечивать 𝑑𝑑 возможность последующей интерпретации 5.4 Рендеринг результатов визуального анализа по отношению к рассматриваемым объектам. Понятие пришло из дисциплины машинная В рамках рассматриваемой задачи задание графика. Результатом рендеринга является параметров сцены, атрибутов визуализации и проекционное изображение 𝐼𝐼 сцены 𝑆𝑆. получение изображений или анимационных фильмов Каждому 𝑡𝑡 соответствует пространственная происходит до тех пор, пока аналитик не рассмотрит сцена, а значит и проекционное изображение: достаточное их количество для формирования 𝐼𝐼(𝑡𝑡) = 𝐼𝐼(𝑆𝑆(𝑡𝑡), 𝐴𝐴(𝑡𝑡)), некоторого суждения об изменении взаимного расположения заданного множества точек с 𝐴𝐴(𝑡𝑡) – атрибуты визуализации: камера, течением времени. Атрибуты освещение, размер получаемого изображения и другие. Рассмотрим подробнее процесс визуализации исходных данных. 6 Описание алгоритма решения задачи 5.1 Задание динамических исходных данных Алгоритм решения задачи состоит из следующих этапов: Задаётся дискретный геометрический процесс 𝑃𝑃(𝑡𝑡𝑗𝑗 ), для которого будет проводиться визуализация. 1. ввод динамических исходных данных; 2. их интерполяция и получение непрерывного 5.2 Фильтрация геометрического процесса; На этом шаге исходные данные проходят 3. задание 𝑑𝑑 и статических параметров сцены: предварительную обработку. радиус сфер, радиус цилиндров, Для решения поставленной задачи исходный подпространство для проекции, цвет сфер; дискретный процесс 𝑃𝑃(𝑡𝑡𝑗𝑗 ) линейно интерполируется, 4. построение непрерывного как описано в 4.1. В результате фильтрации пространственного процесса, получается непрерывный процесс 𝑃𝑃(𝑡𝑡). соответствующего непрерывному геометрическому процессу, с 5.3 Мэппинг использованием заданных статических параметров; На этом этапе исходным данным ставится в соответствие динамическая пространственная сцена 5. построение временных сечений 𝑆𝑆(𝑡𝑡) =< 𝐺𝐺(𝑡𝑡), 𝑂𝑂(𝑡𝑡) > , где 𝐺𝐺(𝑡𝑡) – описание непрерывного пространственного процесса, геометрии сцены, а 𝑂𝑂(𝑡𝑡) – описание оптических то есть его дискретизация; параметров сцены. 6. задание камеры и других атрибутов визуализации для рендеринга; В каждый момент времени 𝑡𝑡, 𝑆𝑆(𝑡𝑡) соответствует 𝑃𝑃(𝑡𝑡), 𝑡𝑡 ∈ [𝑡𝑡1 , 𝑡𝑡𝑘𝑘 ]. 7. построение проекционных изображений дискретного пространственного процесса; 𝐺𝐺(𝑡𝑡) = {𝑆𝑆𝑆𝑆ℎ1 (𝑡𝑡), … , 𝑆𝑆𝑆𝑆ℎ𝑚𝑚 (𝑡𝑡), 𝐶𝐶𝐶𝐶𝐶𝐶1 (𝑡𝑡), … , 𝐶𝐶𝐶𝐶𝐶𝐶𝑒𝑒 (𝑡𝑡)}, 8. дальнейшее сохранение проекционных где 𝑆𝑆𝑆𝑆ℎ𝑖𝑖 (𝑡𝑡) – сфера, соответствующая точке 𝑝𝑝𝑖𝑖 (𝑡𝑡); изображений в галерею сечений или 𝐶𝐶𝐶𝐶𝐶𝐶𝑗𝑗 (𝑡𝑡) – цилиндр, соединяющий 2 сферы. Цилиндры создание анимационного фильма; соединяют только такие сферы 𝑆𝑆𝑆𝑆ℎ𝑖𝑖1 (𝑡𝑡), 𝑆𝑆𝑆𝑆ℎ𝑖𝑖2 (𝑡𝑡), В случае, если аналитик не может сделать для соответствующих точек которых выполняется интересующего его суждения относительно с �𝑝𝑝𝑖𝑖1 �𝑡𝑡𝑗𝑗 �, 𝑝𝑝𝑖𝑖2 �𝑡𝑡𝑗𝑗 �� ≤ 𝑑𝑑, 𝑑𝑑 – некоторая константа, исходных данных по полученным проекционным выбор которой в процессе решения задачи изображениям, алгоритм предусматривает возвраты осуществляется аналитиком. на этапы 3 и 6. Вышеописанный алгоритм 𝑂𝑂(𝑡𝑡) = {𝑆𝑆𝑆𝑆ℎ𝐶𝐶1 (𝑡𝑡), … , 𝑆𝑆𝑆𝑆ℎ𝐶𝐶𝑚𝑚 (𝑡𝑡), 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶1 (𝑡𝑡), … , 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑒𝑒 (𝑡𝑡)}, представлен на рисунке 2. 54 Эта программа позволяет аналитику совершать следующие действия: • Ввод исходных данных (описание дискретного геометрического процесса). Осуществляется один раз при начале работы с программой. • Кусочно-линейная интерполяция дискретного геометрического процесса. • Построение динамической сцены, соответствующей непрерывному геометрическому процессу, и её анимационная визуализация. Графическое проецирование выполняется в окне 3ds Max с помощью стандартного рендерера. • Получение информации о точках. Информацию о точках можно получать в виде таблицы, строки которой соответствуют каждой из отображаемых точек, а столбцы — их координатам. При этом, строки таблицы закрашены тем цветом, которым закрашены точки, т.е. в зависимости от цвета можно определять к какому подмножеству относится данная точка. Эти таблицы можно получать для каждого рассматриваемого момента времени. • Измерение максимального внутрикластерного расстояния между двумя Рисунок 2 Алгоритм решения задачи точками (в исходном n-мерном пространстве). Следует отметить, что важным для практики • Задание параметров сцены. случаем является анализ статических многомерных данных. Нетрудно видеть, что анализ статических Параметрами сцены являются: радиус сфер, многомерных данных можно рассматривать как поставленных в соответствие исходным частный случай анализа динамических многомерных точкам, их цвет, радиус цилиндров и данных. Он соответствует исходному дискретному трёхмерное проекционное пространство. геометрическому процессу, заданному в некоторый Указанные параметры задаются в начале (единственный) момент времени, то есть 𝑇𝑇 = {𝑡𝑡1 }. работы программы, их можно изменять в процессе анализа. Алгоритм предусматривает взаимодействие аналитика и компьютера. Предлагается следующее • Использование стандартных средств 3ds Max распределение функций между ними: для работы с пространственной сценой. Так, например, есть возможность использовать • компьютер в процессе решения задачи следующие средства: анализа осуществляет функции расчёта расстояний, построения проекций и графиков а) аффинные преобразования сцены; зависимости координат от времени; б) наложение разнообразных фильтров • аналитик осуществляет зрительное на изображение; восприятие проекционного изображения на в) преобразование оптических мониторе, анализирует взаимное характеристик сцены. расположение многомерных точек, выделяет • Объединение точек в подмножество. подмножества и задаёт параметры Каждому подмножеству даётся цвет, который визуализации. в дальнейшем будет обозначать данное Для реализации данного алгоритма была подмножество во время работы программы. разработана соответствующая интерактивная • Построение и сохранение полученных программа. Она реализована на базе программного графических проекций многомерных точек. продукта Autodesk 3ds Max, с использованием внутреннего интерпретируемого языка MAXScript. При анализе удалённых точек важным Так же использовалась библиотека, написанная на является то, какие именно координаты вносят языке C# в Visual studio 2013. больший вклад в расстояние — происходит ли это за счёт всех координат или за счёт 55 большого отличия только нескольких наблюдение может послужить причиной более координат. Для определения этого, детального изучения деятельности этой организации. предлагается строить графические проекции Также для исследователя важны изменения, исходного множества (𝑝𝑝𝑖𝑖𝑙𝑙 , 𝑝𝑝𝑖𝑖𝑙𝑙 ) и, меняя l, происходящие внутри одного сгустка или кластера. просматривать все такие проекции. Если в нём присутствуют точки, для которых с • Создание анимационного фильма. течением времени близость к другим точкам кластера резко изменяется, т.е. они быстро стремятся • Построение графиков зависимости координат покинуть кластер или наоборот приближаются к точек от времени. другим точкам, то соответствующие организации При проецировании многомерных точек на также попадают под пристальный контроль. В трёхмерное пространство, особенно в случае разработанной программе аналитик фиксирует эти большой размерности, проекции точек могут точки, наблюдая за изменением цвета цилиндров, оказаться очень близко друг к другу. Для соединяющих сферы. того, чтобы различить близкие сферы на получаемых изображениях аналитику предлагается воспользоваться такими возможностями изменения пространственной сцены как задание радиусов сфер и цилиндров. Уменьшив их, пользователь программы может более детально изучить точки, проекции которых оказались на малых расстояниях. Кроме того, в случае, если две различные многомерные точки проецируются в одну точку трёхмерного пространства, программа в процессе построения пространственной сцены немного сместит центры соответствующих сфер друг относительно друга и раскрасит их в цвет, Рисунок 3 Кадры полученного анимационного отличный от цвета выбранного для сфер фильма сцены по умолчанию. Было замечено, что для одной из построенных 7 Пример использования разработанной моделей сцен (рисунок 4) наблюдается следующая закономерность. Большинство сфер, за исключением программы выделенных белыми окружностями на рисунке, С помощью созданной программы был лежат в одной плоскости. произведён анализ 81 кредитной организации. Данные представляли собой ежемесячные отчёты этих организаций по 9 показателям за 13 месяцев 2013-2014 гг. Данные за первый отчётный месяц соответствуют 𝑡𝑡 = 1, за последний – 𝑡𝑡 = 13. Исследовалась принадлежность кредитных организаций в их геометрической интерпретации к сгусткам и кластерам, что позволяет судить об их схожести. На рисунке 3 приведён ряд изображений, Рисунок 4 Проекционные изображения позволяющих сделать вывод, что за промежуток пространственной сцены времени 𝑡𝑡 ∈ [7,8] удалённая точка, соответствующая Это позволило выделить зависимость между выделенной белой окружностью сфере, тремя финансовыми показателями организаций: присоединилась к сгустку. X – прощёная задолженность в кредитном Как отмечается в [6], рассматриваемая в примере портфеле, задача, актуальна при проведении аудита кредитных Y – выпущенные облигации, организаций. Априорно аналитик знает «хорошие» Z – активы нетто. организации или же выделяет их в процессе анализа. Например, в первом приближении за множество Она описывается уравнением плоскости: «хороших» можно принять те, соответствующие 2,231𝑋𝑋 − 72,672𝑌𝑌 + 20,3624𝑍𝑍 − 2,58513 = 0 точки которых принадлежат одному кластеру. Далее исследуются изменения, происходящие с этим множеством. Например, какая-то точка покинула или Выделенные белыми окружностями сферы и присоединилась к выделенному кластеру. соответствующие им кредитные организации этой Организация, соответствующая этой точке, попадает зависимости не подчиняются. Зависимость имеет под особое внимание аналитика, сделанное им место при 𝑡𝑡 ∈ [1,9] ∪ [12,13]. 56 Заключение [4] Wallner G. PLATO: A visual analytics system for gameplay data // Computers&Graphics. – 2014. – Итак, в рамках данной работы: №38. – P. 341-356.  Были созданы математические модели [5] Бондарев А.Е. Оптимизационный анализ исходных данных, операций над ними. нестационарных пространственно-временных  Разработан алгоритм решения задачи, на его структур с применением методов визуализации / основе написана программа. А.Е. Бондарев // Научная визуализация. – 2011. –  На примере экономических показателей том 3. – №2. – С. 1-11. кредитных организаций продемонстрирован [6] Мильман И. Е. Анализ данных о деятельности анализ изменения подобия, а так же кредитных организаций с использованием возможность поиска инвариантов программы интерактивного визуального анализа геометрических процессов с помощью многомерных данных / И. Е.Мильман [и др.] // разработанной программы. Научная визуализация. – 2015. – том 7. – №1. – С. 45-64. Инвариантами здесь называются такие свойства [7] Пилюгин В. В. Научная визуализация как метод исследуемых данных, которые остаются анализа научных данных / В. В. Пилюгин [и др.] неизменными либо на всём промежутке времени, // Научная визуализация. – 2012. – том 4. – №4. – либо на некоторой его части. В приведённом С. 56-70. примере неизменной на выделенных отрезках [8] Хачумов В. М. Разработка новых методов времени остаётся зависимость трёх координат – непрерывной идентификации и показателей финансовых организаций. прогнозирования состояния динамических В качестве дальнейшего развития объектов на основе интеллектуального анализа функциональных возможностей рассматриваются данных / В. М. Хачумов, А. Н. Виноградов // различные способы интерполяции дискретных Математические методы распознавания образов: геометрических процессов, разработка 13-я Всероссиийская конференция. пользовательского инструментария, позволяющего Ленинградская обл., г. Зеленогорск, 30 сентября производить дополнительные построения в - 6 октября 2007г. Сборник докладов. – 2007. – С. пространственной сцене. Например, предоставление 548-550 возможности построения плоскостей, сфер и других геометрических примитивов. Visual analytics В настоящей работе не представлены of multidimensional dynamic data классические методы анализа многомерных данных, предполагающие численное моделирование и Dmitry D. Popov, Igal E. Milman, Victor V. Pilyugin, автоматический интеллектуальный анализ без Alexander A. Pasko участия человека. Тем не менее в настоящее время This work deals with a problem of analysis of a time авторами изучаются эти подходы с целью variant object. Each object is characterized by a set of последующего развития системы до уровня numerical parameters. The visualization method is used «численно-визуальной» системы анализа данных. to conduct the analysis. Insights of interest for the analyst about the considered objects are obtained in several Литература steps. At the first step, a geometric interpretation of the initial data is introduced. Then, the introduced [1] Grottel S. Visual Verification and Analysis of mathematical model undergoes several transformations. Cluster Detection for Molecular Dynamics / S. These transformations correspond to solving the first Grottel [et al.]. // IEEE Transactions on problem of the visualization method, in particular Visualization and Computer Graphics. – 2007. – obtaining visual representations of data. The next step is Vol. 13. – №6. – P. 1624-1631. for the analyst to analyse the generated visual images and [2] Sourina O., Korolev N. Visual Mining and Spatio- to interpret the results in terms of the considered objects. Temporal Querying in Molecular Dynamics / O. We propose an algorithm for the problem solving. Sourina, N. Korolev // Journal of All rights reserved Developed interactive visualization software is Computational and Theoretical Nanoscience. – described, which implements the proposed algorithm. 2005. – Vol. 2. – P. 1-7. We demonstrate how with this software the user can [3] Thomas J., Cook K. Illuminating the Path: Research obtain insights regarding the creation and disappearance and Development Agenda for Visual Analytics. – of object clusters and bunches and find invariants in the IEEE-Press, 2005. – 185 p. initial data changes. 57