Фрактальные методы в информационных технологиях обработки, анализа и классификации больших потоков астрономических данных © А.В. Мышев © А.В. Дунин Национальный исследовательский ядерный университет (МИФИ) – Обнинский институт атомной энергетики (ИАТЭ), Обнинск, Россия mishev@iate.obninsk.ru Аннотация. Рассмотрена фрактальная парадигма построения моделей и логических схем алгоритмов и процедур информационных технологий обработки, анализа и классификации больших потоков астрономических данных об орбитах и траекториях малых тел. Методология построения таких моделей и схем основана на построении оценок критериев близости и связанности орбит и траекторий в пространстве возможных состояний с использованием соответствующего математического аппарата фрактальных размерностей. Логическая, алгоритмическая и содержательная сущности фрактальной парадигмы заключаются в следующем. Во-первых, обработка и анализ потока данных орбит и траекторий состоят в том, чтобы определить, образует ли он фрактальную структуру. Если да, то определить центры фрактальной связанности потока и получить оценки индекса информационной связанности орбит или траекторий. Во-вторых, нужно выделить монофрактальные структуры в потоке и классифицировать их по признаку принадлежности к классам перколирующего фрактала или фрактального агрегата. Ключевые слова: связанность орбит, фрактальные меры, фрактальная размерность, перколирующий фрактал, фрактальный агрегат. Fractal Methods in Information Technologies for Processing, Analyzing and Classifying Large Flows of Astronomical Data © A.V. Myshev © A.V. Dynin National Research Nuclear University MEPhI (IATE), Obninsk, Russia mishev@iate.obninsk.ru Abstract. The fractal paradigm of constructing models and logical schemes of algorithms and procedures for information processing, analysis and classification of large flows of astronomical data on the orbits and trajectories of small bodies is considered. The methodology for constructing such models and schemes is based on the construction of estimates of proximity and connectivity criteria for orbits and trajectories in the space of possible states using the corresponding mathematical apparatus of fractal dimensions. The logical, algorithmic and substantial essence of the fractal paradigm is as follows. Firstly, the processing and analysis of the data flow of orbits and trajectories is to determine whether it forms a fractal structure. If yes, then it determines the centers of fractal connectivity of the flow and obtains estimates of the index of information connectivity of orbits or trajectories. Secondly, it is necessary to isolate the monofractal structures in the flow and classify them according to the attribute of belonging to the classes of a percolating fractal or a fractal aggregate. Keywords: connectedness orbits, fractal measures, fractal dimension, percolating fractal, fractal aggregate. моделей и логических схем алгоритмов и процедур 1 Введение информационных технологий обработки, анализа и Рассмотрены новые подходы к построению классификации больших потоков астрономических данных об орбитах и траекториях малых тел. Методология построения таких моделей и схем Труды XIX Международной конференции основана на построении оценок критериев близости «Аналитика и управление данными в областях с и связанности орбит и траекторий в пространстве интенсивным использованием данных» возможных состояний с помощью соответствующего (DAMDID/ RCDL’2017), Москва, Россия, 10–13 математического аппарата фрактальных октября 2017 года 172 размерностей. Логическая, алгоритмическая и алгоритмом. содержательная сущности методов и технологий Во-первых, на орбитах определяются реперные фрактальной парадигмы заключаются, во-первых, в (или опорные) точки, в качестве которых могут обработке и анализе потока данных орбит и выступать перигелий или афелий орбиты. Во- траекторий с тем, чтобы определить, образует ли он вторых, относительно реперных точек выбирается N0 фрактальную структуру (если да, то необходимо дискретных точек с шагом дискретизации по определить центры фрактальной связанности потока истинной аномалии   360 0 / N0 , где значение N0 и получить оценки индекса информационной определяется из следующих условий: 1) связанности орбит или траекторий), во-вторых, в статистической значимости и репрезентативности выделении монофрактальных структур в потоке и выборки; 2) уровня надежности оценки фрактальной классификации их по признаку принадлежности к меры. В-третьих, на каждом i-ом шаге дискретизации классам перколирующего фрактала или по ∆ν вычисляется расстояние ri между фрактального агрегата. Фрактальная парадигма в соответствующими точками на орбитах. В- методологии разработки и реализации четвертых, после завершения предыдущего шага по информационных технологий обработки, анализа и всем дискретным точкам орбит определяются rmin и классификации больших потоков данных, в отличие rmax, вычисляется △=⃒rmax–rmin⃒, который разбивается от традиционных методов и способов [1–4], на K подинтервалов. В-пятых, для заданного уровня позволяет учитывать как свойства регулярности и геометрической близости двух орбит rдов (радиус нерегулярности структуры пространства состояний сферы доверительности) вычисляется оценка уровня информационной шкалы данных потока, так и их доверительности pдов, который отражает долю точек динамическую и информационную связанность. ri ϵ△, для которых справедливо условие ri ≤ rдов. Рассматриваемые логические схемы алгоритмов и Оценка pдов является критерием и количественной процедур технологий обработки, анализа и мерой фрактальной природы близости двух орбит, классификации больших потоков данных построены т. е. для заданного rдов и с каким значением pдов на основе теории фрактальных размерностей можно считать связанными две орбиты. Для пространственных и временных структур, получения количественной оценки фрактальной алгоритмическая и содержательная сущность меры на K подинтервалах множества точек ri ϵ△, которых заключается в следующем. Во-первых, учитывающей одновременно емкостные и обработка потока данных состоит в том, чтобы информационные размерности фрактала, определить, образует ли он фрактальную структуру. используется формула для оценки универсальной Если да, то необходимо определить центры фрактальной размерности db, которая является фрактальной связанности потока данных и получить синергией и обобщением обозначенных выше оценки индекса информационной связанности. Во- фрактальных размерностей. Она была получена вторых, алгоритмы и процедуры технологий анализа одним из авторов, а содержательно-смысловое и классификации обработанного потока позволяют значение величины db более полно и конструктивно выделить монофрактальные структуры, если поток описано в [5]. Оценка значения величины db образует мультифрактал, и классифицировать их по определяется следующим выражением признаку принадлежности к классам K K перколирующего фрактала или фрактального  pi log  (1   ij ) p j агрегата, а также оценить меру расхождения между B( ) i 1 j 1 d b  lim  lim , (1) геометрическими и информационными  0 log( 1 /  ) log   0 фрактальными размерностями, как индикатора где pi – вероятность попадания значения ri в i-й единства количественных и качественных подинтервал △=⃒rmin–rmax⃒; ε – длина подинтервала характеристик потока. для заданного разбиения интервала △; ρij – рандомизированная метрика между центрами j-го и 2 Астрономические данные (обработка, i-го подинтервалов; B( ) – B-энтропия. анализ и классификация) Рандомизированная метрика ρij определяется по 2.1 Постановка задачи следующей формуле Для обработки потоков астрономических данных ij  ri  rj / r , (2) об орбитах и траекториях объектов космического где |𝑟𝑖 – 𝑟𝑗 | – это расстояние (геометрическое или пространства получены новые критерии их близости. информационное) между i-м и j-м подинтервалами; В качестве критерия близости двух орбит введена количественная оценка фрактальной меры на |r| – длина интервала △. Для вычисления оценки множестве по-парных расстояний между емкостной фрактальной размерности множества {ri }, соответствующими парами точек орбит. Такая которая отражает свойства фрактальной геометрии оценка фрактальной меры является критерием «дырявого» множества точек ri ϵ△, использовалась связанности двух орбит, посредством которого известная формула [6] отражается степень их геометрической и log N ( ) d f   lim , (3) информационной близости. Основная посылка и  0 log  смысл введенной сущности объясняются и где N(ε) – число покрытий множества точек ri ϵ△; ε – поясняются следующей логической схемой и радиус сферы покрытия. Емкостная фрактальная 173 размерность df вводится и определяется как оценка решается задача таксономии и классификации меры нерегулярности топологической и пространственного распределения малых тел на геометрической структуры множества точек ri. узлах трёхмерной решётки. Задача заключается в Формулы (1) и (3) использовались для получения следующем: образует ли распределение тел в этом оценок критериев связанности двух орбит, которые объёме регулярную либо нерегулярную описывают и отражают степень пространственной пространственную структуру? Для этого близости двух орбит в определенной использовался аппарат теории фрактальных пространственной окрестности rдов с заданным размерностей и фрактальной геометрии [5–7]. уровнем доверительности pдов. Логическая схема Решением задачи является выделение объема, получения оценок фрактальной меры связанности определение пространственной геометрии и потока орбит относительно оптимальной опорной распределения тел на узлах решётки, т. е. орбиты и нахождение такой орбиты в потоке определяется, являются ли соответствующие выражается в виде следующего алгоритма. подмножества узлов решётки фрактальными Первый шаг – произвольно выбирается первая объектами или регулярными. В-четвертых, решалась фиксированная орбита потока Oj (j=1÷L, где L – задача пространственной кластеризации количество орбит потока) и вычисляются по-парные наблюдаемых объектов на узлах решетки: выделения индексы связанностей Ik между ней и всеми другими фрактальных кластеров – перколяционный фрактал орбитами Ok (k=1÷L, j≠k, k – переменный индекс) или фрактальный агрегат. потока по формулам (1), (2). Результат этого шага – 2.2 Фрагменты результатов обработки и анализа множество индексов связанностей Kj={Ik} для всех данных наблюдений орбит потока относительно выбранной опорной орбиты Oj. На этом шаге также определяются Для обработки и анализа данные индексы связанностей Im, которые вычисляются по астрономических наблюдений для малых тел формуле (3) и отражают свойства фрактальной солнечной системы были сгруппированы, исходя из геометрии близости двух орбит, образуя множество опыта предыдущих исследований [8–11]. Gj={Im}. Классификация малых тел по группам, полученная, На втором шаге вычисляется коэффициент исходя из ограничений на значения элементов их связанности потока орбит {Ok} относительно кеплеровских орбит, показана в Таблице 1. опорной орбиты Oj по формуле (1), т. е. вычисляется Иллюстрация и отражение результатов обработки фрактальная размерность Rj множества Kj. и анализа потока астрономических данных на Процедуры первого и второго шагов выполняются примере объектов-тел группы 7 в виде фрагмента для всего множества орбит {Oj}, где j – индекс приведены в Таблице 2. В столбцах 2, 3 и 4 опорной орбиты. На последнем шаге алгоритма приведены фрагменты (подмножества) для множеств получаем множество Sорб={Rj}, элементы которого Gj и Kj (j=2) и соответствующие их элементам показывают, насколько та или иная орбита может значения B-энтропии. Значения элементов этих быть «центром» потока орбит, относительно множеств вычислялись относительно второй орбиты. которого наиболее плотно и компактно Как видно из Таблицы 2, значения всех элементов группируются орбиты. Условие выбора такого множества Gj больше единицы (условие «центра» потока орбит определяется выражением геометрической регулярности – это равенство всех R j  min . (4) элементов единице), тем самым отражены j фрактальные свойства пространственной структуры Основная посылка и смысл обозначенной потока орбит группы 7. Логические аналогии для логической схемы в информационных технологиях элементов множества Kj (условие однородности обработки и анализа состоят в том, чтобы дать геометрии потока – это равенство всех элементов математическое и логическое описание пространства нулю) указывают на то, что «дырявая» возможных состояний наблюдаемых малых тел с пространственная геометрия потока траекторий учетом геометрических, динамических и обладает неоднородной плотностью. На основе информационных аспектов их эволюции. Для элементов пятого столбца была определена орбита, представления расположения тел в моменты их которая является «центром притяжения» потока, т. е. наблюдений и дальнейшей эволюции разработана относительно нее наиболее плотно сгруппированы математико-логическая схема перехода от орбиты тел группы. Элементы этой орбиты на орбитального описания положений тел к их момент наблюдений имеют следующие значения: геометрическому расположению в реальном a=2.211545 a.e., i=7.506260, e=0.5894668, пространстве, которая реализована в виде ω=123.26392 , Ω=313.243320. Этот этап обработки и 0 следующей процедуры. анализа данных в логической цепочке Во-первых, локализуется область пространства информационных технологий позволяет получить (куб или прямоугольный параллелепипед), в котором оценки количественной меры фрактальной природы находятся наблюдаемые объекты-тела. Во-вторых, и фрактальной геометрии потока орбит выделяется элементарный объём разбиения этой рассматриваемой группы тел, а также определить области, т. е. область разбиения представляется в центр потока. Вторым этапом в логической цепочке виде трёхмерной решётки, узел которой является информационных технологий обработки и анализа идентификатором элементарного объёма. В-третьих, являются пространственное представление и 174 описание распределения малых тел исследуемой Таблица 1 Классификация малых тел по элементам группы в локальной области гелиоцентрической кеплеровских орбит прямоугольной системы координат. Группа 1 Главный пояс астероидов: е<1/3; Гелиоцентрическая система координат XОYZ i<20°; 2.10.95; i – этом этапе, на примере объектов-тел группы 1. случайное; a>15 а. е. Разбиение объема, в котором локализованы тела на Группа 4 Троянцы (захваченные Юпитером и момент наблюдения, определяется ограниченной колеблющиеся относительно его трехмерной решеткой Z3 следующего масштаба: по передней и задней лагранжевых оси X – 15 узлов, по оси Y – 14 узлов, по оси Z – 12 точек либрации): а≈5.2 а. е. узлов. Процедура пространственной кластеризации Группа 5 Астероиды группы Гильды: е ≈0.2; на решетке Z3 позволила получить следующие i≈10°; a ≈3.95 а. е. результаты. Группа 6 Астероиды группы Венгрии: е≈0.1; Во-первых, был выделен 31 кластер: один кластер i≈25°; a≈1.9 а. е. типа перколяционного фрактала и тридцать типа Группа 7 Малые тела, орбиты которых фрактального агрегата. Размер перколяционного пересекают орбиту Земли в фрактала составлял 473 узла, а размеры фрактальных окрестности радиуса сферы ее агрегатов варьировались от одного до нескольких влияния. узлов. Таблица 2 Значения для элементов множеств Gj и Kj Во-вторых, перколяция обнаружена в плоскости (j=2) и соответствующие этим элементам значения XOY. B-энтропии [5] В-третьих, степень заполнения узлов решетки Z3 составляла в пределах двадцати одного процента: № В- Элементы Элементы Элементы около восемнадцати процентов занимает № энтропия множества множества множества перколяционный фрактал, а остальное – Gj Kj Sорб фрактальные агрегаты. 1. 0.4750731 1.2494696 0.20632162 0.026309 Аналогичные расчеты для тел группы 7 с теми же 2. 0 1 0 0.036631 размерами решетки Z3 показали следующие 3. 0.4301281 1.2460074 0.18680227 0.033831 результаты: не было обнаружено ни одного 4. 0.4807579 1.2096293 0.20879053 0.025871 перколяционного фрактала, а только кластеры типа 5. 0.5052235 1.1657263 0.21941579 0.028186 фрактального агрегата в количестве 31 (размеры от 1 6. 0.4058040 1.2416164 0.17623847 0.036397 до 9 узлов), т. е. объекты этой группы не образуют 7. 0.4985102 1.1521853 0.21650024 0.026056 компактные пространственно-протяженные образования. Процессы перколяции малых тел на 8. 0.4528685 1.2466675 0.19667829 0.022999 узлах решетки Z3 достаточно полно отражают и 9. 0.4474228 1.1198819 0.19431325 0.030783 описывают пространственную и эволюционную 10 0.4823662 1.2204674 0.20948901 0.026293 связанность этих объектов на их орбитах. Эти 11 0.4808495 1.2688664 0.20883028 0.022580 процессы наиболее характерны для объектов группы 12 0.5008954 1.2177231 0.21753612 0.031327 7, указывая на то, что пространственно-временная геометрия этих объектов в пространстве возможных 3 Выводы и некоторые обобщения состояний имеет фрактальную природу, тем самым Результаты обработки и анализа данных определяя тип их фрактальной динамики. Для этого наблюдений для групп малых тел, обозначенных типа динамики характерна наиболее нерегулярная выше, позволяют сделать ряд выводов и обобщений пространственно-временная фрактальная геометрия. следующего характера. Во-первых, фрактальные Такой геометрией с небольшими пространственно- методы в информационных технологиях обработки и времен-ными масштабами обладают малые тела типа анализа больших потоков астрономических данных метеорных тел и ряда других. Фрактальная агрегация на основе логических схем когнитивной аналитики в пространстве возможных состояний наиболее ярко раскодирования сокрытой в них информации проявляется в других группах малых тел. Такие являются перспективной и уникальной парадигмой в фрактальные структуры отражают другой тип области разработки информационных технологий фрактальной динамики, проявляемой в различных нового поколения для широкого класса задач не пространственно-временных масштабах только современной астрономии. Во-вторых, потоки фрактальной геометрии по-разному: при больших – данных астрономических наблюдений можно это более регулярный, а при небольших – менее обрабатывать, используя различные процессы и регулярный тип динамики. методы теории фракталов и генетических данных как 175 для получения совокупностей и популяций Литература выборочных данных, так и для их анализа. Эти методы и процессы отражают и определяют [1] Гусева, И.С., Лих, Ю.С.: Статистический анализ особенности получаемых оценок фрактальных мер и орбит комет. Известия ГАО РАН, 220, сс. 219- размерностей, а также область применения выводов, 224 (2012) которые можно сделать на основе этих данных. В [2] Кочетова, О.М., Кузнецов, В.Б., этом случае используются два типа выборочности – Медведев, Ю.Д., Шор, В.А.: Каталог элементов генетическая и статистическая. Статистическая орбит нумерованных астероидов ИПА РАН. выборочность связана с определением Известия ГАО РАН, 220, сс. 255-258 (2012) пространственных масштабов решетки Z3, а [3] Малкин, З.М.: Некоторые результаты генетическая – с распределением информации и статистического анализа определений объектов на узлах этой решетки. галактического расстояния Солнца. Известия В широком аспекте фундаментальных ГАО РАН, 220, сс. 401-406 (2012) астрономических исследований проблемы [4] Брюно, А.Д., Варин, В.П.: О распределении образования и эволюции планетных систем астероидов по средним движениям. результаты данной работы впервые позволили Астрономический вестник, 45 (1), сс. 334-340 показать, как и в чем проявляется синергия (2011) геометрии пространственной структуры и [5] Мышев, А.В.: Метрологическая теория динамической эволюции объектов обозначенных динамики взаимодействующих объектов в систем и как это можно описать и объяснить в рамках информационном поле нейросети и нейрона. фрактальной парадигмы. Можно ли провести такие Информационные технологии, 4, сс. 52-63 аналогии в рамках традиционных моделей, (2012) алгоритмов, схем и др.? Если да, то необходимо [6] Павлов, А.Н., Онищенко, В.С.: показать результаты обозначенных аналогий и Мультифрактальный анализ сложных сигналов. сформулировать тренды их теоретического развития УФН, 7 (8), сс. 859-876 (2007) и практического продолжения. [7] Федер, Е.: Фракталы. М.: Мир (1991) Прикладные аспекты результатов работы тесно [8] Емельяненко, В.В., Нароенков, С.А., связаны с решением задач астероидно-кометно- Шустов, Б.М.: Распределение околоземных метеорной безопасности и проблемой космического объектов. Астрономический вестник, 45 (6), сс. мусора. С одной стороны, предложены методы 512-517 (2011) фрактальной теории решения сложных нелинейных [9] Гафтонюк, Н.М., Горькавый, Н.Н.: Астероиды задач обработки, анализа и интерпретации результатов динамической эволюции объектов со спутниками: анализ наблюдательных космического пространства с нерегулярной данных. Астрономический вестник, 47 (3), сс. пространственно-вре-менной фрактальной 213-220 (2013) геометрией. С другой стороны, разработана и [10] Нароенков, С.А.: Хранение и обработка реализована новая IT-технология в тренде DAMDID астрометрических и фотометрических данных обработки, анализа и классификации орбитальных об АЗС: настоящее и будущее в России. данных малых тел Солнечной системы (для Космические исследования, 48 (5), сс. 467-470 программной реализации IT-технологий (2010) использованы данные с порталов MPC [11] Альвен, Х., Аррениус, Г.: Эволюция Солнечной (www.cfa.harvard.edu) и NASA (www.nasa.gov)). системы. М.: Мир (1979) 176