<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Фрактальные методы в информационных технологиях обработки, анализа и классификации больших потоков астрономических данных</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>© A.V. Myshev</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>National Research Nuclear University MEPhI (IATE)</institution>
          ,
          <addr-line>Obninsk</addr-line>
          ,
          <country country="RU">Russia</country>
        </aff>
      </contrib-group>
      <fpage>172</fpage>
      <lpage>176</lpage>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>Рассмотрены новые подходы к построению
Труды XIX Международной конференции
«Аналитика и управление данными в областях с
интенсивным использованием данных»
(DAMDID/ RCDL’2017), Москва, Россия, 10–13
октября 2017 года
моделей и логических схем алгоритмов и процедур
информационных технологий обработки, анализа и
классификации больших потоков астрономических
данных об орбитах и траекториях малых тел.
Методология построения таких моделей и схем
основана на построении оценок критериев близости
и связанности орбит и траекторий в пространстве
возможных состояний с помощью соответствующего
математического аппарата фрактальных
размерностей. Логическая, алгоритмическая и
содержательная сущности методов и технологий
фрактальной парадигмы заключаются, во-первых, в
обработке и анализе потока данных орбит и
траекторий с тем, чтобы определить, образует ли он
фрактальную структуру (если да, то необходимо
определить центры фрактальной связанности потока
и получить оценки индекса информационной
связанности орбит или траекторий), во-вторых, в
выделении монофрактальных структур в потоке и
классификации их по признаку принадлежности к
классам перколирующего фрактала или
фрактального агрегата. Фрактальная парадигма в
методологии разработки и реализации
информационных технологий обработки, анализа и
классификации больших потоков данных, в отличие
от традиционных методов и способов [1–4],
позволяет учитывать как свойства регулярности и
нерегулярности структуры пространства состояний
информационной шкалы данных потока, так и их
динамическую и информационную связанность.</p>
      <p>Рассматриваемые логические схемы алгоритмов и
процедур технологий обработки, анализа и
классификации больших потоков данных построены
на основе теории фрактальных размерностей
пространственных и временных структур,
алгоритмическая и содержательная сущность
которых заключается в следующем. Во-первых,
обработка потока данных состоит в том, чтобы
определить, образует ли он фрактальную структуру.
Если да, то необходимо определить центры
фрактальной связанности потока данных и получить
оценки индекса информационной связанности.
Вовторых, алгоритмы и процедуры технологий анализа
и классификации обработанного потока позволяют
выделить монофрактальные структуры, если поток
образует мультифрактал, и классифицировать их по
признаку принадлежности к классам
перколирующего фрактала или фрактального
агрегата, а также оценить меру расхождения между
геометрическими и информационными
фрактальными размерностями, как индикатора
единства количественных и качественных
характеристик потока.
2 Астрономические данные (обработка,
анализ и классификация)
2.1 Постановка задачи</p>
      <p>Для обработки потоков астрономических данных
об орбитах и траекториях объектов космического
пространства получены новые критерии их близости.
В качестве критерия близости двух орбит введена
количественная оценка фрактальной меры на
множестве по-парных расстояний между
соответствующими парами точек орбит. Такая
оценка фрактальной меры является критерием
связанности двух орбит, посредством которого
отражается степень их геометрической и
информационной близости. Основная посылка и
смысл введенной сущности объясняются и
поясняются следующей логической схемой и
алгоритмом.</p>
      <p>Во-первых, на орбитах определяются реперные
(или опорные) точки, в качестве которых могут
выступать перигелий или афелий орбиты.
Вовторых, относительно реперных точек выбирается N0
дискретных точек с шагом дискретизации по
истинной аномалии   3600 / N0 , где значение N0
определяется из следующих условий: 1)
статистической значимости и репрезентативности
выборки; 2) уровня надежности оценки фрактальной
меры. В-третьих, на каждом i-ом шаге дискретизации
по ∆ν вычисляется расстояние ri между
соответствующими точками на орбитах.
Вчетвертых, после завершения предыдущего шага по
всем дискретным точкам орбит определяются rmin и
rmax, вычисляется △=⃒rmax–rmin⃒, который разбивается
на K подинтервалов. В-пятых, для заданного уровня
геометрической близости двух орбит rдов (радиус
сферы доверительности) вычисляется оценка уровня
доверительности pдов, который отражает долю точек
riϵ△, для которых справедливо условие ri≤ rдов.
Оценка pдов является критерием и количественной
мерой фрактальной природы близости двух орбит,
т. е. для заданного rдов и с каким значением pдов
можно считать связанными две орбиты. Для
получения количественной оценки фрактальной
меры на K подинтервалах множества точек riϵ△,
учитывающей одновременно емкостные и
информационные размерности фрактала,
используется формула для оценки универсальной
фрактальной размерности db, которая является
синергией и обобщением обозначенных выше
фрактальных размерностей. Она была получена
одним из авторов, а содержательно-смысловое
значение величины db более полно и конструктивно
описано в [5]. Оценка значения величины db
определяется следующим выражением</p>
      <p>K K
 pi log (1 ij ) p j</p>
      <p>B( )  lim i1 j1 , (1)
db  lim0 log(1/ )  0 log 
где pi – вероятность попадания значения ri в i-й
подинтервал △=⃒rmin–rmax⃒; ε – длина подинтервала
для заданного разбиения интервала △; ρij –
рандомизированная метрика между центрами j-го и
i-го подинтервалов; B( ) – B-энтропия.
Рандомизированная метрика ρij определяется по
следующей формуле</p>
      <p>ij  ri  rj / r ,
d f   lim</p>
      <p> 0
где |  –   | – это расстояние (геометрическое или
информационное) между i-м и j-м подинтервалами;
|r| – длина интервала △. Для вычисления оценки
емкостной фрактальной размерности множества {ri},
которая отражает свойства фрактальной геометрии
«дырявого» множества точек riϵ△, использовалась
известная формула [6]
log N ( )</p>
      <p>log 
где N(ε) – число покрытий множества точек riϵ△; ε –
радиус сферы покрытия. Емкостная фрактальная
размерность df вводится и определяется как оценка
меры нерегулярности топологической и
геометрической структуры множества точек ri.</p>
      <p>Формулы (1) и (3) использовались для получения
оценок критериев связанности двух орбит, которые
описывают и отражают степень пространственной
близости двух орбит в определенной
пространственной окрестности rдов с заданным
уровнем доверительности pдов. Логическая схема
получения оценок фрактальной меры связанности
потока орбит относительно оптимальной опорной
орбиты и нахождение такой орбиты в потоке
выражается в виде следующего алгоритма.</p>
      <p>Первый шаг – произвольно выбирается первая
фиксированная орбита потока Oj (j=1÷L, где L –
количество орбит потока) и вычисляются по-парные
индексы связанностей Ik между ней и всеми другими
орбитами Ok (k=1÷L, j≠k, k – переменный индекс)
потока по формулам (1), (2). Результат этого шага –
множество индексов связанностей Kj={Ik} для всех
орбит потока относительно выбранной опорной
орбиты Oj. На этом шаге также определяются
индексы связанностей Im, которые вычисляются по
формуле (3) и отражают свойства фрактальной
геометрии близости двух орбит, образуя множество
Gj={Im}.</p>
      <p>На втором шаге вычисляется коэффициент
связанности потока орбит {Ok} относительно
опорной орбиты Oj по формуле (1), т. е. вычисляется
фрактальная размерность Rj множества Kj.
Процедуры первого и второго шагов выполняются
для всего множества орбит {Oj}, где j – индекс
опорной орбиты. На последнем шаге алгоритма
получаем множество Sорб={Rj}, элементы которого
показывают, насколько та или иная орбита может
быть «центром» потока орбит, относительно
которого наиболее плотно и компактно
группируются орбиты. Условие выбора такого
«центра» потока орбит определяется выражением
Rj  min . (4)
j
Основная посылка и смысл обозначенной
логической схемы в информационных технологиях
обработки и анализа состоят в том, чтобы дать
математическое и логическое описание пространства
возможных состояний наблюдаемых малых тел с
учетом геометрических, динамических и
информационных аспектов их эволюции. Для
представления расположения тел в моменты их
наблюдений и дальнейшей эволюции разработана
математико-логическая схема перехода от
орбитального описания положений тел к их
геометрическому расположению в реальном
пространстве, которая реализована в виде
следующей процедуры.</p>
      <p>Во-первых, локализуется область пространства
(куб или прямоугольный параллелепипед), в котором
находятся наблюдаемые объекты-тела. Во-вторых,
выделяется элементарный объём разбиения этой
области, т. е. область разбиения представляется в
виде трёхмерной решётки, узел которой является
идентификатором элементарного объёма. В-третьих,
решается задача таксономии и классификации
пространственного распределения малых тел на
узлах трёхмерной решётки. Задача заключается в
следующем: образует ли распределение тел в этом
объёме регулярную либо нерегулярную
пространственную структуру? Для этого
использовался аппарат теории фрактальных
размерностей и фрактальной геометрии [5–7].
Решением задачи является выделение объема,
определение пространственной геометрии и
распределения тел на узлах решётки, т. е.
определяется, являются ли соответствующие
подмножества узлов решётки фрактальными
объектами или регулярными. В-четвертых, решалась
задача пространственной кластеризации
наблюдаемых объектов на узлах решетки: выделения
фрактальных кластеров – перколяционный фрактал
или фрактальный агрегат.
2.2 Фрагменты результатов обработки и анализа
данных наблюдений</p>
      <p>Для обработки и анализа данные
астрономических наблюдений для малых тел
солнечной системы были сгруппированы, исходя из
опыта предыдущих исследований [8–11].
Классификация малых тел по группам, полученная,
исходя из ограничений на значения элементов их
кеплеровских орбит, показана в Таблице 1.</p>
      <p>Иллюстрация и отражение результатов обработки
и анализа потока астрономических данных на
примере объектов-тел группы 7 в виде фрагмента
приведены в Таблице 2. В столбцах 2, 3 и 4
приведены фрагменты (подмножества) для множеств
Gj и Kj (j=2) и соответствующие их элементам
значения B-энтропии. Значения элементов этих
множеств вычислялись относительно второй орбиты.
Как видно из Таблицы 2, значения всех элементов
множества Gj больше единицы (условие
геометрической регулярности – это равенство всех
элементов единице), тем самым отражены
фрактальные свойства пространственной структуры
потока орбит группы 7. Логические аналогии для
элементов множества Kj (условие однородности
геометрии потока – это равенство всех элементов
нулю) указывают на то, что «дырявая»
пространственная геометрия потока траекторий
обладает неоднородной плотностью. На основе
элементов пятого столбца была определена орбита,
которая является «центром притяжения» потока, т. е.
относительно нее наиболее плотно сгруппированы
орбиты тел группы. Элементы этой орбиты на
момент наблюдений имеют следующие значения:
a=2.211545 a.e., i=7.506260, e=0.5894668,
ω=123.263920, Ω=313.243320. Этот этап обработки и
анализа данных в логической цепочке
информационных технологий позволяет получить
оценки количественной меры фрактальной природы
и фрактальной геометрии потока орбит
рассматриваемой группы тел, а также определить
центр потока. Вторым этапом в логической цепочке
информационных технологий обработки и анализа
являются пространственное представление и
описание распределения малых тел исследуемой
группы в локальной области гелиоцентрической
прямоугольной системы координат.
Гелиоцентрическая система координат XОYZ
определялась с началом O в барицентре Солнечной
системы. Плоскость XOY – плоскость эклиптики. Ось
ОX направлена в точку  (точка весеннего
равноденствия). Ось OY перпендикулярна ей. Ось OZ
выбрана так, чтобы система векторов ОХ, OY, OZ
образовала правую тройку.</p>
      <p>Проиллюстрируем результаты, полученные на
этом этапе, на примере объектов-тел группы 1.
Разбиение объема, в котором локализованы тела на
момент наблюдения, определяется ограниченной
трехмерной решеткой Z3 следующего масштаба: по
оси X – 15 узлов, по оси Y – 14 узлов, по оси Z – 12
узлов. Процедура пространственной кластеризации
на решетке Z3 позволила получить следующие
результаты.
Таблица 1 Классификация малых тел по элементам
кеплеровских орбит
Группа 1 Главный пояс астероидов: е&lt;1/3;
i&lt;20°; 2.1&lt;a&lt;3.5 а. е.
Группа 2 Короткопериодические кометы и
метеорные тела (включая
астероиды группы Аполлона –
Амура): 1/3&lt;е&lt;0.95; i&lt;30°; a&lt;15 а.</p>
      <p>е.
Группа 3 Долгопериодические кометы и
метеорные тела: е&gt;0.95; i –
случайное; a&gt;15 а. е.
Группа 4 Троянцы (захваченные Юпитером и
колеблющиеся относительно его
передней и задней лагранжевых
точек либрации): а≈5.2 а. е.
Группа 5 Астероиды группы Гильды: е ≈0.2;
i≈10°; a ≈3.95 а. е.
Группа 6 Астероиды группы Венгрии: е≈0.1;
i≈25°; a≈1.9 а. е.
Группа 7 Малые тела, орбиты которых
пересекают орбиту Земли в
окрестности радиуса сферы ее
влияния.
Таблица 2 Значения для элементов множеств Gj и Kj
(j=2) и соответствующие этим элементам значения
B-энтропии [5]
3 Выводы и некоторые обобщения
Результаты обработки и анализа данных
наблюдений для групп малых тел, обозначенных
выше, позволяют сделать ряд выводов и обобщений
следующего характера. Во-первых, фрактальные
методы в информационных технологиях обработки и
анализа больших потоков астрономических данных
на основе логических схем когнитивной аналитики
раскодирования сокрытой в них информации
являются перспективной и уникальной парадигмой в
области разработки информационных технологий
нового поколения для широкого класса задач не
только современной астрономии. Во-вторых, потоки
данных астрономических наблюдений можно
обрабатывать, используя различные процессы и
методы теории фракталов и генетических данных как
для получения совокупностей и популяций
выборочных данных, так и для их анализа. Эти
методы и процессы отражают и определяют
особенности получаемых оценок фрактальных мер и
размерностей, а также область применения выводов,
которые можно сделать на основе этих данных. В
этом случае используются два типа выборочности –
генетическая и статистическая. Статистическая
выборочность связана с определением
пространственных масштабов решетки Z3, а
генетическая – с распределением информации и
объектов на узлах этой решетки.</p>
      <p>В широком аспекте фундаментальных
астрономических исследований проблемы
образования и эволюции планетных систем
результаты данной работы впервые позволили
показать, как и в чем проявляется синергия
геометрии пространственной структуры и
динамической эволюции объектов обозначенных
систем и как это можно описать и объяснить в рамках
фрактальной парадигмы. Можно ли провести такие
аналогии в рамках традиционных моделей,
алгоритмов, схем и др.? Если да, то необходимо
показать результаты обозначенных аналогий и
сформулировать тренды их теоретического развития
и практического продолжения.</p>
      <p>Прикладные аспекты результатов работы тесно
связаны с решением задач
астероидно-кометнометеорной безопасности и проблемой космического
мусора. С одной стороны, предложены методы
фрактальной теории решения сложных нелинейных
задач обработки, анализа и интерпретации
результатов динамической эволюции объектов
космического пространства с нерегулярной
пространственно-вре-менной фрактальной
геометрией. С другой стороны, разработана и
реализована новая IT-технология в тренде DAMDID
обработки, анализа и классификации орбитальных
данных малых тел Солнечной системы (для
программной реализации IT-технологий
использованы данные с порталов MPC
(www.cfa.harvard.edu) и NASA (www.nasa.gov)).</p>
    </sec>
  </body>
  <back>
    <ref-list />
  </back>
</article>