<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>METHOD OF CREATING PANORAMIC AERIAL IMAGES BASED ON MULTI-BAND BLENDING Margarita N. Favorskaya, Andrey I. Pakhirka, Alexander G. Zotin, Vladimir V. Buryachenko</article-title>
      </title-group>
      <contrib-group>
        <aff id="aff0">
          <label>0</label>
          <institution>Reshetnev Siberian State University of Science and Technology</institution>
          ,
          <addr-line>Krasnoyarsk</addr-line>
          ,
          <country country="RU">Russia</country>
        </aff>
      </contrib-group>
      <fpage>160</fpage>
      <lpage>165</lpage>
      <abstract>
        <p>Method of creating the panoramic aerial image from a set of successive quasi-planar landscape images obtained from an unmanned aerial vehicle based on the homography parameters is developed. The additional stage of global alignment of a panoramic aerial image using affine processing is implemented. A special attention is paid to the stitching of images using the techniques of multi-band blending that provides the high quality visualization in the stitching places of a panoramic aerial image.</p>
      </abstract>
      <kwd-group>
        <kwd>panoramic aerial image</kwd>
        <kwd>homography parameters</kwd>
        <kwd>multi-band blending</kwd>
      </kwd-group>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>
        параметрам съемки (они должны быть практически такими же, как параметры съемки
исходного снимка). Более общим является подход на основе точечных дескрипторов (Speeded-Up
Robust Feature (SURF) [
        <xref ref-type="bibr" rid="ref2">1</xref>
        ], Features from Accelerated Segment Test (FAST), FAST Enhanced
Repeatability (FAST-ER)) или стабильных областей (Affine Invariant Intensity Extrema, Maximally
Stable Extremal Region (MSER)) [
        <xref ref-type="bibr" rid="ref8">7</xref>
        ]. Помимо классических подходов, в последние годы
развиваются быстрые методы построения панорамных снимков, например, основанные
расширенном фильтре Калмана и методе одновременной локализации и сопоставления (Simultaneous
Localization and Mapping (SLAM)) [
        <xref ref-type="bibr" rid="ref4">3</xref>
        ].
      </p>
      <p>В данной работе параллельно рассчитываются быстрые дескрипторы FAST и FAST-ER,
предназначенные для обнаружения углов, и дескриптор SURF, учитывающий фактор
масштабирования. В дескрипторе FAST проверка пиксела p на то, является ли он углом,
осуществляется сравнением значения его яркости со значениями яркостей 16 пикселов {x1, x2, …, x16} с
радиусом 3 вокруг проверяемого пиксела p (рисунок 1).</p>
      <p>а б в
Рис. 1. Нахождение углов: а) исходное изображение; б) увеличенный фрагмент;</p>
      <p>в) уголковый детектор FAST.</p>
      <p>Для ускорения алгоритма вначале рассматриваются пикселы с номерами 1, 5, 9 и 13.
Если, по крайней мере, три их четырех пикселов удовлетворяют пороговому критерию, то
пиксел p считается углом. Если, по крайней мере, три из четырех значений находятся ниже
порогового значения Ip + TFAST, то пиксел p не является точкой интереса и отбрасывается. В
противном случае проверяются все 16 значений окружающих пикселов в виде вектора Spx,
принимающего соответственно темное, подобное и светлое значения в соответствии с
выражением (1):
d , I px  I p  TFAST

S px  s , I p  TFAST  I px  I p  TFAST , (1)

b, I p  TFAST  I px
где Ix – яркость пиксела на окружности вокруг проверяемого пикселя; Ip – яркость
проверяемого пикселя; TFAST – пороговое значение для дескриптора FAST, например, 20% значения
яркости.</p>
      <p>
        Далее строятся подмножества Pd, Ps, Pb и определяется переменная Kp, которая в
соответствии с классификатором дерева решений [
        <xref ref-type="bibr" rid="ref6">5</xref>
        ] определяет, является ли проверяемый пиксел
углом или нет. Для снижения влияния шумов на результат работы алгоритма перед его
применением рекомендуется произвести размытие изображения фильтром Гаусса.
      </p>
      <p>Для идентификации особой точки в дескрипторе SURF строится массив из 64 (в
расширенной версии 128) чисел. При этом размер окна для поиска дескриптора равен 20 s, где s –
масштаб, в котором была найдена особая точка. Дескриптор содержит описание градиентов
для 16 квадрантов вокруг особой точки. Далее, квадрат разбивается на 16 более мелких
квадрантов. В каждом квадранте берется регулярная сетка 5×5 и для каждой точки сетки ищется
градиент с помощью фильтра Хаара. Размер фильтра Хаара берется равным 2 s, и для первой
162
октавы составляет 4×4. Следует отметить, что при расчете фильтра Хаара, изображение не
поворачивается, фильтр рассчитается в обычных координатах изображения. Затем
полученные координаты градиента (dX, dY) поворачиваются на угол, соответствующий ориентации
квадрата. Также, для описания точки используется знак следа матрицы Гессе. Для светлых
точек на темном фоне след отрицателен, а для темных точек на светлом фоне след
положителен. Таким образом, SURF различает светлые и темные пятна. На рисунке 2 представлен
пример обнаружения особых точек на изображении с применением алгоритмов FAST, FAST-ER
и SURF.</p>
      <p>а б в
Рис. 2. Нахождение особых точек: а) алгоритм FAST, б) алгоритм FAST-ER, в) алгоритм SURF.</p>
      <p>
        Одним из самых распространенных способов оценки параметров модели является
алгоритм RANSAC (RANdom SAmple Consensus) [
        <xref ref-type="bibr" rid="ref5">4</xref>
        ]. Концепция данного алгоритма основана на
разделении всех исходных данных на выбросы (outliers) и попадания (inliers). Выбросами
являются ложные точки, шумы, случайные включения в исходные данные, т. е. такие точки, на
основании которых нельзя построить требуемую модель. Попаданиями называются точки,
удовлетворяющие модели. Данный алгоритм выполняется итеративно. У алгоритма RANSAC
имеется ряд недостатков, которые иногда не позволяют получить требуемый результат за
приемлемое время. Одним из недостатков является отсутствие верхней границы времени,
необходимого для вычисления параметров модели. В настоящее время разработаны, реализованы и
протестированы модификации данного алгоритма. Одним из таких модификаций является
алгоритм MLESAC [
        <xref ref-type="bibr" rid="ref7">6</xref>
        ]. Данный алгоритм вычисляет вероятность гипотезы, представляя
распространение ошибки как смешивание моделей. Для одновременного вычисления параметров
модели и доли выбросов применяется схема максимизации ожидания. Для сшивки изображений
требуется подобрать четыре наилучших сопоставления точечных особенностей, координаты
которых используются для вычисления коэффициентов матрицы гомографии:
1 
x j  h1 h2 h3  xi 
     
 y j   h4 h5 h6   yi  ,
h7 h8 h9  1 
где h1,…, h9 – коэффициенты матрицы, (xi, yi) и (xj, yj) – координаты соответствующих точек.
При проективном преобразовании, h9 =1, выражение (2) принимает вид:
x j  h1xi  h2 yi h3 , y j  h4 xi  h5 yih6 .
      </p>
      <p>h7 xi  h8 yi  1</p>
      <p>h7 xi  h8 yi  1
Глобальное выравнивание сцены. Сшивка изображений на основе матриц гомографии
означает локальное выравнивание панорамного снимка. Для глобального выравнивания
должны одновременно использоваться все матрицы гомографии, что невозможно выполнить
в реальном времени. В этом случае можно воспользоваться частичным выравниванием
сшитых изображений на основе аффинных преобразований с использованием метода наименьших
квадратов или применить эвристические алгоритмы поиска геометрических примитивов с
артефактами сшивки для последующего выравнивания.</p>
      <p>
        Многополосное смешивание. Бесшовное смешивание изображений, как правило,
является необходимым после построения панорамного снимка в связи с возникающими
локальными артефактами освещенности, рассогласования текстурной мозаики т.д. Известны четыре
категории методов, а именно, дискретные цветовые методы, методы на основе пирамиды
изображений, градиентные методы и многополосное смешивание [
        <xref ref-type="bibr" rid="ref9">8</xref>
        ]. Многополосное смешивание
относится к высокоэффективным, но наиболее затратным методам устранения артефактов
сшивки. Идея метода, предложенного в 1983 г. [
        <xref ref-type="bibr" rid="ref3">2</xref>
        ], заключается в смешивании низких частот
по большому пространственному диапазону, а высоких частот – по малому
пространственному диапазону. Результатом многополосного смешивания является суммирование
изображений по всем поддиапазонам.
      </p>
      <p>
        Экспериментальные результаты. Для проведения экспериментов использовался набор
изображений Swiss dataset [
        <xref ref-type="bibr" rid="ref10">10</xref>
        ], полученный дроном eBee RTK, имеющим следующие
характеристики: масштаб: 4 см/px, область: 0.18 км2, высота полета: 169 м, число изображений 32.
Пример создания панорамного аэрофотоснимка на основе многополосного смешивания для
набора из 32 изображений представлен на рисунке 3.
      </p>
      <p>Тестирование проводилось на компьютере со следующей конфигурацией: процессор
AMD Athlon II X3 3.2GHz, оперативная память 8GB DDR3 1333Mhz, видео карта NVIDIA
GeForce GTX 650. В таблице 1 представлена скорость работы алгоритма нахождения особых
точек, преобразования и сопоставления изображений с разными разрешениями на основе
FAST, SURF, FASTER. Скорость работы алгоритмов расчета матрицы гомографии при
сопоставлении изображений с разрешением 1280×720 пикселов приведена в таблице 2.
Рис. 3. Панорамный аэрофотоснимок на основе многополосного смешивания.
Таблица 2. Время работы алгоритмов RANSAC и MLESAC.</p>
      <p>Алгоритм FAST, мс FAST-ER, мс SURF, мс
RANSAC 2 1 3</p>
      <p>MLESAC 2 1 4
Полученные данные показывают, что использование алгоритма MLESAC позволяет
повысить точность сопоставления особых точек в среднем на 5%, по сравнению с алгоритмом
RANSAC, при этом скорость работы алгоритма уменьшается в среднем на 15%.</p>
      <p>Заключение. Применение алгоритмов FAST и FAST-ER позволяет организовать
сопоставление изображений (с разрешением до1920×1080 пикселов) для формирования
панорамного снимка в реальном режиме времени, а слияние изображений с применением технологии
многополосного смешивания обеспечивает качественную визуализацию в местах сшивки.
Основным недостатком рассмотренных алгоритмов является использование в расчетах
яркостной составляющей пиксела, что может приводить к некорректным результатам сшивки при
наличии на изображениях областей с повышенной яркостью или больших фрагментов,
содержащих блики.</p>
      <p>Работа выполнена при финансовой поддержке РФФИ (грант № 16-07-00121-а).</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          <string-name>
            <surname>Разрешение</surname>
          </string-name>
          ,
          <string-name>
            <surname>пиксел</surname>
            <given-names>SURF</given-names>
          </string-name>
          ,
          <string-name>
            <surname>мс</surname>
            <given-names>FAST</given-names>
          </string-name>
          -ER,
          <string-name>
            <surname>мс</surname>
            <given-names>FAST</given-names>
          </string-name>
          ,
          <source>мс 640×360 535 22 13 852×480 782 33 19 1280×720 1380 65 29 1600×900 1965 90 34 1920×1080 2844 132 43</source>
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          [1]
          <string-name>
            <surname>Bay</surname>
            <given-names>H.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Ess</surname>
            <given-names>A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Tuytelaars</surname>
            <given-names>T.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Van</surname>
          </string-name>
          Gool L.
          <article-title>Speeded-up robust features (surf) // Computer Vision</article-title>
          and Image Understanding.
          <year>2008</year>
          . V.
          <volume>110</volume>
          , no. 3,
          <string-name>
            <surname>P.</surname>
          </string-name>
          346-
          <fpage>359</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          [2]
          <string-name>
            <surname>Burt</surname>
            <given-names>P.J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Adelson</surname>
            <given-names>E.H.</given-names>
          </string-name>
          <article-title>A multiresolution spline with application to image mosaics /</article-title>
          / ACM Transactions on Graphics.
          <year>1983</year>
          . V.
          <volume>2</volume>
          , no. 4,
          <string-name>
            <surname>P.</surname>
          </string-name>
          217-
          <fpage>236</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          [3]
          <string-name>
            <surname>Civera</surname>
            <given-names>J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Davison</surname>
            <given-names>A.J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Magallón</surname>
            <given-names>J.A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Montiel J.M.</surname>
          </string-name>
          Drift-free realtime sequential mosaicing //
          <source>International Journal on Computer Vision</source>
          .
          <year>2009</year>
          . V.
          <volume>81</volume>
          , no. 2,
          <string-name>
            <surname>P.</surname>
          </string-name>
          128-
          <fpage>137</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          [4]
          <string-name>
            <surname>Fischler</surname>
            <given-names>M.A.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Bolles R.C.</surname>
          </string-name>
          <article-title>Random Sample Consensus: A Paradigm for Model Fitting with Applications to Image Analysis</article-title>
          and
          <source>Automated Cartography // Communications of the ACM</source>
          .
          <year>1981</year>
          . Vol.
          <volume>24</volume>
          , N 6,
          <string-name>
            <surname>P.</surname>
          </string-name>
          381-
          <fpage>395</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          [5]
          <string-name>
            <surname>Quinlan</surname>
            <given-names>J.R.</given-names>
          </string-name>
          <article-title>Induction of decision trees // Machine Learning</article-title>
          .
          <year>1986</year>
          . V. 1,
          <string-name>
            <surname>P.</surname>
          </string-name>
          81-
          <fpage>106</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          [6]
          <string-name>
            <surname>Torr</surname>
            <given-names>P.H.S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Zisserman</surname>
            <given-names>A</given-names>
          </string-name>
          .
          <article-title>MLESAC: A New Robust Estimator with Application to Estimating Image Geometry // Computer Vision</article-title>
          and Image Understanding.
          <year>2000</year>
          . V. 78, P.
          <fpage>138</fpage>
          -
          <lpage>156</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          [7]
          <string-name>
            <surname>Tuytelaars</surname>
            <given-names>T.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Van Gool L.J.</surname>
          </string-name>
          <article-title>Matching widely separated views based on affine invariant regions //</article-title>
          <source>International Journal of Computer Vision</source>
          .
          <year>2004</year>
          . V.
          <volume>59</volume>
          , no. 1,
          <string-name>
            <surname>P.</surname>
          </string-name>
          61-
          <fpage>85</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          [8]
          <string-name>
            <surname>Favorskaya</surname>
            <given-names>M.N.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Buryachenko</surname>
            <given-names>V.V.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Zotin</surname>
            <given-names>A.G.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Pakhirka</surname>
            <given-names>A.I.</given-names>
          </string-name>
          <article-title>Video completion in digital stabilization task using pseudo-panoramic technique // Int</article-title>
          . Arch. Photogramm. Remote Sens.
          <source>Spatial Inf. Sci., XLII-2/W4</source>
          .
          <year>2017</year>
          . P.
          <volume>83</volume>
          -
          <fpage>90</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          [10]
          <string-name>
            <given-names>Example</given-names>
            <surname>Datasets</surname>
          </string-name>
          . https://www.sensefly.com/drones/example-datasets.
          <source>html (дата обращения 07.06</source>
          .
          <year>2017</year>
          ).
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>