=Paper=
{{Paper
|id=Vol-2033/30_paper
|storemode=property
|title=Неконтролируемая классификация мультиспектральных изображений
(Unsupervised Classification of Multispectral Images)
|pdfUrl=https://ceur-ws.org/Vol-2033/30_paper.pdf
|volume=Vol-2033
|authors=Valeria S. Sidorova
}}
==Неконтролируемая классификация мультиспектральных изображений
(Unsupervised Classification of Multispectral Images)==
UNSUPERVISED CLASSIFICATION OF MULTISPECTRAL IMAGES Valeria S. Sidorova Institute of Computational Mathematics and Mathematical Geophysics SB RAS, Novosibirsk, Russia Abstract In the proposed hierarchical histogram algorithm, the clustering detail is found, which is different in the subdomains of the vector space of spectral features depending on the given separation of the clusters. The question of reducing the dimension of the space of data attributes is also being considered. The application of the algorithm for uncontrolled classification of terrestrial cover using various satellite remote sensing data is illustrated. Keywords: remote sensing, uncontrolled classification, multidimensional histogram, cluster separation, dimensionality of space, hierarchical algorithm НЕКОНТРОЛИРУЕМАЯ КЛАССИФИКАЦИЯ МУЛЬТИСПЕКТРАЛЬНЫХ ИЗОБРАЖЕНИЙ Сидорова В.С. Институт вычислительной математики и математической геофизики СО РАН, Новосибирск В предложенном иерархическом гистограммном алгоритме отыскивается детальность кластери- зации, различная в подобластях векторного пространства спектральных признаков в зависимости от заданной отделимости кластеров. Также рассматривается вопрос о сокращении размерности про- странства признаков данных. Иллюстрируется применение алгоритма для неконтролируемой класси- фикации земного покрова по различным спутниковым данным дистанционного зондирования. Ключевые слова: дистанционное зондирование, неконтролируемая классификация, многомерная гистограмма, разделимость кластеров, размерность пространства, иерархический алгоритм. Введение. Предлагается неконтролируемая иерархическая классификация мультиспек- тральных спутниковых данных с заданием порога отделимости кластеров и сокращением раз- мерности данных. Внутри кластеров осуществляется кластеризация по унимодальным кластерам мето- дом [1]. Быстрый непараметрический не итеративный алгоритм [1] разделяет векторное про- странство признаков по унимодальным кластерам, модальные векторы которых соответ- ствуют локальным гистограммным максимумам, а границы проходят по долинам гисто- граммы. Он решает три задачи кластеризации одновременно, используя метод графов: нахо- дит локальные максимумы гистограммы, объявляя их корнями деревьев-кластеров, проводит границы между кластерами по долинам гистограммы и относит все вектора признаков к своим кластерам. Алгоритм является жестким: каждый вектор принадлежит только одному кла- стеру. Детальность кластеризации в алгоритме [1] регулируется заданием числа уровней пред- варительного квантования, одинакового для всего векторного пространства. Задается отсече- нием младших битов в байтах различных векторных направлений. Каждое такое отсечение соответствует уменьшению векторного пространства вдвое. Алгоритм [1] был реализован ав- тором для ЭВМ "БЭСМ-6", а затем для РС[2,3]. Для получения критерия качества классифи- кации предложено ввести разделимость и отделимость кластеров. В [4] предложен иерархиче- ский алгоритм, определяющий детальность в зависимости от кластерной разделимости подоб- ластей. Но иногда бывает важно выявить предельную детальность для данной разделимости. В другом иерархическом алгоритме [5] ставится другая цель: для подобластей пространства векторов найти такие свои максимальные детальности, при которых еще порождаются дочер- ние кластеры с разделимостью ниже заданной. Это позволяет с одной стороны исследовать структуру многоспектральных данных достаточно подробно, причем на разных иерархиче- ских уровнях, с другой стороны, регулировать детальность исследования. Кроме того, можно по-разному задавать закон изменения детальности. Если различные спектральные направления не эквивалентны, то и менять их можно по-разному. И это может привести к сокращению размерности векторного пространства признаков. Этапы иерархического алгоритма. Параметром детальности кластеризации является число уровней квантования векторного пространства, обозначим его n. На каждом этапе пред- ложенного иерархического алгоритма находим такое число n (и соответствующие новые век- торы g), при котором распределение по унимодальным кластерам, полученное методом [1], дает абсолютный минимум мере (2), в диапазоне изменения 255>n> n1. j В [6] были предложены: мера отделимости унимодального кластера m (n) (1), и мера средней разделимости K (n) кластеров m(n) (2): B (n)j 1 m (n) j j j B (n)* H (n) i 1 hi j (n), (1) 156 1 K(n) j m(n) m (n) , K(n) j 1 (2) j где hij (n) значение гистограммы в i-той точке границы кластера j, B (n) число точек границы j кластера, H (n) максимальное значение гистограммы. В [6] показано, что (2) удовлетворяет требованиям, предъявляемым к мере разделимости кластеров или качества кластеризации [7,8]. Минимумы (2) соответствуют лучшим классифи- кациям. Всегда m j (n) 1 и m (n) 1 . Традиционные меры разделимости оперируют сред- неквадратичным отклонением и расстоянием, которые взаимозависимы при жесткой класте- ризации. Введенные меры позволят сравнивать изолированность распределений с тесно рас- положенными кластерами. Более подробно о рассмотренных мерах в [6]. На новом этапе иерархии алгоритм для каждого кластера увеличивает число уровней квантования (детальность), полученное на предыдущем этапе, и в новом интервале находит свое новое число и соответствующее наилучшее кластерное распределение в смысле меры(2). Новый алгоритм рассматривает каждый дочерний кластер как отдельную область только то- гда, когда его разделимость удовлетворяет условию (3): j m (n) ε , (3) где ε заданная точность отделимости кластера. Плохо разделенные дочерние подкластеры (не удовлетворяющие (3)) рассматриваются как одна область. Детальность квантования увеличивается, и деление продолжается, пока n