=Paper= {{Paper |id=Vol-1197/paper20 |storemode=property |title=Методика построения функции принадлежности для классификации изображений на основе гистограмм яркости (The Method of Constructing the Membership Function to Classify Images Based on Histograms) |pdfUrl=https://ceur-ws.org/Vol-1197/paper20.pdf |volume=Vol-1197 |dblpUrl=https://dblp.org/rec/conf/aist/PosokhovL14 }} ==Методика построения функции принадлежности для классификации изображений на основе гистограмм яркости (The Method of Constructing the Membership Function to Classify Images Based on Histograms)== https://ceur-ws.org/Vol-1197/paper20.pdf
Методика построения функции принадлежности для
классификации изображений на основе гистограмм
                    яркости

                  Иван Посохов, Ирина Сергеевна Логунова

    Магнитогорский государственный технический университет им. Г.И. Носова»,
                             Магнитогорск, Россия
               posohof@gmail.com, logunova66@mail.ru



      Аннотация. Приведены особенности изображений образцов используемых
      при оценке качества полуфабрикатов и готовой продукции в металлургиче-
      ской промышленности. Выдвинута гипотеза о возможности разделения
      изображений на три класса. Построена методика классификации изображе-
      ний по гистограмме яркости. Методика была опробована в ходе вычисли-
      тельного эксперимента.

      Ключевые слова: изображение, гистограмма, принятие решения


1     Краткий теоретический анализ проблемы исследования
      изображений металлургической продукции

Современное промышленное производство выдвигает новые требования к систе-
мам управления многостадийными производствами. Эти требования обуслов-
лены внедрением новых приоритетных направлений, определенных государ-
ственной политикой в России. Одно из таких направлений – развитие информа-
ционно-телекоммуникационных технологий, которые являются неотъемлемой
частью автоматизированных систем управления (АСУ) производством крупных
промышленных предприятий. Использование новых модулей АСУ для многоста-
дийных производственных процессов способствует повышению эффективности
функционирования агрегатов и обеспечивает снижение доли продукции пони-
женного качества [1, 2].
   При разработке и внедрении новых модулей, дополняющих существующие
АСУ производства, появляется необходимость использования графической ин-
формации, получаемой в ходе оценки качества готовой продукции и полуфабри-
катов.
   В области теории и практики использования графической информации и при-
нятия решений в условиях АСУ производств накоплен значительный положи-
тельный опыт. Вопросы получения, обработки и сегментации изображений отра-




                                         133
жены в трудах зарубежных и российских исследователей. Труды [3-5] опреде-
лили развитие математической теории в области обработки графической инфор-
мации.
  Однако, несмотря на проведенные исследования и значительное число публи-
каций в области обработки графической информации, остаются актуальной про-
блема: отсутствие комплексных методик, позволяющих выполнять автоматиче-
скую обработку изображений, характерных при формировании базы данных ин-
формации и качестве металлургической продукции.
  В сложивших условиях возникает необходимость в разработке автоматиче-
ской гибкой системы обработки изображений, включающей отделение фона и
объекта исследования, а также идентификации в пределах выделенного объекта
исследования элементов, соответствующих нарушению сплошности образца.


2     Определение цели и задач исследования

Учитывая проблемы оценки исходных изображений для металлургической про-
дукции, была определена цель исследования как совершенствование существую-
щих методов и средств анализа обработки графической информации о качестве
металлургической продукции для ее последующего использования в управлении
системой многостадийного производства непрерывнолитой заготовки.
  Для достижения цели авторами работы решаются задачи:
─ проведение теоретико-информационного и теоретико-множественного ана-
  лиза многостадийного производства непрерывнолитой заготовки и определе-
  ние возможности и необходимости внедрения в систему управления производ-
  ством эргатического модуля анализа изображения серного отпечатка;
─ построение комплекса методик, включающего алгоритмы анализа графиче-
  ской информации на основе классификации изображений по гистограмме яр-
  кости, автоматического отделения фона от объекта исследования, классифика-
  цию и идентификацию объектов на изображении, соответствующих наруше-
  нию сплошности заготовки;
─ построение методики экспертной оценки информации и принятие решений с
  использованием результатов идентификации объектов на изображении.

В рамках представляемой статьи представлена методика анализа графической
информации на основе классификации изображений по гистограмме яркости.
Научную новизну, в отличии от известных методов классификации изображений,
составляет методика, использующая характеристики бимодальной гистограммы,
такие как положение минимального и максимального значения яркости.




                                      134
3     Характеристика набора исходных изображений
      для оценки качества

По результатам пассивного экспериментального исследования, включающего
сбор графической информации о качестве непрерывнолитой заготовки была
сформирована база данных, содержащая 32 серных отпечатка. Изображения
представляют собой оцифрованные серные отпечатки непрерывно литой заго-
товки (рис. 1).




                           а                        б                        в
Рис. 1. Изображения серных отпечатков поперечных темплетов непрерывнолитой заго-
товок квадратного сечения: а – типовое изображение группы А с незначительным отли-
чием яркости фона и объекта исследования; б - типовое изображение группы В со сред-
ним отличием яркости фона и объекта исследования; в - типовое изображение группы C
              с резким отличием яркости фона и объекта исследования

Оцифровка серного отпечатка производится путем его сканирования. Так как раз-
мер серного отпечатка в среднем составляет 175×230 мм, то для его оцифровки
применятся сканер формата А4 с разрешающей способностью не менее 300 точек
на дюйм. Результирующие изображения в среднем имеют разрешение 42005500
точек.
В ходе визуального анализа всех изображений было выявлено две особенности:
─ изображение отпечатка всегда содержит объект исследование (непосред-
  ственно изображение поперечного сечения заготовки размером 100100 мм) и
  окружающий фон, причем положение поперечного сечения (изучаемого объ-
  екта) является неопределенным (рис. 2);
─ все изображения можно разделить на три группы по отношению яркости объ-
  екта исследования и фона изображения. Типовые изображения каждой групп
  в порядке возрастания этого отношения приведены на рис. 1.




                                          135
                            a                        б                          в
               Рис. 2. Структура исследуемых изображений в терминах
        «Объект исследования – Фон»: а,б,в – номером 1 обозначен фон, номером
                               2 – объект исследования

Для сокращения объемов интерактивного определения области непосредствен-
ного исследования принято решение о построение алгоритма автоматического
выделения этой области. Для автоматического поиска объекта на изображении
многими авторами [9-10] предлагается использовать методы, основанные на сег-
ментации изображений. Наиболее простым представителем методов сегментации
является пороговая обработка. Данный метод применим для изображений содер-
жащих известное число однородных по яркости классов точек, распределение ве-
роятностей которых унимодальны. Кроме этого, граничные участки между за-
мкнутыми областями должны занимать сравнительно небольшую площадь изоб-
ражения.
   Предлагается также применить методы сегментации на основе выделения гра-
ниц (контуров). Методы требуют, чтобы между областями изображения суще-
ствовал резкий перепад яркости, что характерно не для всех исходных изображе-
ний.
   Поэтому авторы работы предлагают классифицировать изображения по гисто-
грамме яркости преобразованного полутонового изображения.


4      Гистограммы яркости и преобразование изображения в
       полутоновое

Авторами работы предварительно был проведен анализ гистограмм яркости для
каждого канала пространства RGB1 и гистограмм яркости преобразованного по-
лутонового изображения. Исходные растровые изображения серных отпечатков
являются полноцветными и представлены в цветовой модели RGB с глубиной
цвета 24 бита на пиксель и приводятся к полутоновым изображениям с глубиной
цвета 8 бит на пиксель. Под полутоновыми изображениями в контексте работы


    1 В RGB модели каждый цвет представляется красным, зеленым и синим первичными

    основными цветами (компонентами).




                                           136
понимаются изображения в оттенках серого. Каждый пиксель такого изображе-
ния содержит информацию об интенсивности (яркости). Суммарное число воз-
можных градаций яркости для 8-битового полутонового изображения составляет
28  256 . Минимальное значение яркости – 0 соответствует черному цвету,
максимальное – 255 соответствует белому цвету.
   Основная стратегия преобразования полноцветного изображения в полутоно-
вое заключается в использовании принципов фотометрии для сопоставления яр-
кости изображения в оттенках серого и яркости исходного цветного изображения
[6]. Яркость результирующего пикселя вычисляется как взвешенная сумма трех
значений интенсивности модели RGB. Веса цветовых компонент выбраны в со-
ответствии со стандартом ITU-R BT.709, который учитывает особенности чело-
веческого восприятия, большая чувствительность к зеленому цвету и меньшая к
синему:

                  Y  0,2126  R  0,7152  G  0,0722  B,

  где Y – яркость результирующего пикселя; R, G, B – значения цветовых
компонент пикселя исходного изображения [7].
  Гистограммой цифрового изображения называется дискретная функция

                                  h(rk )  nk ,

где rk – k -ый уровень яркости; nk – количество пикселей изображения с ярко-
стью rk [4]. Для 8-битового изображения k изменяется в пределах [0; 255].

  На рис. 3 – 5 приведены гистограммы для типовых изображений серных отпе-
чатков, приведенных на рис. 1 каждого класса. На рис. 3 – 5 введено обозначение:
N – количество пикселей на изображении заданного канала, тыс шт.
  Для каждой группы изображений были получены гистограммы, имеющие ха-
рактерные отличия в форме:




                                         137
       N
     600                                           N
                                                 600
     400                                         400
     200                                         200
       0                                           0
            0   32 64 96 128 160 192 224                0 32 64 96 128 160 192 224
                                     Яркость а                                 Яркость б
       N
     600                                            N
                                                  600
     400                                          400
     200                                          200
       0                                            0
            0   32 64 96 128 160 192 224                    0 32 64 96 128 160 192 224
                                     Яркость в                                     Яркость г

Рис. 3. Гистораммы для изображения группы А: а – гисторамма для красного канала; б –
гистограмма для зеленого канала; в – гистограмма для синего канала; г – гисторамма по-
                              лутонового изображения

       N                                            N
     800                                         800
     600                                         600
     400                                         400
     200                                         200
       0                                           0
           0    32 64 96 128 160 192 224                0    32 64 96 128 160 192 224
                                     Яркость а                                    Яркость б
        N                                           N
     800                                          800
     600                                          600
     400                                          400
     200                                          200
       0                                            0
            0 32 64 96 128 160 192 224                      0 32 64 96 128 160 192 224
                                   Яркость в                                       Яркость г

Рис. 4. Гистораммы для изображения группы B: а – гисторамма для красного канала; б –
 гистограмма для зеленого канала; в – гистограмма для синего канала; г – гисторамма
                             полутонового изображения




                                                 138
        N                                         N
     200                                       200
     150                                       150
     100                                       100
      50                                        50
       0                                         0
            0 32 64 96 128 160 192 224                0 32 64 96 128 160 192 224
                                   Яркость а                                 Яркость б
        N                                           N
     200
                                                 200
     150                                         150
     100                                         100
      50                                          50
       0                                           0
            0   32 64 96 128 160 192 224                0 32 64 96 128 160 192 224
                                     Яркость в                                 Яркость г

Рис. 5. Гистораммы для изображения группы C: а – гисторамма для красного канала; б –
 гистограмма для зеленого канала; в – гистограмма для синего канала; г – гисторамма
                             полутонового изображения

─ гистограммы изображений группы A унимодальны, так как фон и объект ис-
  следования имеют сравнительно одинаковую яркость. Значимые уровни ярко-
  сти занимают узкую (1015% в диапазоне [215, 255]) полосу, показывая, что
  изображения имеют низкий контраст. Полоса смещена к левому краю, что сви-
  детельствует о высокой яркости изображений;
─ для гистограмм изображений группы B характерно наличие двух выраженных
  пиков, сопоставимых по площади, так как фон и объект исследования имеют
  различную яркость. Значимые уровни яркости занимают полосу шириной
  4050% в диапазоне [140, 255] – изображение имеет нормальную контраст-
  ность;
─ гистограммы изображений группы C также имеют два пика, однако левый пик
  занимает более широкую полосу и меньшее максимальное значение. Фон и
  объект исследования имеют существенно отличающуюся яркость. Ширина по-
  лосы значимых уровней яркости 70% в диапазоне [80, 255], что соответствует
  высококонтрастному изображению.

Таким образом, оценка полученных гистограмм по каждой группе показала, что:

─ гистограмма полутонового изображения является достаточной для классифи-
  кации изображений, так как отклонение положений порога и максимумов ка-
  нальных гистограмм по сравнению с гистограммой полутонового изображения
  составляет не более 15%;
─ начальное предположение о разделении выборки изображений на три группы
  подтверждена результатами вычислительного эксперимента и появилась необ-
  ходимость в разработке методики идентификации формы гистограммы изоб-
  ражении серного отпечатка.




                                               139
5     Методика идентификации формы гистограммы яркости
      серного отпечатка

Для отнесения гистограммы к одному из классов изучены методы нахождения
порогового значения по источникам [3-5,8,11]. Согласно этим источникам поро-
говое значение – это величина яркости, относительно которой гистограмма де-
лится на две части.
  Разделение гистограммы на две части позволяет найти максимы яркости каж-
дой части. Поиск порогового значения яркости основан на использовании метода
Оцу [8]. Метод позволяет разнести пиксели изображения на два класса, рассчи-
тывая такой порог, чтобы внутриклассовая дисперсия была минимальной. Такая
дисперсия выражается через взвешенную сумму дисперсий двух классов:

                       2 (t )  1 (t ) 12 (t )  2 (t ) 22 (t )                (1)

где веса i – это вероятности двух классов, разделенных порогом t ;  i – дис-
                                                                                 2


персия этих классов.
  Вероятность для каждого уровня интенсивности рассчитывается как:

                                                n(t )
                                     p (t )                                         (2)
                                                 N
где n(t) – количество пикселей изображения с яркостью t; N – общее количество
пикселей изображения.
Автор метода [8] доказал, что минимизация дисперсии внутри класса равно-
сильна максимизации дисперсии между классами

             b2 (t )   2   2 (t )  1 (t )2 (t )[ 1 (t )   2 (t )]2       (3)

где  i – среднее арифметическое класса.
После применения метода Оцу и нахождения значения порога яркости методика
предполагает нахождение положения максимумов дискретной функции для каж-
дой части гистограммы. Блок-схема методики классификации изображений низ-
кой контрастности на основе гистограммы яркости приведена на рис. 6. Поиск
выполнен простым перебором значений дискретной функции гистограммы в
каждой ее части.
   В блок-схеме приведенной на рис. 6 подпроцесс «Получение изображения»
включает в себя чтение полноцветных изображений серных отпечатков непре-
рывнолитой заготовки с носителя и размещение его в памяти в виде массива пик-
селей. Подпроцесс «Построение канальных гистограмм яркости» выполняет по-
строение гистограммы яркости для каждого из трех каналов в цветовом простран-
стве RGB, красного, зеленого и синего. В подпроцессе «Изображение к полуто-
новому» происходит преобразование изображения из полноцветного в полутоно-




                                                 140
вое, используя алгоритм BT709. За ним следует подпроцессы «Построение гисто-
граммы полутонового изображения» для построения гистограммы изображения
полученного на предыдущем шаге. Действия, входящие в подпроцессы «Поиск
порогового значения» и «Поиск положений максимумов», представлены на блок-
схеме (рис. 7).

                                                                  Начало


      Библиотека                  Полноцветные                  Получение                        Массив
     изображений                   изображения                 изображения                      пикселей


                                                                Построение
                                                                                        Для трех каналов в цветовом
                                                                канальных
                                                                                        пространстве RGB, красного,
                                                                гистограмм
                                                                                        зеленого и синего
                                                                  яркости


                                                                Приведение
                                                               изображения к            Алгоритм BT709
                                                               полутоновому


                                                                Построение
                                                               гистограммы
                                                               полутонового
                                                               изображения

                                                                  Поиск
                                                                                        Реализация алгоритма
                                                                порогового
                                                                                        для метода Оцу
                                                                 значения

                                                                  Поиск
                                                                                        Поиск количества и положения
                                   База данных                  положений
                                                                                        глобальных максимумов
                                                                максимумов

                                                                  Конец



Рис. 6. Блок-схема методики классификации изображений на основе гистограммы ярко-
                                       сти
                                         Начало                                                       А

     Поиск порогового Вычислить вероятность для каждого               Поиск
     значения яркости      уровня интенсивности
                                                                    максмумов             t=0,               t=threshold,
                                                                                      threshold, 1              255, 1
                                       t=0, 255, 1

                                                                                нет   n(t) > max1            n(t) > max2    нет
                                      Вычислить
                                    ώi(t), µi(t), σ2b(t)
                                                                                           да                     да


                            нет       σ2b(t) > max                                    max1=n(t)              max2=n(t)


                                            да

                                       max=σb(t),                                                    Конец
                                                           А
                                      threshold = t



 Рис. 7. Блок схема поиска порогового значения яркоркости и максимумов дискретной
                          функции гистораммы изображений

  В результате применения методики формируется база данных, которая содер-
жит следующие сведения: исходное изображение, полутоновое изображение,




                                                                    141
дискретные функции для построения гистограмм для красного, зеленого и синего
канала, а также полутонового изображения, пороговое значение и значения мак-
симумов в обеих частях гистограммы.


6         Результаты тестирования методики классификации
          изображений на основе гистограммы яркости

Для разработанной методики были проведены вычислительные эксперименты
для всех собранных изображений. Для изображений, приведенных на рис. 1 были
получены результаты, приведенные в табл. 1.

Таблица 1. Результаты оценки порога яркости и максимальных значений дискретной
функции для тестовых изображений

                                Красный канал           Зеленый канал
             Изображение
                             Tr      M1r     M2r     Tg      M1g     M2g
             Рис. 1а        219      212     248    224      201     242
             Рис. 1б        214      189     255    178      205     255
             Рис. 1в        199      154     240    194      146     240
                                 Синий канал             Полутоновое
             Изображение
                             Tb      M1b      Tb    M1b       Tb     M1b
             Рис. 1а        227      226     227    226      227     226
             Рис. 1б        190      151     190    151      190     151
             Рис. 1в        177      146     177    146      177     146

В табл. 1 введены обозначения: Tr, Tb, Tg, Tgs – значение дискретной функции для
порога яркости для каждого канала и полутонового изображения; M1r, M1b, M1g,
M1gs – значение максимума слева от порога яркости дискретной функции гисто-
граммы для каждого канала и полутонового изображения; M2r, M2b, M2g, M2gs –
значение максимума справа от порога яркости дискретной функции гистограммы
для каждого канала и полутонового изображения; r, b, g – индексы для обозначе-
ния цветовых каналов соответственно красного, синего и зеленого; gs – индекс
соответствия полутоновому изображению.

Таблица 2. Результаты классификации полутоновых изображений серных отпечатков
поперечного сечения непрерывнолитой заготовки

              Количе-                       Значение показателей
    Группа   ство изоб-    Порог яркости      Максимум слева     Максимум справа
              ражений      мин.     макс.      мин.     макс.     мин.    макс.
      А          4         216       223       193       211      239      254
      B          21        193       231       147       218      233      254
      С          7         217       240       145       239      236      247




                                            142
  В табл. 2 приведены результаты классификации изображений, включенных в
общую базу данных на основе разработанной методики.
  Таким образом, для принятия решения об отнесении изображения к одной из
групп (А, В или С) можно построить функцию принадлежности адаптивного
вида:


                                                                          
          3
     R   i T       T T       m       m m       M       M M       ,            (4)
               i min       i max    i min       i max     i min       i max
        i 0

где R – множество возможных решений, состоящее из четырех элементов {0, 1,
2, 3}, значение которого соответствуют группам изображений: 1 – группа А; 2 –
группа В; 3 – группа С; 0 – группа, объединяющая изображения не входящие ни
в одну из групп классификации; T, m, M – количественные характеристики ги-
стограммы изображения, выбранного для классификации: порог, максимум слева
и максимум справа соответственно; Timin, Timax, mimin, mimax, Mimin, Mimax – эмпири-
ческие границы диапазона порога, максимума слева и максимума справа, опре-
деленные на основе эмпирического исследования и адаптируемые при обучении
системы принятия решения о классификации изображений.


7     Заключение

Таким образом, авторами по результатам визуального анализа была выдвинута
гипотеза о возможности разделения изображений серных отпечатков непрерыв-
нолитой заготовки на три класса. Для классификации изображений была постро-
ена методика классификации изображений по гистограмме яркости, учитываю-
щая ее основные характеристики – значения порога яркости, максимум слева и
справа.
   Построенная методика была опробована в ходе вычислительного экспери-
мента, по результатам которого выполнено построение адаптивной функции при-
надлежности изображении к выбранным классам. Адаптация функции возможна
в реальном времени при расширении базы данных изображений серных отпечат-
ков в автоматическом режиме. В результате проведенного вычислительно экспе-
римента показано, что нет оснований для отклонения гипотезы о разделении ис-
ходных изображений на три класса.


Список литературы
1. Logunova, O.S. Integrated system structure of intelligent management support of multistage
   metallurgical processes / O.S. Logunova, I.I. Matsko, I.A. Posochov. – Vestnik of Nosov
   Magnitogorsk state technical university, 2013. – № 5. – Pр. 50 – 55.
2. Логунова, О.С. Система интеллектуальной поддержки процессов управления произ-
   водством непрерывнолитой заготовки: монография / О.С. Логунова, И.И. Мацко, И.А.
   Посохов. – Магнитогорск: Изд-во Магнитогорск. гос. техн. ун-та им. Г.И. Носова,
   2013. – 175 с.




                                              143
 3. Шапиро, Л. Компьютерное зрение / Л. Шапиро, Дж. Стокман. – М.: БИ-НОМ. Лабо-
    ратория знаний, 2006. – 752 с.
 4. Гонсалес, Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. – М.: Техно-
    сфера, 2005. – 1072 с.
 5. Прэтт, У. Цифровая обработка изображений: пер. с англ. / У. Прэтт. – М. : Мир, 1982.
    – Кн. 1. – 312 с.
 6. Poynton, C. Rehabilitation of gamma / Charles Poynton. – Photonics West'98 Electronic
    Imaging. International Society for Optics – 1998.
 7. A Standard Default Color Space for the Internet – sRGB / M. Stokes, M. Anderson, S. Chan-
    drasekar, R. Motta., 1996. URL: http://www.w3.org/Graphics/Color/sRGB.html (дата об-
    ращения 06.01.2014)
 8. Otsu, N. A Threshold Selection Method from Gray-Level Histograms / Nobuyuki Otsu. –
    IEEE Transactions on Systems, Man, and Cybernetics, Vol. 9, No. 1, 1979, pp. 62-66.
 9. Методы автоматического обнаружения и сопровождения объектов. Обработка изоб-
    ражений и управление / Б.А. Алпатов, П.В. Бабаян, О.Е. Балашов, А.И. Степашкин. –
    М.: Радиотехника, 2008. – 176 с.
10. Волков, В.Ю. Выделение прямолинейных кромок на зашумленных изображениях /
    В.Ю. Волков, Л.С. Турнецкий, А.В. Онешко. – Информационно-управляющие си-
    стемы. – 2011. – № 4. – С. 13–17.
11. Ridler, T.W. Picture thresholding using an iterative selection method / T.W Ridler, S. Cal-
    vard. – IEEE Trans. System, Man and Cybernetics – 1978, SMC-8: 630-632.




                                                144
The Method of Constructing the Membership Function to
        Classify Images Based on Histograms

                        Ivan Posokhov, Oksana S. Logunova

        Nosov Magnitogorsk State Technical University, Magnitogorsk, Russia
              posohof@gmail.com, logunova66@mail.ru



    Abstract. Enumerated the features of image samples used in assessing the quality
    of semi-finished and finished products in the metallurgical industry. Hypothe-
    sized the possibility of dividing the image into three classes. Introduced the image
    classification method based on the histogram. Method has been tested in the com-
    putational experiment.

    Keywords: image, histogram, decision-making.




                                              145