-

Методика построения функции принадлежности для классификации изображений на основе гистограмм яркости

0 Nosov Magnitogorsk State Technical University , Magnitogorsk , Russia

133 145

Аннотация. Приведены особенности изображений образцов используемых при оценке качества полуфабрикатов и готовой продукции в металлургической промышленности. Выдвинута гипотеза о возможности разделения изображений на три класса. Построена методика классификации изображений по гистограмме яркости. Методика была опробована в ходе вычислительного эксперимента. Ключевые слова: изображение, гистограмма, принятие решения Краткий теоретический анализ проблемы исследования изображений металлургической продукции Современное промышленное производство выдвигает новые требования к системам управления многостадийными производствами. Эти требования обусловлены внедрением новых приоритетных направлений, определенных государственной политикой в России. Одно из таких направлений - развитие информационно-телекоммуникационных технологий, которые являются неотъемлемой частью автоматизированных систем управления (АСУ) производством крупных промышленных предприятий. Использование новых модулей АСУ для многостадийных производственных процессов способствует повышению эффективности функционирования агрегатов и обеспечивает снижение доли продукции пониженного качества [1, 2]. При разработке и внедрении новых модулей, дополняющих существующие АСУ производства, появляется необходимость использования графической информации, получаемой в ходе оценки качества готовой продукции и полуфабрикатов. В области теории и практики использования графической информации и принятия решений в условиях АСУ производств накоплен значительный положительный опыт. Вопросы получения, обработки и сегментации изображений отра-

жены в трудах зарубежных и российских исследователей. Труды [3-5] определили развитие математической теории в области обработки графической информации.

Однако, несмотря на проведенные исследования и значительное число публикаций в области обработки графической информации, остаются актуальной проблема: отсутствие комплексных методик, позволяющих выполнять автоматическую обработку изображений, характерных при формировании базы данных информации и качестве металлургической продукции.

В сложивших условиях возникает необходимость в разработке автоматической гибкой системы обработки изображений, включающей отделение фона и объекта исследования, а также идентификации в пределах выделенного объекта исследования элементов, соответствующих нарушению сплошности образца. 2

Определение цели и задач исследования Учитывая проблемы оценки исходных изображений для металлургической продукции, была определена цель исследования как совершенствование существующих методов и средств анализа обработки графической информации о качестве металлургической продукции для ее последующего использования в управлении системой многостадийного производства непрерывнолитой заготовки.

Для достижения цели авторами работы решаются задачи: ─ проведение теоретико-информационного и теоретико-множественного анализа многостадийного производства непрерывнолитой заготовки и определение возможности и необходимости внедрения в систему управления производством эргатического модуля анализа изображения серного отпечатка; ─ построение комплекса методик, включающего алгоритмы анализа графической информации на основе классификации изображений по гистограмме яркости, автоматического отделения фона от объекта исследования, классификацию и идентификацию объектов на изображении, соответствующих нарушению сплошности заготовки; ─ построение методики экспертной оценки информации и принятие решений с использованием результатов идентификации объектов на изображении. В рамках представляемой статьи представлена методика анализа графической информации на основе классификации изображений по гистограмме яркости. Научную новизну, в отличии от известных методов классификации изображений, составляет методика, использующая характеристики бимодальной гистограммы, такие как положение минимального и максимального значения яркости. Характеристика набора исходных изображений для оценки качества По результатам пассивного экспериментального исследования, включающего сбор графической информации о качестве непрерывнолитой заготовки была сформирована база данных, содержащая 32 серных отпечатка. Изображения представляют собой оцифрованные серные отпечатки непрерывно литой заготовки (рис. 1).

а б в Рис. 1. Изображения серных отпечатков поперечных темплетов непрерывнолитой заготовок квадратного сечения: а – типовое изображение группы А с незначительным отличием яркости фона и объекта исследования; б - типовое изображение группы В со средним отличием яркости фона и объекта исследования; в - типовое изображение группы C с резким отличием яркости фона и объекта исследования Оцифровка серного отпечатка производится путем его сканирования. Так как размер серного отпечатка в среднем составляет 175×230 мм, то для его оцифровки применятся сканер формата А4 с разрешающей способностью не менее 300 точек на дюйм. Результирующие изображения в среднем имеют разрешение 42005500 точек. В ходе визуального анализа всех изображений было выявлено две особенности: ─ изображение отпечатка всегда содержит объект исследование (непосредственно изображение поперечного сечения заготовки размером 100100 мм) и окружающий фон, причем положение поперечного сечения (изучаемого объекта) является неопределенным (рис. 2); ─ все изображения можно разделить на три группы по отношению яркости объекта исследования и фона изображения. Типовые изображения каждой групп в порядке возрастания этого отношения приведены на рис. 1. Для сокращения объемов интерактивного определения области непосредственного исследования принято решение о построение алгоритма автоматического выделения этой области. Для автоматического поиска объекта на изображении многими авторами [9-10] предлагается использовать методы, основанные на сегментации изображений. Наиболее простым представителем методов сегментации является пороговая обработка. Данный метод применим для изображений содержащих известное число однородных по яркости классов точек, распределение вероятностей которых унимодальны. Кроме этого, граничные участки между замкнутыми областями должны занимать сравнительно небольшую площадь изображения.

Предлагается также применить методы сегментации на основе выделения границ (контуров). Методы требуют, чтобы между областями изображения существовал резкий перепад яркости, что характерно не для всех исходных изображений.

Поэтому авторы работы предлагают классифицировать изображения по гистограмме яркости преобразованного полутонового изображения. 4 Гистограммы яркости и преобразование изображения в полутоновое Авторами работы предварительно был проведен анализ гистограмм яркости для каждого канала пространства RGB1 и гистограмм яркости преобразованного полутонового изображения. Исходные растровые изображения серных отпечатков являются полноцветными и представлены в цветовой модели RGB с глубиной цвета 24 бита на пиксель и приводятся к полутоновым изображениям с глубиной цвета 8 бит на пиксель. Под полутоновыми изображениями в контексте работы 1 В RGB модели каждый цвет представляется красным, зеленым и синим первичными основными цветами (компонентами). 28  256 . Минимальное значение яркости – 0 соответствует черному цвету, максимальное – 255 соответствует белому цвету.

Основная стратегия преобразования полноцветного изображения в полутоновое заключается в использовании принципов фотометрии для сопоставления яркости изображения в оттенках серого и яркости исходного цветного изображения [6]. Яркость результирующего пикселя вычисляется как взвешенная сумма трех значений интенсивности модели RGB. Веса цветовых компонент выбраны в соответствии со стандартом ITU-R BT.709, который учитывает особенности человеческого восприятия, большая чувствительность к зеленому цвету и меньшая к синему:

Y  0,2126  R  0,7152  G  0,0722  B, где Y – яркость результирующего пикселя; R, G, B – значения цветовых компонент пикселя исходного изображения [7].

Гистограммой цифрового изображения называется дискретная функция h(rk )  nk , где rk – k -ый уровень яркости; nk – количество пикселей изображения с яркостью rk [4]. Для 8-битового изображения k изменяется в пределах [0; 255].

На рис. 3 – 5 приведены гистограммы для типовых изображений серных отпечатков, приведенных на рис. 1 каждого класса. На рис. 3 – 5 введено обозначение: N – количество пикселей на изображении заданного канала, тыс шт.

Для каждой группы изображений были получены гистограммы, имеющие характерные отличия в форме:

N 800 600 400 200 0 Рис. 3. Гистораммы для изображения группы А: а – гисторамма для красного канала; б – гистограмма для зеленого канала; в – гистограмма для синего канала; г – гисторамма полутонового изображения

N 800 600 400 200 0 Рис. 4. Гистораммы для изображения группы B: а – гисторамма для красного канала; б – гистограмма для зеленого канала; в – гистограмма для синего канала; г – гисторамма полутонового изображения

N 200 150 100 50 0 ─ гистограмма полутонового изображения является достаточной для классификации изображений, так как отклонение положений порога и максимумов канальных гистограмм по сравнению с гистограммой полутонового изображения составляет не более 15%; ─ начальное предположение о разделении выборки изображений на три группы подтверждена результатами вычислительного эксперимента и появилась необходимость в разработке методики идентификации формы гистограммы изображении серного отпечатка. где n(t) – количество пикселей изображения с яркостью t; N – общее количество пикселей изображения. Автор метода [8] доказал, что минимизация дисперсии внутри класса равносильна максимизации дисперсии между классами

 b2 (t)   2  2 (t)  1(t)2 (t)[1(t)   2 (t)]2 Методика идентификации формы гистограммы яркости серного отпечатка Для отнесения гистограммы к одному из классов изучены методы нахождения порогового значения по источникам [3-5,8,11]. Согласно этим источникам пороговое значение – это величина яркости, относительно которой гистограмма делится на две части.

Разделение гистограммы на две части позволяет найти максимы яркости каждой части. Поиск порогового значения яркости основан на использовании метода Оцу [8]. Метод позволяет разнести пиксели изображения на два класса, рассчитывая такой порог, чтобы внутриклассовая дисперсия была минимальной. Такая дисперсия выражается через взвешенную сумму дисперсий двух классов:  2 (t)  1(t) 12 (t) 2 (t) 22 (t) где  i – среднее арифметическое класса. После применения метода Оцу и нахождения значения порога яркости методика предполагает нахождение положения максимумов дискретной функции для каждой части гистограммы. Блок-схема методики классификации изображений низкой контрастности на основе гистограммы яркости приведена на рис. 6. Поиск выполнен простым перебором значений дискретной функции гистограммы в каждой ее части.

В блок-схеме приведенной на рис. 6 подпроцесс «Получение изображения» включает в себя чтение полноцветных изображений серных отпечатков непрерывнолитой заготовки с носителя и размещение его в памяти в виде массива пикселей. Подпроцесс «Построение канальных гистограмм яркости» выполняет построение гистограммы яркости для каждого из трех каналов в цветовом пространстве RGB, красного, зеленого и синего. В подпроцессе «Изображение к полутоновому» происходит преобразование изображения из полноцветного в полутоно( 1 ) (2) (3) вое, используя алгоритм BT709. За ним следует подпроцессы «Построение гистограммы полутонового изображения» для построения гистограммы изображения полученного на предыдущем шаге. Действия, входящие в подпроцессы «Поиск порогового значения» и «Поиск положений максимумов», представлены на блоксхеме (рис. 7).

Библиотека изображений Полноцветные изображения База данных Начало В результате применения методики формируется база данных, которая содержит следующие сведения: исходное изображение, полутоновое изображение, 6 Результаты тестирования методики классификации изображений на основе гистограммы яркости Для разработанной методики были проведены вычислительные эксперименты для всех собранных изображений. Для изображений, приведенных на рис. 1 были получены результаты, приведенные в табл. 1. Таблица 1. Результаты оценки порога яркости и максимальных значений дискретной функции для тестовых изображений Изображение Рис. 1а Рис. 1б Рис. 1в Изображение Рис. 1а Рис. 1б Рис. 1в В табл. 2 приведены результаты классификации изображений, включенных в общую базу данных на основе разработанной методики.

Таким образом, для принятия решения об отнесении изображения к одной из групп (А, В или С) можно построить функцию принадлежности адаптивного вида:

3  R   iTi min T Ti max mi min mmi max Mi min M Mi max , i0 (4) где R – множество возможных решений, состоящее из четырех элементов {0, 1, 2, 3}, значение которого соответствуют группам изображений: 1 – группа А; 2 – группа В; 3 – группа С; 0 – группа, объединяющая изображения не входящие ни в одну из групп классификации; T, m, M – количественные характеристики гистограммы изображения, выбранного для классификации: порог, максимум слева и максимум справа соответственно; Timin, Timax, mimin, mimax, Mimin, Mimax – эмпирические границы диапазона порога, максимума слева и максимума справа, определенные на основе эмпирического исследования и адаптируемые при обучении системы принятия решения о классификации изображений. 7

Заключение Таким образом, авторами по результатам визуального анализа была выдвинута гипотеза о возможности разделения изображений серных отпечатков непрерывнолитой заготовки на три класса. Для классификации изображений была построена методика классификации изображений по гистограмме яркости, учитывающая ее основные характеристики – значения порога яркости, максимум слева и справа.

Построенная методика была опробована в ходе вычислительного эксперимента, по результатам которого выполнено построение адаптивной функции принадлежности изображении к выбранным классам. Адаптация функции возможна в реальном времени при расширении базы данных изображений серных отпечатков в автоматическом режиме. В результате проведенного вычислительно эксперимента показано, что нет оснований для отклонения гипотезы о разделении исходных изображений на три класса. Список литературы 3. Шапиро, Л. Компьютерное зрение / Л. Шапиро, Дж. Стокман. – М.: БИ-НОМ. Лаборатория знаний, 2006. – 752 с. 4. Гонсалес, Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. – М.: Техносфера, 2005. – 1072 с. 5. Прэтт, У. Цифровая обработка изображений: пер. с англ. / У. Прэтт. – М. : Мир, 1982.

– Кн. 1. – 312 с. 6. Poynton, C. Rehabilitation of gamma / Charles Poynton. – Photonics West'98 Electronic

Imaging. International Society for Optics – 1998. 7. A Standard Default Color Space for the Internet – sRGB / M. Stokes, M. Anderson, S. Chandrasekar, R. Motta., 1996. URL: http://www.w3.org/Graphics/Color/sRGB.html (дата обращения 06.01.2014) 8. Otsu, N. A Threshold Selection Method from Gray-Level Histograms / Nobuyuki Otsu. –

IEEE Transactions on Systems, Man, and Cybernetics, Vol. 9, No. 1, 1979, pp. 62-66. 9. Методы автоматического обнаружения и сопровождения объектов. Обработка изображений и управление / Б.А. Алпатов, П.В. Бабаян, О.Е. Балашов, А.И. Степашкин. – М.: Радиотехника, 2008. – 176 с. 10. Волков, В.Ю. Выделение прямолинейных кромок на зашумленных изображениях / В.Ю. Волков, Л.С. Турнецкий, А.В. Онешко. – Информационно-управляющие системы. – 2011. – № 4. – С. 13–17. 11. Ridler, T.W. Picture thresholding using an iterative selection method / T.W Ridler, S. Calvard. – IEEE Trans. System, Man and Cybernetics – 1978, SMC-8: 630-632.

Ivan Posokhov, Oksana S. Logunova Abstract. Enumerated the features of image samples used in assessing the quality of semi-finished and finished products in the metallurgical industry. Hypothesized the possibility of dividing the image into three classes. Introduced the image classification method based on the histogram. Method has been tested in the computational experiment.

1. Logunova , O.S. Integrated system structure of intelligent management support of multistage metallurgical processes / O .S. Logunova,

I.I.

Matsko ,

I.A.

Posochov . - Vestnik of Nosov Magnitogorsk state technical university, 2013 . - № 5. - Pр. 50 - 55 .