<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Применение методов нечеткого кластерного анализа к задаче сегментации потребителей рынка изоляционных материалов</article-title>
      </title-group>
      <fpage>197</fpage>
      <lpage>204</lpage>
      <abstract>
        <p>Уральский федеральный университет (Екатеринбург) Работа посвящена применению методов нечеткого кластерного анализа к решению задачи сегментации потребителей изоляционных материалов города Екатеринбурга с построением профилей этих сегментов. Для проведения сегментации используется алгоритм нечеткой кластеризации методом c-средних. В работе была проведена сегментация групп ¾любители¿ и ¾профессионалы¿. В результате были выделены подгруппы покупателей со схожими характеристиками, оценен размер этих подгрупп и дано их описание. Ключевые слова: сегментация рынка; кластерный анализ; нечеткая логика; метод нечетких c-средних.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>Впервые понятие нечеткого множества ввел Лотфи Заде в 1965 году, опубликовав работу по теории
нечётких множеств, в которой изложил математический аппарат теории нечетких множеств. Нечеткие
методы позволяют одному и тому же объекту одновременно принадлежать нескольким, или даже всем
кластерам, но с разными степенями принадлежности. Во многих случаях нечеткая кластеризация более
естественная и наглядная, чем четкая.
2</p>
      <p>Постановка задачи
Цель данной работы - решение задачи сегментации потребителей изоляционных материалов на примере
города Екатеринбурга с дальнейшим построением профилей этих сегментов.</p>
      <p>Исходными данными являются реальные данные, полученные с рынка города Екатеринбурга некоторой
компанией, в которую занесены ответы на анкету респондентов, занимающихся ремонтными работами с
использованием различных изоляционных материалов. Все респонденты поделены на две группы в
зависимости от того, связана ли их профессиональная деятельность со строительством и ремонтом:
¾профессионалы¿ и ¾любители¿. Для каждой группы будет проведена своя сегментация. Анкета содержала в себе
вопросы касательно образования респондентов, их предпочтений в выборе фирм-производителей
изоляционных материалов, семейного положения, доходов, рода занятий, и демографический блок вопросов.
3</p>
      <p>Реализация
Были произведены центрирование и нормирование данных, а также удаление данных с некорректными
значениями.</p>
      <p>Для проведения сегментации используется один из наиболее известных методов нечеткой кластеризации
– алгоритм нечетких c-средних. В ходе данного алгоритма решается задача минимизации критерия
X</p>
      <p>X (μki)m kVi − Xkk2 ,
i=1,c k=1,M
(1)
где Vi – центры кластеров, Xk - элементы кластеризации, m ∈ (1, ∞) – экспоненциальный вес, μki
степень принадлежности k-го элемента i-му кластеру.</p>
      <p>
        Параметрами алгоритма нечетких c-средних являются: c – число кластеров, m – экспоненциальный вес
m ∈ (1, ∞). Экспоненциальный вес m влияет на матрицу степеней принадлежности. Чем больше m, тем
конечная матрица c-разбиения становится более “размазанной”, и при m → ∞ она примет вид M = 1/c,
что является очень плохим решением, т. к. все объекты принадлежат ко всем кластерам с одной и той же
степенью[
        <xref ref-type="bibr" rid="ref2">2</xref>
        ].
      </p>
      <p>
        Каждый кластер является нечетким множеством. Множеством альфа-уровня нечеткого множества
называют множество, состоящее из элементов, для которых степень принадлежности больше значения
альфа уровня α ∈ (0, 1) [
        <xref ref-type="bibr" rid="ref3">3</xref>
        ]. Будем считать что элемент принадлежит сегменту, если он принадлежит
множеству альфа-уровня.
При m → 1 результаты кластеризации приближаются к результатам четкой кластеризации, каждый
элемент имеет степень принадлежности близкую к единице к какому-то одному кластеру, и почти нулевую
к остальным.
В качестве примера была проведена сегментация группы респондентов профессионально занимающихся
строительством и ремонтом по следующим переменным: пол, возраст, род занятий, образование, семейное
положение, среднемесячный доход на одного члена семьи, кем работает респондент, длительность
профессиональной деятельности в области строительства и ремонта (в частности работ, связанных с изоляцией),
связь образования со строительством, архитектурой и дизайном.
      </p>
      <p>Число сегментов было выбрано равным 4, экспоненциальный вес m = 1.6. На рисунке 1 приведен
график размера сегмента в зависимости от значения α−уровня.</p>
      <p>Рис. 1: Зависимость размера сегмента от значения α− уровня
При увеличении значения α−уровня размеры сегментов уменьшаются, при α = 1, размеры всех
сегментов равны 0, а при α = 0 каждый сегмент содержит в себе все элементы.</p>
      <p>Для дальнейшего анализа было выбрано значение альфа уровня равное 0.5. Причины:
• при данном уровне α любой элемент гарантированно принадлежит не более чем одному сегменту
• почти все элементы распределены по сегментам, количество элементов не попавших в сегменты 20
из 80 (25 % ) . Элементы, не попавшие в сегменты, являются граничными и носят характеристики
промежуточные между разными сегментами. Исключение таких элементов из рассмотрения является
целесообразным и позволяет более качественно определить характеристики сегментов.
• по графику видно, что в окрестности α = 0.5 размеры сегментов меняются незначительно, что говорит
об устойчивости данного значения.
На основании кластеризации были получены следующие сегменты:</p>
      <p>Таблица 1: Первый сегмент
Первый сегмент составляет группа людей, типичным представителем является женщина, имеющая
образование в области строительства, архитектуры или дизайна. Фактически представители этого сегмента
могут решать функции снабженца или консультанта в области отделки и дизайна, осуществляя
приобретение изоляционных материалов в интересах заказчика в рамках работы над разработанным проектом.</p>
      <p>Таблица 2: Второй сегмент
Представители этого сегмента демонстрируют устойчивую в профессиональной среде модель, когда
выбор поставщика материала происходит не от покупки к покупке, а один раз на достаточно
продолжительный период. Это объясняется обычной привычкой, а также соображениями о стабильности условий
произведения работ.</p>
      <p>Таблица 4: Четвертый сегмент
Сегментация группы ¾любители¿ была проведена по следующим переменным: пол, возраст, род занятий,
образование, семейное положение, среднемесячный доход на одного члена семьи, а также кем работает
респондент.
Число сегментов было выбрано равным 3, экспоненциальный вес m = 1.3. На рисунке 2 приведен график
размера сегмента в зависимости от значения α−уровня.
Для дальнейшего анализа было выбрано значение α− уровня равное 0.6. Причины:
• при данном уровне α любой элемент гарантированно принадлежит не более чем одному сегменту.
• почти все элементы распределены по сегментам, количество элементов не попавших в сегменты 14 из
153 ( около 10 % ) . Элементы, не попавшие в сегменты, являются граничными и носят характеристики
промежуточные между разными сегментами. Исключение таких элементов из рассмотрения является
целесообразным и позволяет более качественно определить характеристики сегментов.
• по графику (рис.2) видно, что в окрестности α = 0.6 размеры сегментов меняются незначительно, что
свидетельствует об устойчивости данного значения.
На основании кластеризации были получены следующие сегменты:</p>
      <p>Таблица 5: Первый сегмент</p>
      <p>Модель выбора материала для любителей одинакова, в ней чаще всего задействован продавец, а сам
выбор происходит в месте продаж. Очевидно, что на текущий момент это точка наиболее эффективной
коммуникации с представителями целевой аудитории. В сегмент входят чувствительные к цене
потребители.
Список литературы</p>
      <p>Application of fuzzy clustering methods to the market segmentation
of insulation materials’ consumers.</p>
    </sec>
    <sec id="sec-2">
      <title>Alexander A. Akishev</title>
      <p>Ural Federal University (Yekaterinburg, Russia)</p>
    </sec>
    <sec id="sec-3">
      <title>Mikhail G. Blizorukov</title>
      <p>Ural Federal University (Yekaterinburg, Russia)</p>
      <p>Abstract. This paper presents the application of the fuzzy clustering methods to the market segmentation of
consumers of the insulation materials as an the example of Yekaterinburg and the description of these segments.
The segmentation was performed using the fuzzy c-means algorithm. The segmentation was made for the groups
called "amateurs"and "professionals". As a result the segments of customers with similar characteristics were
found, the size of the subgroups was estimated and the description was given.</p>
      <p>Keywords: market segmentation; cluster analysis; fuzzy logic; fuzzy c-means algorithm.</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          [1]
          <string-name>
            <given-names>B.</given-names>
            <surname>Duran</surname>
          </string-name>
          ,
          <string-name>
            <given-names>P.</given-names>
            <surname>Odell</surname>
          </string-name>
          .
          <article-title>Cluster analysis</article-title>
          . Berlin, Springer-Verlag ,
          <year>1974</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          [2]
          <string-name>
            <given-names>S. D.</given-names>
            <surname>Stovba</surname>
          </string-name>
          .
          <article-title>Designing fuzzy systems using MATLAB</article-title>
          . Moscow, Hotline - Telecom,
          <year>2007</year>
          .
          <article-title>(in Russian) = С</article-title>
          . Д. Штовба.
          <article-title>Проектирование нечетких систем средствами MATLAB</article-title>
          . М.,
          <string-name>
            <surname>Горячая</surname>
          </string-name>
          линия - Телеком,
          <year>2007</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          [3]
          <string-name>
            <given-names>L. K.</given-names>
            <surname>Konysheva</surname>
          </string-name>
          ,
          <string-name>
            <given-names>D. M.</given-names>
            <surname>Nazarov</surname>
          </string-name>
          .
          <article-title>Basics of the theory of fuzzy sets: Tutorial</article-title>
          . Saint Petersburg,Piter,
          <year>2011</year>
          .
          <article-title>(in Russian) = Л</article-title>
          . К. Конышева, Д. М. Назаров.
          <article-title>Основы теории нечетких множеств: Учебное пособие</article-title>
          .
          <source>СПб</source>
          .,
          <string-name>
            <surname>Питер</surname>
          </string-name>
          ,
          <year>2011</year>
          .
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>