<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Применение методов Data Science и математической статистики для структурирования спроса и предложения на промышленные товары и услуги</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>п VII к</string-name>
        </contrib>
        <contrib contrib-type="author">
          <string-name>lvzhukova@hse.ru</string-name>
        </contrib>
      </contrib-group>
      <fpage>336</fpage>
      <lpage>346</lpage>
      <abstract>
        <p>Аннотация: в статье предлагается описание подхода к решению задачи структурирования спроса и предложения товаров и услуг. Предлагаемый подход, основанный на использовании методов Data Science, позволит реализовать современный инструментарий контроля за развитием промышленности в г. Москве. Подобный инструментарий дает возможность анализировать большое количество важнейших разнообразных структурированных, не структурированных и слабо структурированных данных из любых открытых источников, что позволит максимально точно оценить появление позитивных и негативных тенденций в изменении показателей деятельности предприятий промышленности г. Москвы. Ключевые слова: кластеризация, Data Science, спрос и предложение, промышленные товары и услуги.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>Zhukova Lyudmila Vyacheslavovna</title>
      <p>senior lecturer, Department of applied Economics,
national research University Higher school of Economics»,</p>
      <p>specialist of JSC "EC-leasing»,
117587, Moscow, Varshavskoye shosse 125, building 1, office 4 h at 2 p VII 5
lvzhukova@hse.ru</p>
    </sec>
    <sec id="sec-2">
      <title>Kovalchuk Ivan Mikhailovich</title>
    </sec>
    <sec id="sec-3">
      <title>Senior business analyst, JSC "EC-leasing" 117587, Moscow, Varshavskoye shosse 125, building 1, office 4 h at 2 p VII 5 ikovalchuk@ec-leasing.ru</title>
    </sec>
    <sec id="sec-4">
      <title>Anastasia Kiryushina A. Ph. D.,</title>
    </sec>
    <sec id="sec-5">
      <title>Senior business analyst, JSC "EC-leasing" 117587, Moscow, Varshavskoye shosse 125, building 1, office 4 h at 2 p VII 5 akiryushina@ec-leasing.ru</title>
    </sec>
    <sec id="sec-6">
      <title>Chugunov, Vitaly R.</title>
      <p>Chief Information Officer (CIO）JSC "EC-leasing"
117587, Moscow, Varshavskoye shosse 125, building 1, office 4 h at 2 p VII 5</p>
      <p>vchugunov@ec-leasing.ru
Введение
работать. Мониторинг и анализ большого количества данных, выполняемых с помощью методов Data Science,
позволяет оценивать появление позитивных и негативных тенденций в изменении показателей деятельности
предприятий промышленности г. Москвы.</p>
      <p>Целью данного исследования является определить возможности структурирования спроса и предложения путем
применения методов Data Science и математической статистики для решения задач в области контроля за
развитием промышленности в г. Москве с применением данных из внешних открытых источников. Под этими данными
понимаются интернет ресурсы, доступные каждому пользователю. Для исследования был выбран портал гос.
закупок - сайт единой информационной системы в сфере закупок. Достижение цели исследования будет решаться на
примере задачи структурирования спроса и предложения на промышленные товары и услуги.
Для достижения поставленной цели необходимо:
− сформулировать постановку задачи  
− провести анализ предметной области; 
− дать описание подхода к решению задачи; 
− получить результаты, соответствующие требованиям.  
1 Постановка задачи
Предлагаемый авторами подход решения задачи предполагает разработку и применение алгоритмов, позволяющих
на основе анализа данных из внешних открытых источников решить следующие задачи:
− построить однородные группы предприятий г. Москвы по показателям, характеризующим спрос и
предложение на промышленные товары и услуги по данным их деятельности на торговом портале
государственных закупок; 
− провести сравнительный анализ полученных групп на предмет сходства и отличий по
финансовоэкономическим показателям; 
− сформировать перечень показателей, характеризующих спрос и предложение на группы промышленных
товаров и услуг. 
Подход решения задачи включает постановку цели, обследуемый период, объект исследования, данные, схему
решения задачи и ожидаемые результаты (см. рисунок 1)
.</p>
      <p>Рисунок 1 – Общая схема подхода решения задачи
По мнению авторов, использование предлагаемого подхода позволит повысить качество проведения
мониторинга и анализа состояния экономики г. Москвы, а также даст объективную основу для совершенствования качества
мероприятий по поддержке и стимулированию деятельности в сфере промышленности города Москвы.</p>
      <p>Задача структурирования спроса и предложения на промышленные товары и услуги относится как к области
промышленного маркетинга, так и к области государственного и муниципального управления развитием отрасли
региона.</p>
      <p>Исследование проведено с точки зрения необходимости расстановки приоритетов мер поддержки развития
предприятий промышленности города. Одним из инструментов в аналитике при решении вопросов расстановки
приоритетов мер поддержки развития предприятий промышленности города может стать структурирование спроса
и предложения на промышленные товары и услуги.</p>
      <p>Под структурированием в данном случае понимается набор однородных групп объектов исследования с
характеристиками, отражающими особенности этих групп. Под спросом и предложением авторы понимают сделки между
компаниями на интернет портале гос. закупок. Спросом являются тендеры, объявленные компаниями-заказчиками, а
предложением – тендеры с установленными компаниями-исполнителями. Поэтому важно оценивать сделки между
компаниями и непосредственно сами компании. В сегменте промышленных товаров и услуг на долю сделок с
юридическими лицами приходится основной оборот, поэтому в статье изучаются рынки B2B, B2G, G2G, G2B.</p>
      <p>Москва, как известно, является ведущим промышленным регионом России с высоким экономическим потенциалом.
Объем ВРП на душу населения в 2016 году составил 1 157 тыс. рублей, что почти в 2 раза превышает среднероссийский
уровень. На долю Москвы приходится более ⅕ объема валовой добавленной стоимости всех регионов России.
Экономика Москвы характеризуется диверсифицированной постиндустриальной структурой ВРП. На долю промышленности
приходится 16,1 % валовой добавленной стоимости (в том числе на обрабатывающие производства - 12%. [5]
Для получения показателей, характеризующих деятельность предприятий и организаций г. Москвы -
производителей и поставщиков промышленных товаров и оказывающих услуги - авторами предлагается использовать по
данным из открытых внешних источников данные с торговой площадки государственных закупок.</p>
      <p>Чтобы проверить гипотезу о взаимосвязи характеристик торговой деятельности на площадке государственных
закупок и характеристик спроса и предложения на промышленные товары проведен анализ расходов средств из
государственного бюджета на предмет определения доли расходования бюджетных средств через торговой
площадку государственных закупок. По результатам анализа выявлено следующее. Согласно данным из отчетов об
исполнении федерального бюджета Российской Федерации и отчетов об исполнении бюджета г. Москвы на долю
закупки товаров из бюджета приходится в среднем 21% всех бюджетных расходов, осуществляемых через
торговую площадку государственных закупок. Это подтверждает значимость оборота через гос. закупок.</p>
      <p>На сегодняшний день 90% закупок Москвы проходит в электронном виде. По данным “РТС-Тендер”, в 2017 г.
российский рынок госзакупок достиг 36,5 трлн руб. На нем было заключено более 4 млн сделок. Лидером рынка
является Москва – в 2017 г. столица закупила товаров и услуг на 2 трлн руб. по 44-ФЗ и на 13,9 трлн руб. по
223ФЗ, что в сумме составляет около 44% всего объема госзакупок страны.</p>
      <p>На площадке представлены в качестве заказчиков и поставщиков по г. Москве более половины всех
юридических лиц, зарегистрированных в г. Москве. Среди средних и крупных предприятий около 80% зарегистрированы на
торговой площадке государственных закупок.</p>
      <p>Это подтверждает представительность данных с торговой площадки для характеристики спроса и предложения.
Признаками структурирования спроса и предложения на промышленные товары и услуги г. Москвы являются
показатели, характеризующие группы предприятий и организаций г. Москвы, поставляющих промышленные
товары и оказывающие услуги в г. Москве. Для структурирования необходимо выявить профиль типовых игроков
рынка, характеристики их финансовой деятельности.</p>
      <p>В качестве объектов исследования выступают предприятия, участвующие на портале государственных закупок,
предметом исследования являются их финансовые показатели, свидетельствующие о прибыльности и доходности
деятельности.
2 Описание подхода к решению задачи 
Структурирование предполагает разбиение на однородные группы объектов, характеризующиеся схожими
показателями. В качестве показателей выбраны финансовые показатели деятельности компаний за 2016 - 2017 год,
показатели участия компании на торгах на госзакупках в 2016 и 2017 году.</p>
      <p>Для решения задачи разработана экономико-математическая модель (далее ЭММ) (см. рисунок 2)
- набор алгоритмов расчета показателей, необходимых для кластеризации и типизации деятельности
предприятий, задействованных на портале государственных закупок.</p>
      <p>Структура компаний промышленного сектора не однородна по размеру. Авторы отмечают особенности крупных
компаний, отличающихся от остальных игроков рынка. В г. Москве действуют несколько крупных компаний
промышленного сектора, являющихся выдающимися для рынка всей РФ, такие как АО Вимм-Билль-Дан, АО "МПО
им. Румянцева".</p>
      <p>Поэтому ЭММ, разработанная авторами, предполагает сначала типизацию объектов по размеру компаний,
выделение крупных, “доминирующих” компаний, и сегментацию остальных на однородные группы.
Рисунок 2 – Схема ЭММ
В общем подходе предусмотрено рассмотрение объектов и их типизация по заданным признакам, затем
сегментация уже внутри выделенных групп. Тогда выделенные в процессе применения математических методов группы
будут однородны по набору выявленных признаков.</p>
      <p>Для типизации и сегментации были отобраны следующие существенные показатели деятельности компании,
влияющие на возможные объемы его производства (как для характеристики предложения его продукции, так и для
оценки спроса этого предприятия на продукцию и услуги других компаний промышленного сектора). Были
выбраны две группы показателей:
1. Характеристики деятельности компаний в целом включают:
Показатели уставного капитала;
Средние показатели финансовой деятельности;
Анализ динамики выручки;
Капитал и валюта баланса:
2. Показатели участия в торгах на портале государственных закупок:
Доля участников в роли поставщика, %
Среднее количество контрактов
Средняя сумма контракта, млн. рублей
Статистика и эконометрика предполагает только построение экономико-математических моделей в то время, как
Методы Data Science позволяют автоматизировать проверку гипотез, предобрабатывать данные, выявляя аномалии,
а также изучать структуру данных.</p>
      <p>Кластерный анализ как метод получения групп является разделом машинного обучения, который является
одним из разделов Data Science</p>
      <p>По результатам кластеризации определяются диапазоны значений в каждом типовом кластере,
характеризующем предприятия, создающие спрос предприятия, создающие предложение, которые могут быть использованы в
разработке шаблонов управленческих решений в области управления мерами поддержки и стимулирования
деятельности в сфере промышленности предприятий среднего, малого бизнеса и микропредприятий.</p>
      <p>В решаемой задаче применялась именно кластеризация, так как сущность полученных классов заранее не
известна.</p>
      <p>Авторы статьи выбрали для апробации методы кластеризации - BIRCH (двухшаговая кластеризация) и
самоорганизующиеся карты Кохонена.</p>
      <p>При выборе метода кластеризации учитывалось, что показатели кластеризации по выборке все числовые, и есть
необходимость выбрать число кластеров. Число объектов невелико (до 1000). Также выбранные методы,
реализованные в стандартных прикладных программах статистической обработки, а также в бесплатных библиотеках
машинного обучения, написанные для языка программирования Python.</p>
      <p>Метод BIRCH (двухшаговая кластеризация) как раз основан на разбиении неоднородных объектов на группы по
заданным числовым показателям. На первом шаге на основании критерия Акаике выбирается оптимальное число
кластеров. Затем происходит последовательно разделение.</p>
      <p>Данный метод относится к классу иерархических. Все алгоритмы кластеризации разделяются на два вида по
способу обработки данных, а именно на иерархические и неиерархические. Особенность иерархических
алгоритмов заключается в том, что они предполагают последовательный пересмотр всех расстояний и выбор наименьшего,
после чего происходит объединение в кластер и далее снова рассматривается расстояние от созданного кластера до
каждого объекта.</p>
      <p>В качестве математического критерия качества построенной кластеризации методом BIRCH выбран сводный
показатель силуэтной меры (более 0,6, максимум достигается – в 1). При таком уровне сохраняется баланс между
количеством кластеров, значимостью различия между ними и точностью результатов.</p>
      <p>Этот показатель показывает, насколько среднее расстояние до объектов своего кластера отличается от среднего
расстояния до объектов других кластеров. Данная величина лежит в диапазоне [-1; 1] . Значения, близкие к -1,
соответствуют плохим (разрозненным) кластеризациям, значения, близкие к нулю, говорят о том, что кластеры
пересекаются и накладываются друг на друга, значения, близкие к 1, соответствуют "плотным" четко выделенным
кластерам.</p>
      <p>Достоинством метода является автоматизированная процедура выбора количества кластеров, высокая скорость и
хорошая масштабируемость для любого количества точек. Недостатком этого метода является работа только с
числовыми показателями, требует устранения пропусков в данных. Этот алгоритм при реализации содержит ошибки,
обусловленные тем, что для добавляемой точки находится не самый близкий узел [4].</p>
      <p>Альтернативный метод, основанный на другом подходе - карты Кохонена - на создании нейронной сети,
весовых коэффициентах и наглядной визуализации полученных результатов.</p>
      <p>Самоорганизующиеся карты (Self Organizing Maps, или SOM) – это один из видов нейросетевых [2, 8]
алгоритмов, основная особенность которого состоит в том, что он подразумевает обучение без учителя, то есть не
требуется априорной информации о принадлежности объектов к группе. Самоорганизующиеся карты часто используются
в моделировании, прогнозировании, нахождении взаимосвязей и закономерностей в условиях большого объема
данных. SOM представляет собой двухслойную сеть. Каждый нейрон первого (распределительного) слоя соединен
со всеми нейронами второго (выходного) слоя, которые расположены в виде двумерной решетки.</p>
      <p>Нейроны выходного слоя называются кластерными элементами, их количество определяет максимальное
количество групп, на которые система может разделить входные данные.</p>
      <p>Достоинства: используется универсальный апроксиматор – нейронная сеть, обучение сети без учителя,
самоорганизация сети, простота реализации, гарантированное получение ответа после прохождения данных по слоям.
Недостатки: работа только с числовыми данными, минимизация размеров сети, необходимо задавать количество
кластеров.  </p>
      <p>Таким образом, применение методов Data Science позволит получить набор однородных по своим показателям
группы предприятий, характеризующие особенности спроса и предложения, типовые профили компаний,
создающих спрос, компаний, создающих предложение и компаний, создающих и спрос, и предложение.
2.1 Описание анализируемых данных  
Для исследования был сформирован список из 506 компаний, по которым доступны сведения в открытых
источниках. Для анализа было выбрано 338 компаний г. Москвы, действующих в области промышленности как
непосредственной в обрабатывающем производстве, так и косвенно относящиеся к промышленности, например, когда речь
идет об оказании услуг, связанных с научной, инженерно-технической и профессиональной деятельностью.
2.2 Описание решения задачи  
Задача решена в два этапа. На этапе 1 были отобраны 34 компании, это группа доминирующих компаний, которая
получена путем отбора объектов исследования на основании прямых и косвенных критериев.</p>
      <p>Прямыми критериями отбора являются показатели выручки, прибыли (убытка) до налогообложения и уставного
капитала по данным бухгалтерской (финансовой) отчетности за 2016 год и за 2017 год.</p>
      <p>Косвенными критериями отбора являются показатели влияния на отрасль согласно Приказу Минпромторга
России от 13.04.2015 N 798 (ред. от 30.07.2018) "Об утверждении Перечня организаций, оказывающих существенное
влияние на отрасли промышленности и торговли" и показатель максимальной суммы контракта согласно
Федеральному закону от 05.04.2013 N 44-ФЗ (ред. от 01.05.2019) "О контрактной системе в сфере закупок товаров,
работ, услуг для обеспечения государственных и муниципальных нужд" (с изм. и доп., вступ. в силу с 12.05.2019).
Методика отбора в 1-ю группу заключается:
- в проверке превышения хотя бы одного из прямых критериев порогового значения:
o выручки более 600 млн. рублей в год;
o прибыли (убыток) до налогообложения более 200 млн. рублей в год;
o уставного капитала более 700 млн. рублей в год;
- с учетом косвенных критериев:
o влияния на отрасль;
o максимальной суммы контакта.</p>
      <p>Результаты формирования 1-й группы используются в решении задачи группировки всех объектов и выделение
групп по размеру.</p>
      <p>По итогам сравнения результатов деятельности доминирующих компаний с показателями индекса
промышленного производства г. Москвы наблюдается соответствие положительного тренда в промышленности и в
обрабатывающем производстве по всему городу положительному тренду в финансовых результатах доминирующих
компаний. Динамика налоговых платежей в 2016 - 2017 гг. представлена в таблице 1.</p>
      <p>Таблица 1 – Динамика налоговых платежей в 2016 - 2017 гг.
Показатели
Динамика налоговых доходов в
бюджет г. Москвы
Динамика налоговых платежей
доминирующих компаний
Темп роста
2016-2017 гг.</p>
      <p>115%
244%
Темп прироста
2016-2017 гг.</p>
      <p>15%
144%
Показатели участия доминирующих компаний в контрактах на портале государственных закупок с исполнением
в г. Москве представлена в таблице 2.
Таблица 2 – Показатели участия доминирующих компаний в контрактах на портале государственных закупок с
исполнением в г. Москве
Показатели
Общее количество контрактов доминирующих
компаний на портале государственных закупок,
исполненных на территории г. Москвы</p>
      <p>Общее количество контрактов на портале
государственных закупок, на территории г. Москвы
Водоснабжение; водоотведение, услуги по удалению и
рекультивации отходов
Сооружения и строительные работы
Услуги транспорта и складского хозяйства
Электроэнергия, газ, пар и кондиционирование воздуха
Всего
148
97
32
13
6
2
2
1
1
1
1
304
100,0
48,7
31,9
10,5
4,3
2,0
0,7
0,7
0,3
0,3
0,3
0,3
Остальные 304 компании были проанализированы на наличие однородных подгрупп методами кластерного
анализа.
3 Результаты применения различных методов кластеризации 
3.1 Результаты выявления однородных групп методами кластеризации BIRCH 
Для выявления однородных групп по набору признаков, характеризующих размеры компаний, был применен метод
кластерного анализа. В процессе были определены оптимальное количество кластеров и произведено разбиение по
следующим показателям, характеризующим торговлю на государственных закупках и основные финансовые
показатели компании за 2016 - 2018 гг.:
1) Участие в роли поставщика и покупателя
2) Количество заключенных контрактов за 2016, 2017 и 2018 гг.
3) Сумма контрактов за 2016, 2017 и 2018 гг.
4) Сумма общего баланса по бюджетной отчетности компании за 2016 и 2017 гг.
5) Рентабельность деятельности в 2016, 2017 гг.</p>
      <p>6) Средняя и максимальная сумма контракта, заключенная на электронном портале государственных закупок.
Для проведения кластеризации авторами использовалась бесплатная библиотека машинного обучения для языка
программирования python - scikit-learn, библиотеки для визуализации, обработки и анализа данных - pandas и
matplotlib.</p>
      <p>Результаты применения двухшагового метода кластеризации (BIRCH) позволили определить оптимальное
количество кластеров и группировку на 3 кластера (см. рисунок 3)
Рисунок 3 – Количественные характеристики кластеров, полученные двухшаговым методом кластеризации
(BIRCH)
Основные характеристики кластеров представлены в таблице 4.</p>
      <p>Таблица 4 – Основные характеристики кластеров
Наименование показателя
Уставной капитал, медианное значение
(наиболее часто встречающееся), тыс. р
Средняя выручка, тыс.р.
Медианный (наиболее часто
встречающийся) капитал, млн.р.
Средний прирост выручки, тыс.р.
Среднее количество контрактов на
портале госзакупок
Сумма контрактов на портале госзакупок,
млн.р.</p>
      <p>Распределение по отраслям представлено в таблице 5
Продукция обрабатывающих
производств
Услуги, связанные с научной,
инженерно-технической и профессиональной
деятельностью
Услуги в области информации и связи
Услуги, связанные с недвижимым
имуществом
900-1000
21 - 29
Кластер 1 (82,6%)
50
Кластер 2 (13,5%)
277 400
Кластер 3 (3,8%)</p>
      <p>2 300 000
Таблица 5 – Распределение по отраслям
Кластер 1 (82,6%)
Кластер 2 (13,5%)</p>
      <p>Кластер 3 (3,8%)
На примере выборки из 450 предприятий (проект КСП промышленность) была решена задача кластеризации
предприятий по группе финансовых показателей (баланс предприятия, прирост баланса, выручка, сумма контрактов на
госзакупках и т. п.) и методом самоорганизующихся карт Кохонена (SOM). Этот метод на основе заданного
количества итераций (25 000 итераций) разбил всю выборку на 8 кластеров.</p>
      <p>При анализе полученных кластеров было выявлено, что 5 из них являются малыми по объему значений (до 10
единиц). Два самых крупных кластера, как и в предыдущем методе, собрали в себя самые крупные компании и
самые небольшие, являющиеся исполнителями по контрактам на портале госзакупок.</p>
      <p>Недостатком полученного метода является необходимость удалять наблюдения с пропущенными значениями,
например, при отсутствии сведений о балансе.</p>
      <p>Полученная кластеризация имеет экономическое обоснование, однако не учитывает особенности влияния
некоторых факторов через нелинейное воздействие. Поэтому был применен подход, основанный на кластеризации с
помощью нейронных сетей - карт Кохонена и осуществлена визуализация результатов. В дальнейшем, если модель
карт будет использоваться, то это поможет выявить аномалии. Аномалия выявляется тогда, когда в следующий раз
в набор данных попадут объекты, не похожие ни на один из известных образцов.</p>
      <p>В результате применения метода было получено достаточно большое количество кластеров для интерпретации,
некоторые со схожими характеристиками. В целом было выявлено также группа крупных предприятий,
выступающих в качестве поставщиков и заказчиков. Они создают как спрос, так и предложение, сохраняя стабильность.
Также выделилось несколько кластеров из малых и микропредприятий, которые выступают поставщиками, и
отличаются лишь динамикой финансовых показателей.
Благодаря типизации и методам кластеризации были выявлены 3 основные группы компаний, характеризующие
спрос и предложение:
1) спрос обеспечивают крупные и средние предприятия, с сохранением финансовой стабильности спроса в
2016 - 2018 гг. Их доля относительно остальных не велика (25%), но размер выручки , прибыли и валюты
баланса во много раз превосходит средние значения малых предприятий.
2) предложение создают малые и микропредприятия., динамика которых не стабильна, отмечается небольшая
отрицательная динамика финансовых показателей в этом секторе.
Применение разных методов кластеризации дали схожие результаты, однако применение метода birch оказалось
проще и доступнее. У метода BIRCH существует хорошо описанная документация на официальном сайте
бесплатно распространяемой библиотеки машинного обучения. Задача визуализация самоорганизующихся карт Кохонена
оказалась нетривиальной. Использование самоорганизующихся карт потребует более глубокие знания
программирования на языке python. Плюсом использования метода BIRCH является заранее не предопределенное количество
кластеров, что уменьшает количество итераций применения этого метода. Лучший по показателю меры качества
(критерию качества кластеризации) результат в самоорганизующихся картах дается при большем количестве
кластеров, часть из которых с малым количеством объектов.
4 Заключение 
Авторы в своей работе провели исследование на предмет определения возможностей применения методов Data
Science и математической статистики для решения задач в области контроля за развитием промышленности в г.
Москве с применением данных из внешних открытых источников на примере задачи структурирования спроса и
предложения на промышленные товары и услуги. Были получены профили компаний, отражающие особенности
спроса и предложения в группах (кластерах).</p>
      <p>Для достижения поставленной цели сформулирована постановка задачи, проведен анализ предметной области,
дано описание подхода к решению задачи и получены результаты согласно поставленной задаче.</p>
      <p>По результатам анализа предметной области получено обоснование гипотезы значимости использования
открытых данных о деятельности предприятий и организаций, размещенных на электронной торговой площадке
государственных закупок.</p>
      <p>Стоит заметить, что при применении данного подхода к исследованию спроса и предложения предприятий,
расположенных в небольших городах, результаты могут быть нерелевантными, вследствие отсутствия достаточного
количества наблюдений для проведения анализа. Для решения этой проблемы следует определить набор
показателей, присущих городам, в которых расположены исследуемые предприятия.</p>
      <p>Помимо проведения аналитики для «бизнеса», данный подход может использоваться как инструмент контроля
за развитием промышленности в городах Российской федерации. Этот инструмент поможет определять
аномальные активности компаний, на которые следует обратить внимание, находить «слабые места» промышленных
отраслей, чтобы, например, субсидировать компании работающих в этих направлениях. Это позволит создать
полноценные инфраструктуры, обеспечить локализацию инновационных производств, а также создаст новые
высококвалифицированные рабочие места.</p>
      <p>Подход, предложенный авторами, позволил структурировать спрос и предложение по финансовым признакам и
по характеристикам объектов исследования на электронной торговой площадке государственных закупок. Таким
образом выделены особенности отрасли, ее конкурентные преимущества.</p>
      <p>Для второго этапа ЭММ (см. рисунок 2) были выбраны следующие методы: иерархический метод (BIRCH) и
самоорганизующиеся карты Кохонена и проведена структуризация и группировки статистических данных, учтены
специфика промышленных предприятий и отраслей.</p>
      <p>Результаты применения выбранных методов подтверждают большие различия в структуре компаний,
создающих спрос и предложение. Так, выделена группа очень крупных компаний (Доминирующие компании, лидеры
своего рынка), и кластер 3 - крупные компании, которые являются лидерами по закупкам и поставкам товаров,
обеспечивающие заметную долю поставок. Это компании, работающие по направлениям “Продукция обрабатывающих
производств” и “Услуги, связанные с научной, инженерно-технической и профессиональной деятельностью”.</p>
      <p>Создают спрос на товары, помимо государственных нужд, и компании из кластера 2 — это предприятия
среднего размера, с положительной, но небольшой динамикой финансовых показателей. Они преимущественно относятся
к направлениям “Продукция обрабатывающих производств”, “Услуги, связанные с научной,
инженернотехнической и профессиональной деятельностью” и “Услуги, связанные с недвижимым имуществом”
Основная масса спроса удовлетворяется предложением большого количества небольших разнородных
компаний, выполняющих несколько контрактов в год по своему направлению. Однако стоит обратить внимание на
формирование эффективной системы поддержки предприятий для стимулирования спроса. Это поможет небольшим
компания расширять ассортимент услуг и товаров, также поможет увеличить объем выпускаемой продукции.</p>
      <p>Полученные результаты могут быть рекомендованы к использованию при реализации современного
инструментария контроля за развитием промышленности в г. Москве. Подобный инструментарий дает
возможность анализировать большое количество важнейших разнообразных структурированных, не
структурированных и слабо структурированных данных из любых открытых источников, что позволит максимально точно
оценить появление позитивных и негативных тенденций в изменении показателей деятельности предприятий
промышленности г. Москвы.
[1] Гржибовский А. М. Выбор статистического критерия для проверки гипотез // Экология человека. 2008. №11.</p>
      <p>48-57
[2] Терехов В.А., Ефимов Д.В., Тюкин И.Ю. Нейросетевые системы управления: Учеб. Пособие для вузов - М.:
Высш. шк. 2002. - 183 с.: ил.
[3] J. Hertz, A. Krogh, and R.G. Palmer, Introduction to the Theory of Neural Computation, Addison-Wesley, Reading,</p>
      <p>Mass., 1991
[4] Кутуков Д. С. Применение методов кластеризации для обработки новостного потока [Текст] // Технические
науки: проблемы и перспективы: материалы Междунар. науч. конф. (г. Санкт-Петербург, март 2011 г.). —
СПб.: Реноме, 2011. — С. 77-83. — URL https://moluch.ru/conf/tech/archive/2/207/ (дата обращения: 09.10.2019).
[5] Официальный сайт Территориального органа Федеральной службы государственной статистики по городу
Москве. Раздел Валовой региональный продукт. https://moscow.gks.ru/wps/wcm/connect/
rosstat_ts/moscow/ru/statistics/grp/ – дата обращения: 30.04.19
[6] Официальный сайт министерства финансов РФ</p>
      <p>https://www.minfin.ru/ru/perfomance/budget/federal_budget/budgeti/2018/ – дата обращения: 30.04.19
[7] Проект «Хабр» Обзор алгоритмов кластеризации числовых пространств данных
https://habr.com/ru/post/164417/ [Электронный ресурс] – дата обращения: 30.04.19
[8] BaseGroup Labs ООО «Аналитические технологии» Сегментация данных как метод сравнительного анализа
https://basegroup.ru/community/articles/comparative-analysis [Электронный ресурс] – дата обращения: 01.05.19</p>
    </sec>
  </body>
  <back>
    <ref-list />
  </back>
</article>