=Paper= {{Paper |id=Vol-2064/paper37 |storemode=property |title= Стабилизация обратного маятника с учетом запаздывания (Stabilization of the inverted pendulum considering delay) |pdfUrl=https://ceur-ws.org/Vol-2064/paper37.pdf |volume=Vol-2064 |authors=Ruslan Sevostyanov,Lilia Shayakhmetova }} == Стабилизация обратного маятника с учетом запаздывания (Stabilization of the inverted pendulum considering delay) == https://ceur-ws.org/Vol-2064/paper37.pdf
УДК 006.322
                                  Севостьянов Р.А., Шаяхметова Л.В.
              Санкт-Петербургский государственный университет, г. Санкт-Петербург, Россия

        СТАБИЛИЗАЦИЯ ОБРАТНОГО МАЯТНИКА С УЧЕТОМ ЗАПАЗДЫВАНИЯ*
   Аннотация
        В статье описывается задача стабилизации обратного маятника на вращающейся
        платформе в верхнем положении равновесия по линейной модели при небольших
        отклонениях. При работе с реальными устройствами неизбежно возникает проблема
        наличия запаздывания в канале управления, которое при определенных значениях приводит
        к потере устойчивости замкнутой системы. Предлагается решение задачи на основе
        метода непрерывного размещения корней характеристического полинома замкнутой
        линейной системы. Основной сложностью задачи стабилизации систем с запаздыванием
        является бесконечное число собственных чисел. Описываемый метод заключается в
        переходе от рассмотрения бесконечномерной системы в целом к перемещению только
        конечного числа крайних правых собственных чисел в левую открытую полуплоскость за
        счет внесения небольших изменений в вектор коэффициентов обратной связи. Изменения
        рассчитываются на основе нахождения чувствительностей собственных чисел по
        отношению к вариациям вектора коэффициентов обратной связи (по сути, вычисляются
        частные производные). Основное преимущество метода заключается в простоте
        реализации синтезированной обратной связи на бортовых контроллерах объекта
        управления. Приводятся результаты компьютерного моделирования, демонстрируется
        эффективность работы описанного метода при конкретном значении запаздывания.
   Ключевые слова
        Теория управления; обратная связь; линейные системы; запаздывание.
                                 Sevostyanov R.A., Shayakhmetova L.V.
                           Saint-Petersburg State University, Saint-Petersburg, Russia

           STABILIZATION OF THE INVERTED PENDULUM CONSIDERING DELAY
   Abstract
        The article describes the task of the stabilization of the inverted pendulum on the rotating platform
        in the upmost position based on linear model with respect to small deviations. Working with real
        devices is always a source of the delay in the control channel which in particular circumstances leads
        to the loss of stability of the closed loop system. The proposed solution is based on the continuous pole
        placement method. The main complication of the delay systems stabilization is the infinite number of
        the poles. Suggested method is based on transition from considering the infinite dimensional system
        to moving only finite number of the rightmost roots to the left half-plane by applying small changes
        to the feedback coefficients vector. Changes are calculated by finding sensitivities of roots with respect
        to small variations of the feedback vector (in fact, partial derivatives). The main advantage of the
        method is simplicity of the realization of the synthesized feedback on the plant’s board controller.
        Results of the computer modelling are given, efficiency of the described method is demonstrated with
        particular value of the delay.
   Keywords
        Control theory; feedback; linear systems; delay.




   * Труды II Международной научной конференции «Конвергентные когнитивно-

информационные технологии» (Convergent’2017), Москва, 24-26 ноября, 2017
   Proceedings of the II International scientific conference "Convergent cognitive information
technologies" (Convergent’2017), Moscow, Russia, November 24-26, 2017

                                                           318
Введение
   Обратные маятники являются важным классом нелинейных динамических систем в современной
теории управления. С одной стороны, движение таких маятников является приближенной моделью
ходьбы человека. С другой стороны, динамика обратного маятника похожа на динамику ракеты при
взлете и посадке. На подобных моделях можно проводить предварительные исследования, ставить
эксперименты и отрабатывать различные законы управления.
   Говоря об экспериментах с реальными устройствами, нельзя не упомянуть проблему запаздывания
управляющего сигнала. Все реальные системы в той или иной мере подвержены задержкам. Источники
задержек могут быть различными. Во-первых, физические сигналы не могут передаваться мгновенно. Во-
вторых, у каждого датчика существует период снятия показаний. В-третьих, система управления может
осуществлять сложные вычисления, которые могут занимать существенное время. Наконец, управление
может передаваться через компьютерную сеть. Все это может оказывать влияние на объект управления,
приводя к ухудшению качества управления, вплоть до потери устойчивости.
   Существуют различные методы решения проблемы задержек. Большинство из них подразумевает
разработку динамических регуляторов. Например, управление с предсказанием [1] или назначение
конечного спектра [2]. Динамические регуляторы могут быть достаточно сложны в реализации, а
прогнозы состояния на длительный промежуток времени могут быть довольно неточными.
   В данной работе для стабилизации с учетом запаздывания используется метод синтеза регулятора с
постоянными коэффициентами, предложенный в работе [3]. Метод является обобщением метода
модального синтеза [4] на случай линейных систем с запаздыванием по управлению.
Непрерывное размещение корней
   Рассмотрим линейную систему
                                            x (t )  Ax(t )  Bu(t   ), A  R nn , B  R n1 ,          (1)
где x(t )  R n – вектор состояния, u(t )  R – управление,   0 – запаздывание. Предположим, что при
  0 система (1) стабилизирована при помощи обратной связи вида
                                 u(t )  Kx(t ), K  R1n .                     (2)
   Собственные числа матрицы A  BK лежат в левой открытой полуплоскости. При   0
характеристический полином системы (1) – (2) приобретает вид
                                      H ( )  det(I  A  BKe )                                         (3)
и имеет бесконечно много корней. При этом некоторые из них могут оказаться в правой открытой
полуплоскости, и система (1) – (2) потеряет устойчивость.
   Метод непрерывного размещения корней основан на непрерывной зависимости собственных
значений системы (1) – (2) от коэффициентов K и на перемещении конечного числа крайних правых
собственных значений в левую открытую полуплоскость путем внесения небольших изменений в
матрицу K . Алгоритм перемещения корней состоит из следующих этапов:
   1) Фиксируем m  1 .
   2) Высчитываем m крайних правых собственных значений системы.
                                                 i
   3) Высчитываем частные производные                , i  1, m, j  1, n , где k j – коэффициенты вектора K . В
                                                k j
работе [3] предлагается искать производные путем решения линейной системы
                                                                     v 
                           I  A  BKe i ( I  BKe  i )v   i                 i 
                           i                                    i k
                                                                             T
                                     T                               j    Bvi e j e        ,           (4)
                                 dn                                 i 
                                                     0                         0          
                                 dvi                               k j 
                                                                          
где vi – собственный вектор, соответствующий собственному значению  i , n(vi )  aT vi  0, a  C n –
нормализующее условие, e j – j-й единичный вектор. Однако, как показывает практика, матрица в левой
части системы (4) часто оказывается близкой к сингулярной, поэтому численное решение системы
получается довольно неточным. В связи с этим в данной статье используется другой подход, более
                                                           i     ei  j i
сложный в плане вычислений, но более точный:                                  .
                                                           k j       dH
                                                                      di



                                                              319
                                                                             i
   4)   Формируем матрицу S m такую, что S m  [ si, j ]  R mn , si, j         .
                                                                             k j
   5) Перемещаем m крайних правых собственных значений в направлении левой открытой
полуплоскости путем внесения небольших изменений в вектор K :
                                        K  ((Sm )) dm ,
где ()  – псевдообращение Мура – Пенроуза, () – вещественная часть комплексного числа, dm –
желаемое изменение собственных значений.
   6) Проверяем неконтролируемые крайние правые собственные числа, при необходимости
увеличиваем m . Алгоритм заканчивает работу, если достигнута устойчивость, либо если число степеней
свободы закона управления не позволяет уменьшить sup(( )) . Иначе возвращаемся к пункту 2.

Стабилизация обратного маятника
    Нелинейная модель обратного маятника на вращающемся основании (рис. 1), представленная в работе
[5], имеет вид
                            J 0  m1L20  m1l12 sin 2   m1L0l1 cos    
                                                                           
                                                                       2   
                                   m  L
                                       1 01l cos             J 1  m l
                                                                     11    
                                         2 K K           1                         1            
                               C0  m1L0  t b  m1l1  sin 2 m1L0l1 sin   m1l1  sin 2   
                                                              2                        2

                                                Ra      2                          2                 (5)
                                             1                                                    
                                           m1l1  sin 2
                                                     2
                                                                                   C1            
                                             2                                                  
                                                     Kt Ku 
                                     0                   
                                               Ra u,
                                
                               1 1
                                  m  gl sin      0 
                                                           
где m1  0.0319 кг – масса свободного звена, l1  0.1572 м – длина свободного звена, J1  0.000217 кг·м2 –
момент инерции свободного звена, C1  0.000158 кг·м2/с – коэффициент трения свободного звена,
L0  0.137 м – длина вращающегося звена, J 0  0.008591 кг·м2 – момент инерции вращающегося звена,
C0  0.006408 кг·м2/с – коэффициент трения свободного звена, g  9.8 м/с2 – ускорение свободного
падения. Kb  0.0707 , Kt  0.0706 , Ku  0.0636 , Ra  0.9 – различные параметры электромотора,
вращающего основание.




                               Рис. 1. Обратный маятник на вращающемся основании
   Линеаризация модели в отклонениях от верхнего положения свободного звена с учетом запаздывания
в канале управления дает систему
                                        x(t )  Ax(t )  Bu(t   ),



                                                        320
                                        1.3708 3.8513  0.0124        0.5721
                                 A       0       0        1    , B   0  ,
                                                                                 
                                                                                                             (6)
                                       0.9368 51.5163  0.1656       0.391 
где x  ( ,  ,  ) – состояние маятника.
   При   0 система (6) является полностью управляемой, но неустойчивой: sup(( ))  7.066 .
Синтезируем регулятор с постоянными коэффициентами K  [3.2879 211.4081 29.2452] и замкнем
систему (6). В этом случае sup(( ))  1.4852 . При отклонении свободного звена на 1 градус от верхнего
положения синтезированный регулятор, примененный к компьютерной модели нелинейной системы (5),
реализованной в системе MATLAB-Simulink, действительно стабилизирует систему, возвращая маятник в
верхнее положение равновесия (рис. 2). Построим зависимость собственных чисел замкнутой системы от
величины запаздывания (рис. 3). Видно, что при   0.115 одно из собственных значений (в
действительности, комплексно сопряженная пара собственных чисел) переходит в правую
положительную полуплоскость, и система теряет устойчивость.




      Рис. 2. Динамика движения свободного звена при отклонении на 1 градус от верхнего положения,   0 ,
                                      K  [3.2879   211.4081 29.2452]




Рис. 3. Зависимость собственных значений системы от величины запаздывания, K  [3.2879      211.4081 29.2452]
   Примем   0.12 . Крайние правые собственные значения для этого случая представлены на рис. 4.
sup(( ))  0.3811 , система неустойчива. Введем запаздывание в компьютерную модель нелинейной
системы. Динамика свободного звена при отклонении на 1 градус от верхнего положения
продемонстрирована на рис. 5. Действительно, устойчивость отсутствует.

                                                      321
                      Рис. 4. Крайние правые собственные значения системы при   0.12




          Рис. 5. Динамика движения свободного звена,   0.12 , K  [3.2879   211.4081 29.2452]
   Применим алгоритм непрерывного размещения корней (рис. 6). На первых итерациях двигаем только
крайнюю комплексно сопряженную пару. К третьей итерации третий корень подходит к границе правой
открытой полуплоскости, с этого момента учитываем его в алгоритме, увеличивая число m . Уже на
четвертой итерации система обретает устойчивость, однако можно двигать собственные числа еще
дальше, добиваясь большей степени устойчивости. После пятнадцатой итерации изменения собственных
чисел практически не заметны, алгоритм сходится. В итоге алгоритм приводит к sup(( ))  -0.2138, при
этом K  [3.5817 207.696 33.4825] . Изменения коэффициентов вектора K в процессе работы
алгоритма представлены на рис. 7.
   Таким образом, при помощи алгоритма всего за относительно небольшое число итераций был получен
регулятор, стабилизирующий обратный маятник при запаздывании в 120 мс. Применим полученный
регулятор к компьютерной нелинейной модели с запаздыванием. Динамика движения свободного звена
при отклонении на 1 градус от верхнего положения в этом случае показана на рис. 8. Несмотря на
заметные колебания (работа алгоритма привела к относительно большим мнимым частям крайних
правых корней), маятник стабилизируется, система устойчива.




                                                     322
          Рис. 6. Изменения собственных значений в процессе работы алгоритма




        Рис. 7. Изменения коэффициентов вектора K в процессе работы алгоритма




Рис. 8. Динамика движения свободного звена,   0.12 , K  [3.5817   207.696 33.4825] .


                                           323
Заключение
   В статье продемонстрирована эффективность метода непрерывного размещения собственных
значений. Несмотря на относительную сложность предварительных расчетов для работы алгоритма
перемещения, получаемый регулятор является законом управления по состоянию с постоянными
коэффициентами и очень прост в реализации на реальных устройствах. В качестве недостатков метода
можно привести чувствительность к изменению величины запаздывания и параметров системы.
                                                          Литература
    1.   Krstic M. Delay Compensation for Nonlinear, Adaptive, and PDE Systems. Boston: Birkhauser, 2009. 466 p.
    2.   Manitius A., Olbrot A. Finite spectrum assignment problem for systems with delays // IEEE Transactions on Automatic Control. 1979.
         24(4). P. 541–553.
    3.   Michiels W., Engelborghs K., Vansevenant P., Roose D. Continuous pole placement for delay equations // Automatica. 2002. 38(5). P.
         747–761.
    4.   Веремей Е.И. Линейные системы с обратной связью. СПб: Лань, 2013. 447 с.
    5.   Chye T.K., Sang T.C. Rotary Inverted Pendulum. Technical Report. School of Electrical and Electronic Engineering Nanyang
         Technological University, 1999. 155 p.

                                                           References
    1.   Krstic M. Delay Compensation for Nonlinear, Adaptive, and PDE Systems. Boston: Birkhauser, 2009. 466 p.
    2.   Manitius A., Olbrot A. Finite spectrum assignment problem for systems with delays // IEEE Transactions on Automatic Control. 1979.
         24(4). P. 541–553.
    3.   Michiels W., Engelborghs K., Vansevenant P., Roose D. Continuous pole placement for delay equations // Automatica. 2002. 38(5). P.
         747–761.
    4.   Veremey E.I. Lineyniye systemy s obratnoy svyazyu. SPb: Lan, 2013. 447 S.
    5.   Chye T.K., Sang T.C. Rotary Inverted Pendulum. Technical Report. School of Electrical and Electronic Engineering Nanyang
         Technological University, 1999. 155 p.

Об авторах:
Севостьянов Руслан Андреевич, аспирант кафедры компьютерных технологий и систем факультета
        прикладной математики – процессов управления, Санкт-Петербургский государственный
        университет, sevostyanov.ruslan@gmail.com
Шаяхметова Лилия Владимировна, аспирант кафедры теории управления факультета прикладной
        математики – процессов управления, Санкт-Петербургский государственный университет,
        lilia.v.shayakhmetova@gmail.com

Note on the authors:
Sevostyanov Ruslan А., postgraduate of the computer applications and systems department, faculty of the
         applied    mathematics       and    control    processes,        Saint-Petersburg State   University,
         sevostyanov.ruslan@gmail.com
Shayakhmetova Lilia V., postgraduate of the control theory department, faculty of the applied mathematics and
         control processes, Saint-Petersburg State University, lilia.v.shayakhmetova@gmail.com




                                                                  324