=Paper= {{Paper |id=Vol-1825/p16 |storemode=property |title= Задача об оптимальной стабилизации скорости угла поворота робота-манипулятора (The optimal stabilization problem for rotation angle velocity of the robot-manipulator) |pdfUrl=https://ceur-ws.org/Vol-1825/p16.pdf |volume=Vol-1825 |authors=Tatiana V. Zavialova }} == Задача об оптимальной стабилизации скорости угла поворота робота-манипулятора (The optimal stabilization problem for rotation angle velocity of the robot-manipulator)== https://ceur-ws.org/Vol-1825/p16.pdf
     Задача об оптимальной стабилизации скорости угла
               поворота робота-манипулятора

                                                    Т.В. Завьялова
                                                   tzava@yandex.ru
                  Уральский государственный университет путей сообщения (Екатеринбург)




                                                      Аннотация
                       В работе моделируется процесс движения робота-манипулятора,
                       поднимающего и опускающего разбросанные детали на горизон-
                       тальной поверхности. Плечо манипулятора совершает вращатель-
                       ные движения в горизонтальной плоскости. Предполагается, что в
                       случайные моменты времени, когда робот схватывает или отпуска-
                       ет деталь, нагрузка на двигатель изменяется скачкообразно и од-
                       новременно меняется и момент инерции плеча относительно вала
                       двигателя. Управление робота-манипулятора зависит от угла пово-
                       рота и скорости изменения угла поворота.
                       Для смоделированного процесса построено управление, обеспечи-
                       вающее асимптотическую устойчивость по вероятности в среднем
                       квадратичном и получены условия, при которых существует един-
                       ственное оптимальное стабилизирующее управление.
                       Ключевые слова: стабилизация линейных систем; случайные
                       скачки; управление систем со случайной структурой.




1    Введение
Изучение многих реальных процессов, происходящих в природе и технике, связано с рассмотрением диффе-
ренциальных уравнений, параметры которых случайные функции времени. Исследование вопросов устой-
чивости и управления такими системами заложено в работах Н.Н. Красовского, Р.З. Хасьминского и И.Я.
Каца [1]–[3]. Особенностью стохастических систем является информация о структурном состоянии объек-
та. Например, информация о количестве массы в данный момент времени, о наличии или отсутствии тока
в электрической цепи и так далее. В современной теории случайных процессов широкое распространение
также получили модели, параметрами которых являются однородные марковские цепи с конечным чис-
лом состояний. Такое описание объекта управления оказалось наиболее полным, поскольку однородная
марковская цепь несёт информацию о режиме (или структуре) объекта в данный момент времени, а фа-
зовый вектор описывает его состояние в данном режиме. В отечественной литературе описанные системы
называют системами со случайной структурой, а в западной литературе распространен термин «систе-
мы со скачками» (jump systems). Естественным кажется предположение о случайном изменении такого
структурного состояния системы в случайный момент времени. При переходе из одного структурного со-
стояния в другое, фазовый вектор изменяется скачкообразно и зависит от случайной величины. Основы

          c by the paper’s authors. Copying permitted for private and academic purposes.
Copyright °
In: G.A. Timofeeva, A.V. Martynenko (eds.): Proceedings of 3rd Russian Conference "Mathematical Modeling and Information
Technologies" (MMIT 2016), Yekaterinburg, Russia, 16-Nov-2016, published at http://ceur-ws.org




                                                            123
теории устойчивости и управления систем, описываемых стохастическими дифференциальными уравне-
ниями, заложены Н.Н. Красовским, И.Я. Кацом, Р.З. Хасьминским и Э.А. Лидским в начале 60-х годов
прошлого века [1] – [3]. Чуть позже появляется ряд публикаций А.И. Маликова, А.Я. Каца, А.А. Марты-
нюка, П.В. Пакшина, в которых авторы рассматривают системы со случайной структурой и предполагают,
что в момент изменения структурного состояния системы скачком изменяется также траектория движения
объекта управления. Однако представляется естественной ситуация, когда в случайные моменты времени
за счёт перехода системы из одного состояния в другое фазовый вектор изменяется скачком случайным
образом. Скажем, если в механических системах изменение структуры связано со случайным скачкообраз-
ным изменением массы или геометрии системы, то корректная постановка задачи требует задания новых
начальных условий, поскольку фазовый вектор оказался разрывным. Подобные проблемы возникают в
виброударных, экономических и других сложных системах, связанных с частичным отказом элементов.
В качестве примера такой системы смоделирован процесс, описывающий движения робота-манипулятора,
поднимающего и опускающего разбросанные детали на горизонтальной поверхности. Для такой модели
построено стабилизирующее управление.

2   Постановка задачи
Рассматривается процесс, описываемый системой стохастических дифференциальных уравнений

                                                                      l
                                                                      X
                            dx = [A(t, y(t))x + B(t, y(t))u]dt +            σv (t, y(t))xdwv ,             (1)
                                                                      v=1

  где x ∈ R(n) - n-мерный вектор фазовых координат системы; время t может изменяться в области
l = (t : t ≥ t0 ); величина u = u(t, x, y) - r-векторное управляющее воздействие. Матрицы-функции
A(y(t)), B(y(t)), σv (y(t)) – заданы.
  Вектор-функция y(t) является простой марковской цепью, при каждом t ∈ I принимает значения из
множества Y = {y1 , . . . yk } ⊂ R(r) . Простая марковская цепь допускает разложение

                         P {y(t) = yj | y(s) = yi 6= yj } = qij (t − s) + o(t − s),
                                                                                                           (2)
                         P {y(t) = yj , s ≤ τ ≤ t | y(s) = yi } = 1 − qi (t − s) + o(t − s),
  где qij – известные переходные вероятности из i-го состояния в j-е, o(t − s) – бесконечно малая вели-
чина, более высокого порядка малости, чем (t − s), w(t) = {w1 (t), . . . , wm (t)} – m-векторный стандартный
винеровский процесс, независящий от переходов марковской цепи y(t).
  Предположим, что в случайные моменты времени скачкообразного изменения y(t) фазовый вектор x(t)
так же изменяется скачком по закону:

                                                              N
                                                              X
                                    x(τ ) = Kij x(τ − 0) +          ξs Qs x(τ − 0),                        (3)
                                                              s=1

   где τ – момент перехода системы из состояния y(τ −0) = yi в состояние y(τ +0) = yj 6= yi ; ξs – независимые
случайные величины, для которых M ξs = 0, M ξs2 = 1 (M – знак математического ожидания); Kij матрица
размерности n×m, характеризующая состояние фазового вектора в момент смены структурного состояния
y(t) ∈ Y ; Qs – известные матрицы с постоянными коэффициентами размерности n × m, описывающие
случайные возмущения в момент скачка y(t).
   Некоторые простые виды скачков фазового вектора x(t) рассматривались в работах [2]–[3]. Условие
скачка (3) является наиболее общим случаем, поскольку включает в себя частные. Например, случай
детерминированных скачков соответствует условию Qs = 0; непрерывное изменение фазовой траектории
означает, что Qs = 0, Kij = E, (E – единичная n × n-матрица).
   Условный закон распределения, задающий начальные условия для вектора при изменившейся структуре
можно записать в виде
   P {x(τ ) ∈ [z, z + dz)|x(τ − 0) = x} = pij (τ, z|x)dz + o(dz),
   где pij (τ, z|x) - условная плотность l-мерного распределения. В частности, если реализации непрерывны,
то pij (τ, z|x) = δ(z − φij (x)), где φij (x) – функция Дирака.
   Рассмотрим задачу об оптимальной стабилизации для системы (1), (2) с условием скачка (3).




                                                        124
  Требуется найти такое управляющее воздействие u(t, x, y), удовлетворяющее условию u(t, 0, y) ≡ 0, что-
бы невозмущенное движение x = 0 системы (1) было асимптотически устойчивым по вероятности в целом
и минимизировало функционал
                                     Z ∞
                    Ju (x0 , y 0 ) =     M [x0 [t]G(t, y(t))x[t] + u0 [t]D(t, y(t))u[t]|x0 , y 0 ]dt, (4)
                                          0
  причем, симметричные матрицы C(t, y(t)) > 0, D(t, y(t)) > 0 заданы и имеют непрерывные элементы.
  Стабилизирующее управление (с - управление) ищется в виде u(t, x(t)).
  Обозначим A(t, yi ) = Ai , V (t, x, yi ) = Vi , σv (t, yi ) = σvi , G(t, yi ) = Gi (t).
  u ∈ R(r) – непрерывная функция по t, x; M [·|·] – символ условного математического ожидания; x[t] —
траектория, которая порождается управлением u[t] = u(t, x[t], y(t)).
  Предполагается, что интеграл (4) при u = u0 (t, x, y) сходится, причем при всех начальных условиях из
области Z и выполняется соотношение

                                              Ju0 (t0 , x0 , y 0 ) = min Ju (t0 , x0 , y 0 ),                                 (5)
                                                                    u∈U

   где U = {u : u(t, 0, y) ≡ 0}.
   Такое управление, разрешающее задачу об оптимальной стабилизации стохастической системы (1) с
условием скачка (3), будем называть оптимальным.
   Будем использовать определения и некоторые подходы, опубликованные в работах [3]–[7].
   Определение 1. Невозмущенное движение x = 0 системы (1), при любом фиксированном управлении
u = u0 (t0 , x0 , y 0 ), называется асимптотически устойчивым по вероятности в целом, если для любой ограни-
ченной области kx0 k ≤ H0 и чисел γ > 0, p > 0, q > 0 можно найти такую ограниченную область kxk ≤ H1
и число T > 0, что
   P {[supkx(t)k|t ≥ t0 ] < H1 |x0 , y0 } > 1 − p,
   P {[supkx(t)k|t ≥ t0 + T ] < γ|x0 , y0 } > 1 − p − q,
   Определение 2. Усредненной производной (или производящим дифференциальным оператором)
dM [V ]/dt в силу системы со случайной структурой (1) при фиксированном u0 = u(t0 , x0 , y 0 ) в точке
(s, x, y) ∈ Z называется оператор
    dM [V ]                   1
      dt    = limt→s+0 t−s      {M [V (t, x(t), y(t))|x(s) = x, y(s) = y] − V },
   где V (t, x, y) – функция Ляпунова.
   Лемма 1. Для усредненной производной квадратичной функции V (t, x, y) в силу системы (1) с условием
скачка фазового вектора (1) в точке (s, x, yi ) справедлива формула
                          £ dV ¤ 0                     h 2                          i   P
                                                                                        k                            P
                                                                                                                     N
     dM [V ]     dV                               1      d V             0
        dt   =    ds   +    dx     (Ai + B i u) + 2 tr   dx2 σ(s, x, y)σ   (s, x, y)  +   [V (t, Kij x, yj ) + V (s,   Qs x, yj )−
                                                                                            j6=1                 s=1
                                           −V (t, x, yj )]qij .
   Согласно теореме [3] оптимальную функцию Ляпунова будем искать в виде

                                                     V 0 (t, x, y) = x0 G(t, y)x.                                             (6)
   Подставим
      ·       ее в соотношения, полученные в теореме:                                 ¸
    0   ∂Gi 0                     P
                                  l             P 0           P 0
   x ( ∂t ) + 2Gi (Ai x + bi u) +   σvi Gi σvi + (Kij Gj Kij + Qs Gj Qs − Gi )qij + Ci x + (u0 )0 Di u0 = 0,
                                     0
                                       v=1
   2x0 Gi Bi + 2(u0 )0 Di = 0,
   откуда находим

                                                         u0i = Di−1 Bi Gi x.                                                  (7)
  Приравниваем к нулю матрицу получившейся квадратичной формы, приходим к системе матричных
дифференциальных уравнений


                                              Xl               k
                                                               X               XN
   dGi
       + Gi Ai + A0i Gi − Gi Bi Di−1 Bi0 Gi +      0
                                                  σvi Gi σvi +     0
                                                                 [Kij Gj Kij +     Q0s Gj Qs − Gi ]qij + Ci = 0,              (8)
    dt                                        v=1                              s=1
                                                                         j6=1

   i = 1, . . . , k.




                                                                   125
   Асимптотическая устойчивость исходной системы (1) при реализовавшемся структурном состоянии и
соответствующем управлении следует из результатов [7]. Поскольку выполняются условия существования
положительно определенной функции V (t, x, y), допускающей бесконечно малый высший предел, усред-
ненная производная которой dMdt[V ] определенно отрицательна в области Z. Сформулируем теорему.
   Теорема. Пусть для системы матричных дифференциальных уравнений (8) существует решение, со-
стоящее из положительно определенных матриц G1 (k), . . . , Gk (t). Тогда управление (7) разрешает задачу
об оптимальной стабилизации системы (3) с условием скачка (7), причем
   minu∈U Ju (t, x0 , y 0 ) = (x0 )0 Gi x0 .
   Пример. Рассмотрим работу робота-манипулятора, который поднимает и опускает детали, разбросан-
ные по горизонтальной плоскости. Плечо манипулятора, совершающее вращение в горизонтальной плос-
кости, приводится в движение двигателем постоянного тока. В случайные моменты времени τ , когда робот
схватывает или отпускает деталь, изменяется момент инерции плеча относительно вала двигателя. Урав-
нение двигателя в линейном приближении можно записать:
   J(t)ϕ̈ + k1 ϕ̇ = k2 u + k3 M,
   где ϕ – угол поворота, J(t) – момент инерции, приведенный к валу двигателя, M – момент нагрузки.
Управление угла поворота будем определять по принципу обратной связи
   u = −γ0 ϕ − γ1 ϕ̇,
   где γ0 > 0, γ1 > 0 – коэффициенты усиления. Подставим управление, тогда
   J(t)ϕ̈ + k1 ϕ̇ = −k2 γ0 ϕ − k2 γ1 ϕ̇ + k3 M.
   Введем обозначения b = k1 + k2 γ1 , c = k2 γ0 и запишем уравнение для возмущенного движения для
отклонения x = ϕ − ϕ̃(t). Эти уравнения справедливы на интервалах постоянства J(t):
   J(t)ẍ + bẋ + cx = 0.
   Предположим, что J(t) – простая марковская цепь с заданными состояниями (2).
   Пусть в случайный момент времени t = τ плечо робота схватывает или отпускает деталь. В этот момент
скачкообразно меняется момент инерции. Тогда начальные условия для продолжения движения определим
из соотношения
   J(τ − 0)x(τ − 0) = (J(τ ) + ξq)ẋ(τ ).
   Здесь q – неопределенный параметр, ξ случайная дискретная величина, у которой M ξ = 0, M ξ2 = 1.
   Тогда,
   ½         исходную модель можно записать в виде:
       ẋ1 = x2 ,
       ẋ2 = a(J(t))x1 + b(J(t))x02 ,
   где a(J(t)) = kJ1 , b(J(t)) = kJ2 .
   Приходим к задаче о стабилизации. Требуется найти такое управление u = u(x1 , x2 , J), обеспечивающее
асимптотическую устойчивость в смоделированной системе со случайным скачком фазового вектора.
   Потребуем качество управления в виде
                    R∞
   Ju (x0 , J 0 ) = 0 M [x2 (t) + u2 (t)|x0 , J 0 ]dt.
   Функцию Ляпунова будем искать в виде:
   vi0 = gi x2 .
   Составим систему квадратных уравнений, для нахождения gi .
   2ai gi − gi2 b2i + (kij
                        2
                           gi + q 2 gj − gi )qij + 1 = 0,
   i, j = 1, 2,
   где ai = kJ1i , bi = kJ2i , kij = J1ij .
   Для определенности рассмотрим значения:
   k1 = k2 = 0, 5, J1 = 1, J2 = 0, 5, q12 = q21 = 1, q = 1. Согласно теореме, эта система имеет единственное
решение. Получим
              ½
     0             −1, 46x, i = 1,
   ui (x) =
                   −1, 34x, i = 2.
   Принятая в данном примере модель перехода (скачка) является достаточно грубой и создана лишь для
демонстрации теоремы об оптимальном управлении. Более содержательная модель может быть получе-
на при изучении зависимости управления от случайной добавки скачка фазовой траектории. Полученные
результаты не являются большим открытием, а лишь дополняют теорию оптимального управления стоха-
стических систем дифференциальных уравнений в случае разрывных фазовых траекторий.




                                                    126
Список литературы
   [1] N. N. Krasovsky. On a property of a linear stable system completely controllable from a random
       action. Differential equations, т.1 №2 : 217–229, 1965. (in Russian) = Н. Н. Красовский. Об од-
       ном свойстве линейной устойчивой системы, вполне управляемой по случайному воздействию .
       Дифференциальные уравнения, т.1 №2 : 217–229, 1965.
   [2] R. Z. Khas’minskii. Stability of systems of differential equations for random perturbations of their
       parameters. Moscow: Science, 1969. (in Russian) = Р. З. Хасьминский. Устойчивость систем
       дифференциальных уравнений при случайных возмущениях их параметров. М.: Наука, 1969.
   [3] I. Y. Kats. The method of Lyapunov functions in problems of stability and stabilization of systems of
       random structure. Ekaterinburg, Ural University of Railway Transport, 1988. (in Russian) = И. Я.
       Кац. Метод функций Ляпунова в задачах устойчивости и стабилизации систем случайной
       структуры. Изд-во УрГУПС, Екатеринбург, 1998.
   [4] I. A. Bashkirtseva, L. B. Ryashko. The method of the quasipotential in the analysis of the sensitivity of
       self-oscillations to stochastic perturbations. Applied nonlinear dynamics : 19–27, 1998. (in Russian) =
       И. А. Башкирцева, Л. Б.Ряшко. Метод квазипотенциала в анализе чувствительности автоколеба-
       ний к стохастическим возмущениям. Прикладная нелинейная динамика. Прикладная нелинейная
       динамика : 19–27, 1998.
   [5] D. D. Kuznetsov. Numerical simulation of stochastic differential equations and stochastic integrals.
       St.Petersburg: Science, 1999. (in Russian) = Д. Д. Кузнецов. Численное моделирование стохасти-
       ческих дифференциальных уравнений и стохастических интегралов. С-Пб.: Наука, 1999.

   [6] P.V. Pakshin. Stability of linear systems with random parameters and structure. Technical cybernetics,
       №3 : 115–120, 1990. (in Russian) = П. В. Пакшин. Устойчивость линейных систем со случайными
       параметрами и структурой. Техническая кибернетика, №3 : 115–120, 1990.
   [7] T. V. Zavyalova, I. Ya. Kats, G. A. Timofeeva. Stability of motion of stochastic systems with random
       conditions of jumps of phase trajectories Automation and Remote Control, №7 : 34–48, 2002. (in
       Russian) = Т. В. Завьялова, И. Я. Кац, Г. А. Тимофеева. Об устойчивости движения стохастиче-
       ских систем со случайными условиями скачков фазовых траекторий. Автоматика и телемеха-
       ника, №7 : 34–48, 2002.




                                                    127
  The optimal stabilization problem for rotation angle velocity of the
robot-manipulator
Tatiana V. Zavialova
Ural State University of Railway Transport (Yekaterinburg, Russia)

   Abstract. In the article motion of the robot that raised and lowered the scattered parts on a horizontal
surface are simulated. Shoulder manipulator rotates in a horizontal plane. It is assumed that at random points in
time when the robot grasps or releases the part, the engine load changes abruptly and simultaneously changing
the moment of inertia of the arm with respect to the motor shaft. Control of the robot manipulator depends on
the angle of rotation and speed of rotation.
   There are control are designed. This control are ensures asymptotic stability in probability in quadratic mean
for the simulated process. conditions are obtained under which there exists a unique stabilizing optimal control.

  Keywords: stabilization of linear system; random jumps; control of systems with random structure.




                                                      128