=Paper= {{Paper |id=Vol-1894/opt7 |storemode=property |title=О задаче достижимости для нелинейной управляемой системы с интегральными ограничениями(On the reachability problem for a nonlinear control system with integral constraints) |pdfUrl=https://ceur-ws.org/Vol-1894/opt7.pdf |volume=Vol-1894 |authors=Igor V. Zykov }} ==О задаче достижимости для нелинейной управляемой системы с интегральными ограничениями(On the reachability problem for a nonlinear control system with integral constraints)== https://ceur-ws.org/Vol-1894/opt7.pdf
    О задаче достижимости для нелинейной управляемой
         системы с интегральными ограничениями

                                                     И.В. Зыков
                                                  zykoviustu@mail.ru
                                            ИММ УрО РАН (Екатеринбург)




                                                      Аннотация
                       В настоящей работе рассматриваются линейные по управлению си-
                       стемы с интегральными ограничениями на управление и траекто-
                       рию. Показано, что управление, переводящее систему на грани-
                       цу проекции множества достижимости на заданное линейное под-
                       пространство, является решением некоторой задачи оптимального
                       управления с интегральным функционалом и, следовательно, удо-
                       влетворяет принципу максимума.




1    Введение и постановка задачи
   Свойства множеств достижимости в нелинейных системах с интегральными ограничениями исследо-
вались в работах [1, 2]. Алгоритмы построения множеств достижимости, основанные на дискретных ап-
проксимациях, изучались в [3, 4]. В работе [5] для систем с интегральными ограничениями на управление
доказано, что любое управление, удовлетворяющее интегральным ограничениям и переводящее систему на
границу множества достижимости, является локальным решением некоторой задачи оптимального управ-
ления.
   В настоящей статье результаты из [5] обобщаются на следующий случай:
   1) рассматриваются совместные интегральные ограничения на управление и траекторию;
   2) изучаются граничные точки проекции множества достижимости на заданное линейное подпростран-
ство.
   Доказано, что управление, удовлетворяющее ограничениям и переводящее систему на границу проекции
множества достижимости на заданное линейное подпространство, является локальным решением задачи
оптимального управления с терминальным ограничением. Этот факт позволяет для отыскания точек мно-
жеств достижимости применять соотношения принципа максимума Понтрягина.
   Далее будем использовать следующие обозначения. Для вещественной матрицы A через A> мы обо-
значаем транспонированную матрицу, 0 обозначает нулевой вектор подходящей размерности, O — ну-
левую матрицу. Символом I будем обозначать единичную матрицу. Для x, y ∈ Rk (x, y) = x> y —
                                                  1
скалярное произведение векторов, kxk = (x, x) 2 — евклидова норма в конечномерном пространстве,
                  n
B(x̄, r) = {x ∈ R : kx − x̄k 6 r} — шар радиуса r > 0 с центром в точке x̄. Для вещественной пря-
моугольной k × m матрицы A через k A kk×m обозначаем норму матрицы, подчиненную евклидовым
                             n                                        ∂g
                Для S ⊂
нормам векторов.           R символом ∂S обозначается граница S, ∂x (x) — матрица Якоби отображе-
                    ∂         ∂
ния g(x), ∇ =      ∂x1 · · · ∂xn   — оператор Гамильтона. Через L1 , L2 и C будем обозначать, соответственно,

Copyright c by the paper’s authors. Copying permitted for private and academic purposes.
In: A.A. Makhnev, S.F. Pravdin (eds.): Proceedings of the International Youth School-conference «SoProMat-2017», Yekaterinburg,
Russia, 06-Feb-2017, published at http://ceur-ws.org




                                                              88
пространства суммируемых, суммируемых с квадратом и непрерывных вектор-функций на [t0 , t1 ]. Нормы
в этих пространствах будем обозначать символами k · kL1 , k · kL2 , k · kC .
   Мы будем рассматривать управляемые системы с ограничениями вида

                        ẋ(t) = f1 (t, x(t)) + f2 (t, x(t))u(t),      t 0 6 t 6 t1 ,   x(t0 ) = x0 ,               (1)
          n                               r                                               n+1          n   n+1   n×r
где x ∈ R — вектор состояния, u ∈ R — управляющий параметр, f1 : R                → R , f2 : R    →R      —
непрерывные отображения; управление u(t) — вектор-функция из L2 [t0 , t1 ]; t0 , t1 и начальное состояние x0
фиксированы.
   Отображения f1 : [t0 , t1 ]×Rn → Rn , f2 : [t0 , t1 ]×Rn → Rn×r непрерывны, непрерывно дифференцируемы
по x и удовлетворяют условиям:

                                           k f1 (t, x) k 6 l1 (t)(1+ k x k),                                       (2)
                                                   k f2 (t, x) kn×r 6 l2 (t),                                      (3)
         n
где x ∈ R , l1 (·) ∈ L1 , l2 (·) ∈ L2 , t ∈ [t0 , t1 ].
   Решением (траекторией) системы (1), отвечающим управлению u(·) ∈ L2 , будем называть абсолютно
непрерывную функцию x : [t0 , t1 ] → Rn , для которой равенство (1) выполняется для почти всех t ∈ [t0 , t1 ].
При условиях (2), (3), для любых u(·) ∈ L2 существует единственное решение x(t).
   Определим интегральный функционал J(u(·)) равенством
                                                  Z t1
                                                        Q(t, x(t)) + u> (t)R(t)u(t) dt,
                                                                                   
                                        J(u) =                                                           (4)
                                              t0

где Q(t, x) — неотрицательная непрерывная функция, а R(t) — положительно определенная матрица,
непрерывно зависящая от t. Через U обозначим непустое множество тех u(·) ∈ L2 , для которых J(u(·)) 6 µ2 ,
где µ > 0 — заданное число.

Определение 1 Множеством достижимости G(t1 ) системы (1) в момент времени t1 будем называть
совокупность всех концов траекторий x(t1 ) в Rn , отвечающих управлениям из U .

  Определим линейное отображение Pk : Rn → Rk (k < n) следующим образом:

                                               y = Pk x,
                                
где матрица Pk = Ik×k Ok×(n−k) . Таким образом, y состоит из первых k координат вектора x.
   Матрицу Pk , которая осуществляет переход от x ∈ Rn к y ∈ Rk , назовем матрицей проектирования на
подпространство первых k координат.

Определение 2 Проекцией множества достижимости G1k (t1 ) системы (1) на подпространство пер-
вых k координат в момент времени t1 будем называть совокупность векторов y 1 в Rk вида y 1 = Pk x(t1 ),
где x(t) — траектории системы 1, отвечающие управлениям из U . Если G(t1 ) — множество достижи-
мости, то G1k (t1 ) = Pk G(t1 ).

  Рассмотрим задачу оптимального управления для системы (1).

Задача 1
                           J(u) → min,        u(·) ∈ L2 ,       x(t0 ) = x0 ,   Pk x(t1 ) = y 1 ,                  (5)
где y 1 – заданный вектор из Rk . Управление u(·) ∈ L2 , удовлетворяющее ограничению задачи 1, назовем
допустимым управлением.

  Подчеркнем, что единственным ограничением в задаче 1 выступает терминальное ограничение на тра-
екторию Pk x(t1 ) = y 1 .

Определение 3 Управление u(·) ∈ L2 , удовлетворяющее ограничению задачи 1, доставляет локальный
минимум функционалу J(u), если существует ε > 0 такое, что для любого другого v(·) ∈ L2 , удовлетво-
ряющего ограничению задачи 1, такого, что k u(·) − v(·) kL2 < ε, имеет место неравенство J(u) 6 J(v).




                                                              89
Определение 4 Пусть u(t) — управление из U , x(t) — отвечающая этому управлению траектория.
Систему
                                    ˙ = A(t)δx + B(t)δv,
                                   δx
где A(t) = ∂f               ∂
             ∂x (t, x(t)) + ∂x [f2 (t, x(t))u(t)], B(t) = f2 (t, x(t)), назовем линеаризацией системы (1) вдоль
               1


пары (x(t), u(t)).

  Схема доказательства приводимых далее результатов во многом повторяет схему из работы [5]. При
необходимости мы будем делать соответствующие ссылки.

2    Вспомогательные результаты
    Рассмотрим линейную нестационарную систему

                              ẋ(t) = A(t)x(t) + B(t)u(t),           t ∈ [t0 , t1 ],   x(t0 ) = x0 ,              (6)

где x ∈ Rn , u(t) ∈ Rr , A(t), B(t) – непрерывные на [t0 , t1 ] матричные функции.
   Определим симметричную матрицу V (t0 , t) равенствами
                                                                     Z t
                   V (t0 , t) = Pk W (t0 , t)Pk> ,    W (t0 , t) =         X(t, τ )B(τ )B > (τ )X > (t, τ )dτ,
                                                                      t0


здесь W (t0 , t) — грамиан управляемости, X(t, τ ) = Φ(t)Φ−1 (τ ) — матрица Коши однородной системы, где
Φ(t) — фундаментальная матрица, удовлетворяющая уравнению Φ̇(t) = A(t)Φ(t).
   Условие Pk x(t1 ) = y 1 ∈ Rk означает, что траектория x(t) должна быть приведена в момент времени t = t1
на k-мерную плоскость n-мерного пространства. Если для любой точки y 1 ∈ Rk существует управление
u(·) ∈ L2 такое, что y 1 = Pk x(t1 ), то система (6) называется управляемой по выходу y на отрезке [t0 , t1 ].
   Система (6) вполне управляема по выходу y = Pk x на [t0 , t1 ] в том и только том случае, когда V (t0 , t1 )
положительно определена (см., например, [6, с. 204]).
   Очевидно, что если u(·) ∈ U , то
                                             Z t1
                                                  u> (t)R(t)u(t)dt 6 µ2 .
                                                 t0

  Так как R(t) положительно определена и непрерывна, то существует δ > 0 такое, что (R(t) − δI) > 0 и,
следовательно,
                                      Z t1
                                                          µ2
                                           u> (t)u(t)dt 6    .
                                        t0                δ
    Таким образом, все управления из U принадлежат гильбертову шару
                                                             Z t1
                                                                                  µ2
                                                                                         
                                                                             2
                                     D=        u(·) ∈ L2 :          k u(t) k dt 6             .
                                                              t0                  δ

Отсюда и из [5, утв. 2], следует компактность множества траекторий системы (1), удовлетворяющих огра-
ничению U .
  Зададим последовательность управлений v m (·), которая отображается в последовательность траекторий
x (·). Линеаризованная вдоль (xm (·), v m (·)) система (1) задается парой матриц (Am (t), Bm (t)), где
 m


                              ∂f1               ∂
                   Am (t) =       (t, xm (t)) +    [f2 (t, xm (t)) · v m (t)],         Bm (t) = f2 (t, xm (t)).
                              ∂x                ∂x
Справедлива

Лемма 1 Если um (·) → u(·) в L2 и пара (A(t), B(t)), отвечающая управлению u(·), управляема по выходу
y, то, начиная с некоторого m, пара (Am (t), Bm (t)) будет управляемой на подпространстве Rk (по выходу
y).




                                                               90
Доказательство. Запишем соответствующие матрицы управляемости
                                         Z t1
                          V (t0 , t1 ) =      Pk M (t)B(t)B(t)> M (t)> Pk> dt,
                                                     t0
                                               Z t1
                            V m (t0 , t1 ) =          Pk Mm (t)Bm (t)Bm (t)> Mm (t)> Pk> dt,
                                                t0
где
                                                     Ṁ (t) = −A> (t)M (t),
                                                Ṁm (t) = −A>
                                                            m (t)Mm (t),                                 (7)
                                                     M (t1 ) = Mm (t1 ) = I.
Так как Am (·) → A(·) в L1 [5, док-во леммы 1], то существует суммируемая функция γ(t) такая, что
k Am (t) kn×n 6 γ(t), ∀m, ∀t ∈ [t0 , t1 ]. Покажем ограниченность матрицы Mm (t), повторяя схему доказа-
тельства теоремы 3 [7, с. 9]. Существует K > 0 такое, что k Mm (t) kn×n 6 K ∀m, ∀t ∈ [t0 , t1 ]. Перейдем от
(7) к интегральному уравнению и построим последовательные приближения: Mm0 (t) ≡ I,
                                               Z t
                              Mmp+1 (t) = I −      A>
                                                    m (s)Mmp (s)ds, p = 0, 1, 2, ...
                                                           t1

Из условия k Am (t) kn×n 6 γ(t) и того факта, что
                           k Am (t)Z kn×n 6k Am (t) kn×n k Z kn×n 6 γ(t) k Z kn×n
для любой матрицы Z, получаем существование и непрерывность всех приближений, где
                                          Z t
             k Mmp+1 (t) − Mmp (t) kn×n 6     γ(s) k Mmp (s) − Mmp−1 (s) kn×n ds, p = 1, 2, ...
                                                      t1
                                                                        Rt
Положим ξ = max k Mm1 (t) − Mm0 (t) kn×n на отрезке [t0 , t1 ], ψ(t) = t1 γ(s)ds. По индукции доказывается,
              m,t
что на этом отрезке
                                                          (ψ(t))p
                          k Mmp+1 (t) − Mmp (t) kn×n 6 ξ            , p = 0, 1, 2, ...
                                                              p!
Тогда
                                                                  p          i
                                                                 X    (ψ(t))
                              k Mmp+1 (t) − Mm0 (t) kn×n 6 ξ                   ,
                                                                 i=0
                                                                        i!
где правая часть есть равномерно сходящийся ряд на отрезке [t0 , t1 ]. Следовательно, существует
limp→∞ Mmp (t) = Mm (t) и возможен предельный переход в интегральном уравнении. Поэтому Mm (t) яв-
ляется решением интегрального уравнения, а значит и уравнения (7), на отрезке [t0 , t1 ]. Из этого, един-
ственности решения (следует из липшицевости правой части (7)) и неравенств
                       k Mm0 (t) kn×n −ξ · C 6k Mmp+1 (t) kn×n 6k Mm0 (t) kn×n +ξ · C
для некоторого C > 0, получаем ограниченность Mm (t) по норме.
  Поскольку
                  d
                    (M (t) − Mm (t)) = −A> (t)(M (t) − Mm (t)) + (Am (t) − A(t))> Mm (t),
                 dt
то получаем следующую формулу
                                           Z t
                          M (t) − Mm (t) =     Y (t, τ )(Am (τ ) − A(τ ))> Mm (τ )dτ.
                                                          t1

Здесь Y (t, τ ) есть фундаментальная матрица системы ẋ = −A> (t)x, непрерывная по t, τ . Следовательно,
последнее равенство означает, что Mm (t) ⇒ M (t). Матрица Bm (·) равномерно сходится к B(·) [5, док-
во леммы 1]. Отсюда V m (t0 , t1 ) → V (t0 , t1 ), m → ∞. Если V (t0 , t1 ) положительно определена, то для
достаточно больших m матрица V m (t0 , t1 ) будет также положительно-определенной, следовательно, пара
(Am (t), Bm (t)) управляема на подпространстве Rk .
                                                                                                          




                                                                91
3   Экстремальные свойства граничных точек множества достижимости
   Определим отображения F : L2 → Rn и S : Rn → Rk следующим образом: F (u(·)) = x(t1 ), Sx(t1 ) =
Pk x(t1 ), где x(t) — траектория системы (1), отвечающая u(·). Тогда их композиция H : L2 → Rk есть не
что иное, как H(u(·)) = Pk F (u(·)) = Pk x(t1 ).
   Cправедлива

Лемма 2 Пусть функции f1 (t, x), f2 (t, x) непрерывны, непрерывно дифференцируемы по x и удовлетво-
ряют условиям (2) и (3). Тогда функция H непрерывно дифференцируема по Фреше для ∀u(·) ∈ L2 [t0 , t1 ],
ее производная Фреше H 0 : L2 → Rk определена равенством

                                                H 0 (u(·))δu(·) = Pk δx(t1 ).                                         (8)

Здесь δx(t) — решение линеаризованной вдоль (u(t), x(t)) системы (1), отвечающее управлению δu(t) и
нулевому начальному условию. Если линеаризованная система вполне управляема по первым k координа-
там, то Im H 0 (u(·)) = Rk .

Доказательство. В [5, л. 2] показана дифференцируемость отображения F по Фреше, производная кото-
рого F 0 (u(·))δu(·) = δx(t1 ). Линейное отображение S также дифференцируемо и S 0 (x(t1 ))δx(t1 ) = Pk . Таким
образом, отображение H дифференцируемо по Фреше как композиция дифференцируемых отображений
и имеет место равенство
                                   H 0 (u(·))δu(·) = S 0 (x(t1 )) ◦ F 0 (u(·)) = Pk δx(t1 ).

                                                                                                                       


Лемма 3 Функционал J(u(·)) непрерывен в любой точке u0 (·) ∈ L2 .

Доказательство. Как уже говорилось, под решением (траекторией) системы (1), отвечающим управле-
нию u(·) ∈ L2 , понимаем абсолютно непрерывную функцию x : [t0 , t1 ] → Rn , для которой равенство (1)
выполняется для почти всех t ∈ [t0 , t1 ]. Зададим управление u0 (·) из L2 , которому соответствует траектория
x0 (·). Тогда cправедлива оценка для любых u(·) ∈ L2 :

                                                   J(u(·)) − J(u0 (·)) =
            Z t1                                                                                       
                                                               >                 >
        =            [Q(t, x(t)) − Q(t, x0 (t))] + (u> (t) − u0 (t))R(t)u(t) + u0 (t)R(t)(u(t) − u0 (t)) dt 6
                t0

       6 max k Q(t, x(t)) − Q(t, x0 (t)) k ·|t1 − t0 |+ k u(·) − u0 (·) kL2 k R(·) kC k u(·) kL2 + k u0 (·) kL2
                                                                                                                  
            t

                     6 max k Q(t, x(t)) − Q(t, x0 (t)) k ·|t1 − t0 | + C· k u(·) − u0 (·) kL2 ,   C > 0.              (9)
                          t

  Функция Q(t, x(t)) непрерывна на компактном множестве траекторий системы (1), поэтому равномерно
непрерывна на нём. Пусть ∆u(t) = u(t) − u0 (t), ∆x(t) = x(t) − x0 (t), а ∆J(u(·)) = J(u(·)) − J(u0 (·)). Из
оценки k ∆x(·) kC = O (k ∆u(·) kL2 ), которая была получена в доказательстве леммы 2 из [5], вытекает: для
любого δ > 0 из k ∆u(·) kL2 < δ следует k ∆x(t) k< kδ, k > 0. Тогда, учитывая равномерную непрерывность
Q(t, x(t)), всегда найдется такое δ = δ(ε) > 0, что для любого ε > 0 из k ∆u(·) kL2 < δ будет следовать
|∆J(u(·))| < ε. Таким образом, выполнено условие непрерывности исходного функционала.                     


Теорема 1 Пусть:
1) y 1 ∈ ∂G1k (t1 );
2) u(·) ∈ U — управление, переводящее систему (1) из x(t0 ) = x0 в точку x(t1 ) такую, что Pk x(t1 ) = y 1 ,
   x(t) — соответствующая траектория;
3) Линеаризованная вдоль (x(t), u(t)) система (1) управляема по y = Pk x на [t0 , t1 ].
   Тогда управление u(·) ∈ L2 доставляет локальный минимум функционалу J(u(·)) при ограничениях
x(t0 ) = x0 , Pk x(t1 ) = y 1 и величина J(u(·)) = µ2 .




                                                             92
Доказательство. Проведем доказательство от противного. Пусть найдется u(·), переводящее систему из
x(t0 ) = x0 в Pk x(t1 ) = y(t1 ) ∈ ∂G1k (t1 ), которое не является локально оптимальным в задаче 1, иначе
говоря, для любого p существует допустимое управление up (·) такое, что

                                                                1
                                      k u(·) − up (·) kL2 <       ,   J(up (·)) < J(u(·)),
                                                                p

либо J(u(·)) < µ2 . Тогда существует последовательность up (·) → u(·), p → ∞ в L2 такая, что
Pk xp (t1 , up (·)) = y(t1 ), а J(up (·)) < µ2 . Далее, выберем p настолько большим, чтобы пара (Ap (t), Bp (t))
была управляемой по y (см. лемму 1) и зафиксируем это p. Обозначим

                                                     δ = µ2 − J(up (·)) > 0.

Тогда
                                                     J(up (·)) < µ2 − δ/2.
Из леммы 2 получаем, что линеаризованная вдоль (up (·), xp (·)) система управляема по y, это эквивалентно
условию Im H 0 (up (·)) = Rk . Тогда по теореме Грейвса [8, с. 105] для некоторого m > 0 и всех достаточно
малых r выполняется включение B(y 1 , mr) ⊂ F (B(up (·), r)).
  Таким образом,
                               B(up (·), r) ⊂ U ⇒ F (B(up (·), r)) ⊂ F (U ) ⊂ G1k (t1 ),
отсюда следует B(y 1 , mr) ⊂ G1k (t1 ), что противоречит условию y 1 ∈ ∂G1k (t1 ).               
   Выпишем необходимые условия оптимальности в форме принципа максимума для задачи 1, предпола-
гая, что Q(t, x) непрерывно дифференцируема.
   Функция Понтрягина здесь имеет вид

                   H(p, t, x, u) = −p0 Q(t, x) + u> R(t)u + p> (f1 (t, x) + f2 (t, x)u), p0 > 0.
                                                         


  Локально оптимальное управление удовлетворяет принципу максимума (см., например, [9, §5, т. 2]):
существуют (p0 , p(·)) 6= 0 такие, что

                                      H(p(t), t, x(t), u(t)) = maxr H(p(t), t, x(t), v).
                                                                  v∈R

                                     ∂
                         ṗ(t) = −      H(p(t), t, x(t), u(t)) = −A> (t)p(t) + p0 ∇> Q(t, x(t)),
                                     ∂x
                                              pj (t1 ) = 0,      j = k + 1, ..., n.                              (10)
  Равенства (10), в силу частичного закрепления концов траекторий, есть условия трансверсальности
на правом конце. Через (A(t), B(t)), как и ранее, обозначаем матрицы линеаризованной вдоль (x(t), u(t))
системы. Если эта линеаризованная на (x(t), u(t)) система вполне управляема по выходу y, то p0 6= 0.
  Предположим, что p0 = 0. Тогда p(·) 6= 0. Максимум по v линейной по управлению функции

             H(t, x(t), p(t), v) = p> (t)f1 (t, x(t)) + p> (t)f2 (t, x(t))v = p> (t)f1 (t, x(t)) + p> (t)B(t)v
                  >
существует, если p (t)B(t)
                           ≡ 0, где p(t) удовлетворяет системе ṗ(t) = −A> (t)p(t). С учетом (10) p(t1 )
                    l
имеет вид p(t1 ) = k , где lk ∈ Rk , lk 6= 0. Представим p(t) в виде p(t) = lk> , 0> X(t1 , t), где X(τ, t) –
                                                                                    
                    0
фундаментальная матрица системы ẋ = A(t)x. Тогда

                                          lk> , 0> X(t1 , t)B(t) ≡ 0,
                                                  


или
                                                     lk> Pk X(t1 , t)B(t) ≡ 0.
Поэтому
                                                     Z t1
                            lk> Pk x(t1 ) = lk> Pk          X(t1 , t)B(t)u(t)dt = 0 ∀u(·) ∈ L2 .
                                                      t0




                                                                 93
Иначе говоря lk ⊥ Pk x(t1 ). Из последнего и Pk x(t1 ) = Rk (следует                       k
                                                                  из управляемости на R ) получаем
                                                                  lk
lk = 0, что противоречит начальному предположению p(t1 ) =           6= 0. Cправедливо принять p0 = 12 .
                                                                  0
Тогда из принципа максимума получим u(t) = R−1 (t)f2> (t, x(t))p(t).
   Замыкая исходную систему данным управлением, имеем
                                                            −1   >                        0
                          ẋ(t) = f1 (t,
                                      x(t)) + f2 (t, x(t))R (t)f2 (t,
                                                                    x(t))p(t), x(t0 ) = x ,
                                      ∂f1 >           >
                          ṗ(t) = −   ∂x (t, x(t)) + D (t, x(t), v)    p(t) + 21 ∇> Q(t, x(t)),        (11)
                                            pj (t1 ) = 0,   j = k + 1, ..., n.
                            ∂
где обозначено D(t, x, v) = ∂x (f2 (t, x)v), v = R−1 (t)f2> (t, x(t))p(t).

4     Численное моделирование
4.1   Описание алгоритма
    Соотношение (11) можно положить в основу следующего алгоритма построения границы множества
достижимости.
    Выбирая p(t0 ) 6= 0 и интегрируя систему (11) (учитывая условия трансверсальности), мы получим
управление и траекторию, удовлетворяющие принципу максимума. Перебирая p(t0 ) из регулярной сет-
ки, аппроксимирующей область {p(t0 ) ∈ Rn : |pi (t0 )| 6 ci , i = 1, 2, ..., n}, интегрируя систему (11) и
отбирая те траектории, для которых |J(u(·)) − µ2 | не превосходит малого ε1 > 0, мы получим аппрок-
симацию части границы множества достижимости, образованную точками y 1 = Pk x(t1 ). Плюс ко всему,
при отсеивании траекторий, нужно проверять выполнение условий трансверсальности на правом конце:
|pj (t1 )| < ε2 , j = k + 1, ..., n, для малого ε2 > 0. Для достаточно больших ci и малых ε1 и ε2 аппрокси-
мироваться будет вся граница, если на каждой из возможных траекторий выполняется условие полной
управляемости линеаризованной системы. Данный алгоритм, использованный в [5] при построении мно-
жеств достижимости, требует достаточно больших вычислительных затрат и априорной оценки области
начальных данных для p(t0 ).
    Здесь мы используем другой алгоритм, обеспечивающий более экономную схему вычислений. Приведем
его описание для двумерного случая и Pk = I. Будем выбирать направления на единичной сфере: {p∗ ∈
                           >
R2 : p∗ = cos α sin α , α ∈ [0; 2π]}. На каждом луче {p ∈ R2 : p = kp∗ , k > 0} мы ищем значение
                                                         2
k, для которого достигается минимум J(u(·)) − µ2 , на полуинтервале [0; +∞). Для этой цели можно
использовать стандартную процедуру одномерной оптимизации. Найденное значение k̄ определяет наш
вектор p = k̄ p¯∗ , выбирая который в качестве начального условия для системы принципа максимума, мы
получим точку x(t1 ), лежащую на границе множества достижимости. В трехмерном случае рассуждения
похожи, если использовать, например, сферические координаты.

4.2   Пример 1
  Напомним, что математическая модель “хищник-жертва” представляет собой систему двух нелинейных
дифференциальных уравнений:

                                      ẋ1 = ax1 − cx1 x2 , a > 0, c > 0,
                                                                                                    (12)
                                      ẋ2 = −bx1 + dx1 x2 , b > 0, d > 0,
причем x1 – число жертв, x2 – число хищников.
   Эта математическая модель успешно применяется в биологии, демографии, физике и экономике. В
частности, она может быть применена в экономике для анализа изменения объемов закупок в зависимости
от цены (модель не содержит объемов предложения электроэнергии, так как для рынка электроэнергии
они примерно постоянны). В этом случае цена выступает в роли хищника, а объемы закупок – в роли
жертвы (“цена съедает спрос”). Объясним это подробнее.
   Обозначим объемы закупок электроэнергии в секторе свободной торговли через x1 , цену электроэнергии
через x2 . Спрос тем быстрее уменьшается, чем больше проданной электроэнергии и чем больше ее цена.
Иными словами, цена тем быстрее снижает закупки, чем более насыщен рынок электроэнергии по этой
цене (x1 x2 ). Поэтому, если объемы закупок электроэнергии ненулевые, то объемы закупок электроэнергии
меняются по закону ẋ1 = ax1 −cx1 x2 (a > 0, c > 0). С другой стороны, прибыль, получаемая поставщиками




                                                            94
от продажи электроэнергии, стимулирует увеличение цены. Прибыль пропорциональна количеству про-
данного товара по его цене (x1 x2 ). Поэтому имеем ẋ2 = −bx2 + dx1 x2 (b > 0, d > 0). Модель “цена-объемы
покупок” построена.
   Полученная модель достаточно точно описывает динамику цен и объемов закупок электроэнергии, ко-
торая позволяет предсказывать изменение конъюнктуры на рынке электроэнергии.
   Обозначим за управление u неопределенные факторы, влияющие на объем покупок и наложим на x1
(объем закупок) и u квадратичные интегральные ограничения:
                                                               Z t1
                      ẋ1 = ax1 − cx1 x2 + u, a > 0, c > 0,
                                                                        x21 (s) + u2 (s) ds 6 2.
                                                                                        
                                                                                                         (13)
                      ẋ2 = −bx1 + dx1 x2 , b > 0, d > 0,         t0

  Примем a = 4, b = 2.5, c = 2, d = 1. Считаем, что в нулевой момент времени объем закупок равен 1, а
цена 3.
  Тогда получаем следующее условие:
                                                                       Z t1
                    ẋ1 = 4x1 − 2x1 x2 + u,                  >
                                                                              x21 (s) + u2 (s) ds 6 2.
                                                                                              
                                            x(0) = 1        3 ,                                          (14)
                    ẋ2 = −2.5x1 + x1 x2 ,                              0

  Результаты численного моделирования представлены на рис. 1 и 2.




  Рис. 1: Множество достижимости при t1 = 0.5                  Рис. 2: Множество достижимости при t1 = 1


4.3   Пример 2
  Рассмотрим математический маятник с ограничением на энергию управления [1]:

                                      ẋ1 = x2 ,                x1 (0) = 0
                                                                                                         (15)
                                      ẋ2 = − 12 sin x1 + u,    x2 (0) = 0
                                              Z t1
                                                     u2 (s)ds 6 2.
                                               0

  Результаты численного моделирования представлены на рис. 3 и 4.


Благодарности
  Выражаю благодарность своему научному руководителю Михаилу Ивановичу Гусеву за ценные советы
при планировании исследования и рекомендации по оформлению статьи.




                                                       95
  Рис. 3: Множество достижимости при t1 = π/2                Рис. 4: Множество достижимости при t1 = π
Список литературы
[1] B. T. Polyak. Сonvexity of the reachable set of nonlinear systems under L2 bounded controls. Dynamics of
    Continuous, Discrete and Impulsive Systems, Series A: Mathematical Analysis, 11:255–267, 2004.
[2] N. Huseyin, A. Huseyin. Compactness of the set of trajectories of the controllable system described by an
    affineintegral equation. Applied Mathematics and Computation, 219:8416–8424, 2013.

[3] Kh. G. Guseinov, A. S. Nazlipinar. Attainable sets of the control system with limited resources. Tr. In-ta
    matematiki i mekhaniki UrO RAN, 16(5):261–268, 2010.
[4] K. G. Guseinov, O. Ozer, E. Akyar, V. N. Ushakov. The approximation of reachable sets of control systems
    with integral constraint on controls. Nonlinear Differential Equations and Applications, 14(1-2):57–73, 2007.
[5] M. I. Gusev, I. V. Zykov. On extremal properties of boundary points of attainability sets of controllable
    systems under integral constraints. Tr. In-ta matematiki i mekhaniki UrO RAN, 23(1):103-115, 2017 (in
    Russian). = М. И. Гусев, И. В. Зыков. Об экстремальных свойствах граничных точек множеств дости-
    жимости управляемых систем при интегральных ограничениях. Тр. Ин-та математики и механики
    УрО РАН, 23(1):103–115, 2017.
[6] Ya. N. Roytenberg. Automatic control. Nauka, Moscow, 1971 (in Russian). = Я. Н. Ройтенберг. Автома-
    тическое управление. Наука, Москва, 1971.
[7] A. F. Filippov. Differential equations with discontinuous right-hand side. Nauka, Moscow, 1985 (in Russian).
    = А. Ф. Филиппов. Дифференциальные уравнения с разрывной правой частью. Наука, Москва, 1985.
[8] A. D. Ioffe. Metric regularity and subdifferential calculus. UMN, 55(3):103–162, 2000 (in Russian). = А. Д.
    Иоффе. Метрическая регулярность и субдифференциальное исчисление. УМН, 55(3):103–162, 2000.
[9] A. V. Arutyunov, G. G. Magaril-Il’yaev, V. M. Tikhomirov. The Pontryagin maximum principle. Proof and
    applications. M.: Faktorial press, Moscow, 2006 (in Russian). = А. В. Арутюнов, Г. Г. Магарил-Ильяев,
    В. М. Тихомиров. Принцип максимума Понтрягина. Доказательство и приложения. Факториал
    пресс, Москва, 2006.




                                                       96
  On the reachability problem for a nonlinear control system with
integral constraints
  Igor V. Zykov
  Krasovskii Institute of Mathematics and Mechanics (Yekaterinburg, Russia)

  Keywords: controlled system, integral constraints, projection of the reachability set, maximum principle.

   In this paper we consider linear control systems with integral constraints on a control and a trajectory. It
is shown that the control that takes the system to the boundary of the projection of the reachability set on a
given linear subspace is a solution of some optimal control problem with an integral functional and, consequently,
satisfies the maximum principle.




                                                       97