-

О задаче достижимости для нелинейной управляемой системы с интегральными ограничениями

И.В. Зыков zykoviustu@mail.ru

88 97

В настоящей работе рассматриваются линейные по управлению системы с интегральными ограничениями на управление и траекторию. Показано, что управление, переводящее систему на границу проекции множества достижимости на заданное линейное подпространство, является решением некоторой задачи оптимального управления с интегральным функционалом и, следовательно, удовлетворяет принципу максимума.

In: A.A. Makhnev, S.F. Pravdin (eds.): Proceedings of the International Youth School-conference ¾SoProMat-2017¿, Yekaterinburg, Russia, 06-Feb-2017, published at http://ceur-ws.org пространства суммируемых, суммируемых с квадратом и непрерывных вектор-функций на [t0; t1]. Нормы в этих пространствах будем обозначать символами k kL1 , k kL2 , k kC .

Мы будем рассматривать управляемые системы с ограничениями вида

x_ (t) = f1(t; x(t)) + f2(t; x(t))u(t); t0 6 t 6 t1; x(t0) = x0; где x 2 Rn вектор состояния, u 2 Rr управляющий параметр, f1 : Rn+1 ! Rn; f2 : Rn+1 ! Rn r непрерывные отображения; управление u(t) вектор-функция из L2[t0; t1]; t0; t1 и начальное состояние x0 фиксированы.

Отображения f1 : [t0; t1] Rn ! Rn, f2 : [t0; t1] Rn ! Rn r непрерывны, непрерывно дифференцируемы по x и удовлетворяют условиям: k f1(t; x) k 6 l1(t)(1+ k x k);

k f2(t; x) kn r 6 l2(t); где x 2 Rn, l1( ) 2 L1; l2( ) 2 L2, t 2 [t0; t1].

Решением (траекторией) системы (1), отвечающим управлению u( ) 2 L2, будем называть абсолютно непрерывную функцию x : [t0; t1] ! Rn, для которой равенство (1) выполняется для почти всех t 2 [t0; t1]. При условиях (2), (3), для любых u( ) 2 L2 существует единственное решение x(t).

Определим интегральный функционал J (u( )) равенством Определение 2 Проекцией множества достижимости G1k(t1) системы (1) на подпространство первых k координат в момент времени t1 будем называть совокупность векторов y1 в Rk вида y1 = Pkx(t1), где x(t) траектории системы 1, отвечающие управлениям из U . Если G(t1) множество достижимости, то G1k(t1) = PkG(t1).

Рассмотрим задачу оптимального управления для системы (1). Задача 1

J (u) ! min; u( ) 2 L2; x(t0) = x0; Pkx(t1) = y1; (5) где y1 – заданный вектор из Rk. Управление u( ) 2 L2, удовлетворяющее ограничению задачи 1, назовем допустимым управлением.

Подчеркнем, что единственным ограничением в задаче 1 выступает терминальное ограничение на траекторию Pkx(t1) = y1. Определение 3 Управление u( ) 2 L2, удовлетворяющее ограничению задачи 1, доставляет локальный минимум функционалу J (u), если существует " > 0 такое, что для любого другого v( ) 2 L2, удовлетворяющего ограничению задачи 1, такого, что k u( ) v( ) kL2 < ", имеет место неравенство J (u) 6 J (v). Определение 4 Пусть u(t) Систему управление из U , x(t)

отвечающая этому управлению траектория.

_x = A(t) x + B(t) v; где A(t) = @@fx1 (t; x(t)) + @@x [f2(t; x(t))u(t)]; B(t) = f2(t; x(t)), назовем линеаризацией системы (1) вдоль пары (x(t); u(t)).

Схема доказательства приводимых далее результатов во многом повторяет схему из работы [5]. При необходимости мы будем делать соответствующие ссылки. 2

Вспомогательные результаты Рассмотрим линейную нестационарную систему x_ (t) = A(t)x(t) + B(t)u(t); t 2 [t0; t1]; x(t0) = x0; ( 6 ) где x 2 Rn, u(t) 2 Rr, A(t), B(t) – непрерывные на [t0; t1] матричные функции.

Определим симметричную матрицу V (t0; t) равенствами

Bm(t) = f2(t; xm(t)): Справедлива Лемма 1 Если um( ) ! u( ) в L2 и пара (A(t); B(t)), отвечающая управлению u( ), управляема по выходу y, то, начиная с некоторого m, пара (Am(t); Bm(t)) будет управляемой на подпространстве Rk (по выходу y). Так как R(t) положительно определена и непрерывна, то существует следовательно, > 0 такое, что (R(t)

I) > 0 и, Таким образом, все управления из U принадлежат гильбертову шару Из условия k Am(t) kn n6 (t) и того факта, что

Mmp+1 (t) = I

A>m(s)Mmp (s)ds; p = 0; 1; 2; ::: k Am(t)Z kn n6k Am(t) kn nk Z kn n6 (t) k Z kn n для любой матрицы Z, получаем существование и непрерывность всех приближений, где k Mmp+1 (t)

Mmp (t) kn n6 (s) k Mmp (s)

Mmp 1 (s) kn n ds; p = 1; 2; ::: Положим = mma;tx k Mm1 (t) что на этом отрезке Тогда

Mm0 (t) kn n на отрезке [t0; t1], (t) = Rtt1 (s)ds. По индукции доказывается, k Mmp+1 (t)

Mmp (t) kn n6 k Mmp+1 (t)

Mm0 (t) kn n6 ( (t))p p!

; p = 0; 1; 2; ::: Xp ( (t))i

; i! i=0 где правая часть есть равномерно сходящийся ряд на отрезке [t0; t1]. Следовательно, существует limp!1 Mmp (t) = Mm(t) и возможен предельный переход в интегральном уравнении. Поэтому Mm(t) является решением интегрального уравнения, а значит и уравнения ( 7 ), на отрезке [t0; t1]. Из этого, единственности решения (следует из липшицевости правой части ( 7 )) и неравенств k Mm0 (t) kn n

C 6k Mmp+1 (t) kn n6k Mm0 (t) kn n +

C для некоторого C > 0, получаем ограниченность Mm(t) по норме.

Поскольку d

(M (t) dt то получаем следующую формулу

Mm(t)) =

A>(t)(M (t)

Mm(t)) + (Am(t)

A(t))>Mm(t);

Экстремальные свойства граничных точек множества достижимости Определим отображения F : L2 ! Rn и S : Rn ! Rk следующим образом: F (u( )) = x(t1); Sx(t1) = Pkx(t1), где x(t) траектория системы (1), отвечающая u( ). Тогда их композиция H : L2 ! Rk есть не что иное, как H(u( )) = PkF (u( )) = Pkx(t1).

Cправедлива Лемма 2 Пусть функции f1(t; x), f2(t; x) непрерывны, непрерывно дифференцируемы по x и удовлетворяют условиям (2) и (3). Тогда функция H непрерывно дифференцируема по Фреше для 8u( ) 2 L2[t0; t1], ее производная Фреше H0 : L2 ! Rk определена равенством

H0(u( )) u( ) = Pk x(t1): ( 8 ) Здесь x(t) решение линеаризованной вдоль (u(t); x(t)) системы (1), отвечающее управлению u(t) и нулевому начальному условию. Если линеаризованная система вполне управляема по первым k координатам, то Im H0(u( )) = Rk. Доказательство. В [5, л. 2] показана дифференцируемость отображения F по Фреше, производная которого F 0(u( )) u( ) = x(t1). Линейное отображение S также дифференцируемо и S0(x(t1)) x(t1) = Pk. Таким образом, отображение H дифференцируемо по Фреше как композиция дифференцируемых отображений и имеет место равенство

H0(u( )) u( ) = S0(x(t1)) F 0(u( )) = Pk x(t1): Лемма 3 Функционал J(u( )) непрерывен в любой точке u0( ) 2 L2. Доказательство. Как уже говорилось, под решением (траекторией) системы (1), отвечающим управлению u( ) 2 L2, понимаем абсолютно непрерывную функцию x : [t0; t1] ! Rn, для которой равенство (1) выполняется для почти всех t 2 [t0; t1]. Зададим управление u0( ) из L2, которому соответствует траектория x0( ). Тогда cправедлива оценка для любых u( ) 2 L2:

J(u( )) J(u0( )) = =

Z t1

[Q(t; x(t)) Q(t; x0(t))] + (u>(t) u0>(t))R(t)u(t) + u0>(t)R(t)(u(t) u0(t)) dt 6 6 mtax k Q(t; x(t)) Q(t; x0(t)) k jt1 t0j+ k u( ) u0( ) kL2k R( ) kC k u( ) kL2 + k u0( ) kL2 6 mtax k Q(t; x(t)) Q(t; x0(t)) k jt1 t0j + C k u( ) u0( ) kL2; C > 0: ( 9 ) Функция Q(t; x(t)) непрерывна на компактном множестве траекторий системы (1), поэтому равномерно непрерывна на нём. Пусть u(t) = u(t) u0(t), x(t) = x(t) x0(t), а J(u( )) = J(u( )) J(u0( )). Из оценки k x( ) kC= O (k u( ) kL2), которая была получена в доказательстве леммы 2 из [5], вытекает: для любого > 0 из k u( ) kL2< следует k x(t) k< k ; k > 0. Тогда, учитывая равномерную непрерывность Q(t; x(t)), всегда найдется такое = (") > 0, что для любого " > 0 из k u( ) kL2< будет следовать j J(u( ))j < ". Таким образом, выполнено условие непрерывности исходного функционала. Теорема 1 Пусть: 1) y1 2 @G1k(t1); 2) u( ) 2 U управление, переводящее систему (1) из x(t0) = x0 в точку x(t1) такую, что Pkx(t1) = y1, x(t) соответствующая траектория; 3) Линеаризованная вдоль (x(t); u(t)) система (1) управляема по y = Pkx на [t0; t1].

Тогда управление u( ) 2 L2 доставляет локальный минимум функционалу J(u( )) при ограничениях x(t0) = x0, Pkx(t1) = y1 и величина J(u( )) = 2. k u( )

1 up( ) kL2 < ; J (up( )) < J (u( ));

p либо J (u( )) < 2. Тогда существует последовательность up( ) ! u( ); p ! 1 в L2 такая, что Pkxp(t1; up( )) = y(t1), а J (up( )) < 2. Далее, выберем p настолько большим, чтобы пара (Ap(t); Bp(t)) была управляемой по y (см. лемму 1) и зафиксируем это p. Обозначим

H(p(t); t; x(t); u(t)) =

A>(t)p(t) + p0r>Q(t; x(t)); pj(t1) = 0; j = k + 1; :::; n: (10) существует, если p>(t)B(t) 0, где p(t) удовлетворяет системе p_(t) = A>(t)p(t). С учетом (10) p(t1) l имеет вид p(t1) = 0k , где lk 2 Rk; lk 6= 0. Представим p(t) в виде p(t) = lk>; 0> X(t1; t), где X( ; t) – фундаментальная матрица системы x_ = A(t)x. Тогда или Поэтому lk>; 0> X(t1; t)B(t)

0; lk>PkX(t1; t)B(t)

X(t1; t)B(t)u(t)dt = 0 8u( ) 2 L2: Тогда из принципа максимума получим u(t) = R 1(t)f2>(t; x(t))p(t).

Замыкая исходную систему данным управлением, имеем x_ (t) = f1(t; x(t)) + f2(t; x(t))R 1(t)f2>(t; x(t))p(t); x(t0) = x0; pj(t1) = 0; j = k + 1; :::; n: (11) (12) 4 4.1 Численное моделирование

Описание алгоритма Соотношение (11) можно положить в основу следующего алгоритма построения границы множества достижимости.

Выбирая p(t0) 6= 0 и интегрируя систему (11) (учитывая условия трансверсальности), мы получим управление и траекторию, удовлетворяющие принципу максимума. Перебирая p(t0) из регулярной сетки, аппроксимирующей область fp(t0) 2 Rn : jpi(t0)j 6 ci; i = 1; 2; :::; ng, интегрируя систему (11) и отбирая те траектории, для которых jJ(u( )) 2j не превосходит малого "1 > 0, мы получим аппроксимацию части границы множества достижимости, образованную точками y1 = Pkx(t1). Плюс ко всему, при отсеивании траекторий, нужно проверять выполнение условий трансверсальности на правом конце: jpj(t1)j < "2; j = k + 1; :::; n, для малого "2 > 0. Для достаточно больших ci и малых "1 и "2 аппроксимироваться будет вся граница, если на каждой из возможных траекторий выполняется условие полной управляемости линеаризованной системы. Данный алгоритм, использованный в [5] при построении множеств достижимости, требует достаточно больших вычислительных затрат и априорной оценки области начальных данных для p(t0).

Здесь мы используем другой алгоритм, обеспечивающий более экономную схему вычислений. Приведем его описание для двумерного случая и Pk = I. Будем выбирать направления на единичной сфере: fp 2 R2 : p = cos sin > ; 2 [0; 2 ]g. На каждом луче fp 2 R2 : p = kp ; k > 0g мы ищем значение k, для которого достигается минимум J(u( )) 2 2, на полуинтервале [0; +1). Для этой цели можно использовать стандартную процедуру одномерной оптимизации. Найденное значение k определяет наш вектор p = kp , выбирая который в качестве начального условия для системы принципа максимума, мы получим точку x(t1), лежащую на границе множества достижимости. В трехмерном случае рассуждения похожи, если использовать, например, сферические координаты. 4.2

Пример 1 Напомним, что математическая модель “хищник-жертва” представляет собой систему двух нелинейных дифференциальных уравнений: x_ 1 = ax1 cx1x2; a > 0; c > 0; x_ 2 = bx1 + dx1x2; b > 0; d > 0; причем x1 – число жертв, x2 – число хищников.

Эта математическая модель успешно применяется в биологии, демографии, физике и экономике. В частности, она может быть применена в экономике для анализа изменения объемов закупок в зависимости от цены (модель не содержит объемов предложения электроэнергии, так как для рынка электроэнергии они примерно постоянны). В этом случае цена выступает в роли хищника, а объемы закупок – в роли жертвы (“цена съедает спрос”). Объясним это подробнее.

Обозначим объемы закупок электроэнергии в секторе свободной торговли через x1, цену электроэнергии через x2. Спрос тем быстрее уменьшается, чем больше проданной электроэнергии и чем больше ее цена. Иными словами, цена тем быстрее снижает закупки, чем более насыщен рынок электроэнергии по этой цене (x1x2). Поэтому, если объемы закупок электроэнергии ненулевые, то объемы закупок электроэнергии меняются по закону x_ 1 = ax1 cx1x2 (a > 0; c > 0). С другой стороны, прибыль, получаемая поставщиками от продажи электроэнергии, стимулирует увеличение цены. Прибыль пропорциональна количеству проданного товара по его цене (x1x2). Поэтому имеем x_ 2 = bx2 + dx1x2 (b > 0; d > 0). Модель “цена-объемы покупок” построена.

Полученная модель достаточно точно описывает динамику цен и объемов закупок электроэнергии, которая позволяет предсказывать изменение конъюнктуры на рынке электроэнергии.

Обозначим за управление u неопределенные факторы, влияющие на объем покупок и наложим на x1 (объем закупок) и u квадратичные интегральные ограничения: x_ 1 = ax1 cx1x2 + u; a > 0; c > 0; Z t1 x_ 2 = bx1 + dx1x2; b > 0; d > 0; t0 x21(s) + u2(s) ds 6 2: (13) Результаты численного моделирования представлены на рис. 3 и 4. Благодарности

Выражаю благодарность своему научному руководителю Михаилу Ивановичу Гусеву за ценные советы при планировании исследования и рекомендации по оформлению статьи. (15) Рис. 3: Множество достижимости при t1 = =2 Рис. 4: Множество достижимости при t1 = Список литературы [1] B. T. Polyak. Сonvexity of the reachable set of nonlinear systems under L2 bounded controls. Dynamics of

Continuous, Discrete and Impulsive Systems, Series A: Mathematical Analysis, 11:255–267, 2004. [2] N. Huseyin, A. Huseyin. Compactness of the set of trajectories of the controllable system described by an affineintegral equation. Applied Mathematics and Computation, 219:8416–8424, 2013. [3] Kh. G. Guseinov, A. S. Nazlipinar. Attainable sets of the control system with limited resources. Tr. In-ta matematiki i mekhaniki UrO RAN, 16(5):261–268, 2010. [4] K. G. Guseinov, O. Ozer, E. Akyar, V. N. Ushakov. The approximation of reachable sets of control systems with integral constraint on controls. Nonlinear Differential Equations and Applications, 14(1-2):57–73, 2007. [5] M. I. Gusev, I. V. Zykov. On extremal properties of boundary points of attainability sets of controllable systems under integral constraints. Tr. In-ta matematiki i mekhaniki UrO RAN, 23(1):103-115, 2017 (in Russian). = М. И. Гусев, И. В. Зыков. Об экстремальных свойствах граничных точек множеств достижимости управляемых систем при интегральных ограничениях. Тр. Ин-та математики и механики УрО РАН, 23(1):103–115, 2017.

On the reachability problem integral constraints for a nonlinear control system with Igor V. Zykov Krasovskii Institute of Mathematics and Mechanics (Yekaterinburg, Russia) Keywords: controlled system, integral constraints, projection of the reachability set, maximum principle.

In this paper we consider linear control systems with integral constraints on a control and a trajectory. It is shown that the control that takes the system to the boundary of the projection of the reachability set on a given linear subspace is a solution of some optimal control problem with an integral functional and, consequently, satisfies the maximum principle.

[6]

Ya. N.

Roytenberg . Automatic control . Nauka , Moscow, 1971 (in Russian). = Я. Н. Ройтенберг. Автома- тическое управление. Наука , Москва, 1971 .

[7]

A. F.

Filippov. Differential equations with discontinuous right-hand side . Nauka , Moscow, 1985 (in Russian). = А. Ф. Филиппов . Дифференциальные уравнения с разрывной правой частью . Наука, Москва, 1985 .

[8]

A. D.

Ioffe . Metric regularity and subdifferential calculus . UMN , 55 ( 3 ): 103 - 162 , 2000 (in Russian). = А. Д. Иоффе . Метрическая регулярность и субдифференциальное исчисление . УМН , 55 ( 3 ): 103 - 162 , 2000 .

[9]

A. V.

Arutyunov ,

G. G.

Magaril-Il'yaev ,

V. M.

Tikhomirov . The Pontryagin maximum principle. Proof and applications . M.: Faktorial press, Moscow, 2006 (in Russian). = А. В. Арутюнов , Г. Г. Магарил-Ильяев, В . М. Тихомиров. Принцип максимума Понтрягина. Доказательство и приложения . Факториал пресс, Москва , 2006 .