О возможности рассмотрения торможения диска в форме антагонистической дифференциальной игры А.Е. Ламоткин С.И. Осипов Д.А. Прончатов alexeylamotkin@yandex.ru sergei.osipov@urfu.ru prodimka@outlook.com УрФУ (Екатеринбург) Аннотация В работе рассматривается процесс торможения диска с использова- нием модели сухого трения. В данной постановке абсолютно твер- дый диск рассматривается как простейшая модель колеса, тормо- жение которого осуществляется за счет момента, который имитиру- ет действие тормозной системы, реализующей алгоритм торможе- ния. Для нахождения оптимального алгоритма торможения авторы предлагают в данной работе рассмотреть процесс торможения в ви- де антагонистической дифференциальной игры, в которой первым игроком является тормозная система, управляющая тормозным мо- ментом, а вторым – поверхность дороги, которая может менять зна- чение коэффициента трения. Также рассматриваются возможные критерии качества. Введение При рассмотрении движения колесного транспортного средства (КТС) определенный интерес представ- ляет задача о его оптимальном торможении (с наименьшим тормозным путем, с наименьшими энергети- ческими затратами, с минимальным износом тормозной системы и т.д.) особую актуальность эта задача получила в последнее время ввиду распространения электромобилей и электронных тормозных систем. По- пытки разработки оптимального алгоритма торможения усложняются ввиду плохой прогнозируемости со- стояния дорожного покрытия, что не дает нам полной информации о состоянии системы. Для преодоления этой трудности авторы предлагают рассмотреть задачу торможения как антагонистическую дифференци- альную игру против поверхности дороги. В разделе 1 приводится механическая модель рассматриваемой системы, а в разделе 2 обсуждаются современные решения и их неоптимальность с учетом принятых моде- лей сухого трения, также дается постановка антагонистической дифференциальной игры и обсуждаются возможные критерии качества. 1 Постановка задачи торможения Рассмотрим процесс торможения КТС. Будем считать, что торможение осуществляется за счет незави- симых моментов, которые тормозная система прикладывает к колесам КТС (сама реализация тормозной системы нами никак не ограничивается). Для более детального изучения этого процесса рассмотрим задачу торможения отдельного колеса. Copyright c by the paper’s authors. Copying permitted for private and academic purposes. In: A.A. Makhnev, S.F. Pravdin (eds.): Proceedings of the International Youth School-conference «SoProMat-2017», Yekaterinburg, Russia, 06-Feb-2017, published at http://ceur-ws.org 57 В качестве модели колеса мы берем абсолютно твердый диск. Все силы, действующие на диск, изоб- ражены на рис. 1 в предположении, что диск катится слева направо без проскальзывания. Нормальная реакция N~ смещена по направлению движения, что приводит к возникновению момента сопротивления качению (коэффициент трения качения равен δ), m~g – сила тяжести диска, M – тормозящий момент, F~тр – сила сухого трения. Рис. 1: Система сил, действующих на диск Запишем теорему о движении центра масс в проекциях на оси координат: mV̇x = (Fтр )x , (1) N − mg = 0. (2) Здесь m – масса диска, Vx – проекция скорости центра масс диска на ось x, (Fтр )x – проекция силы трения на ось x. Запишем теперь теорему об изменении кинетического момента относительно центра масс в проекции на ось z (которая предполагается направленной перпендикулярно плоскости чертежа в сторону читателя): ~ ). J ω̇z = Mz + (Fтр )x R + MCz (N (3) Здесь J – момент инерции относительно оси Cz, R – радиус диска, ωz – проекция вектора угловой скорости на ось z, Mz – проекция вектора тормозящего момента на ось z, MCz (N̄ ) – момент нормальной реакции относительно оси Cz. Мы будем различать два типа сухого трения: трение сцепления, которое будет действовать на диск при качении без проскальзывания, и трение скольжения, действующее на диск при проскальзывании. При качении без проскальзывания сила трения подчиняется закону Fтр 6 f1 N , где f1 – коэффициент трения покоя, при этом её направление и точное значение зависит от тормозящего момента. При качении с проскальзыванием значение силы трения определяется по закону Fтр = f2 N , где f2 – коэффициент трения скольжения [1, 2]. Момент сопротивления качению подчиняется закону |MCz (N ~ )| 6 δN . При отсутствии угловой скорости точное значения трения качения зависит от значения тормозящего момента, а при качении достигается равенство [1]. 1. Качение без проскальзывания Vx = −ωz R. В данном случае MCz (N~ ) = − sgn(ωz )mgδ. Из (1) и условия кинематической связи следует (Fтр )x ω̇z = − . mR Подставив в (3), получим (Fтр )x −J = Mz + (Fтр )x R − sgn(ωz )mgδ, mR 58 Mz − sgn(ωz )mgδ (Fтр )x = − J , mR + R при этом Mz должно удовлетворять условию Mz − sgn(ωz )mgδ J 6 f1 mg. (4) mR + R Уравнения движения принимают вид   ω̇z = Mz −sgn(ωz2)mgδ J+mR (5)  V̇x = − Mz −sgn(ω J z )mgδ R +mR Если вместо (4) выполняется условие Mz − sgn(ωz )mgδ J > f1 mg, (6) mR + R то (Fтр )x = − sgn(Mz )f1 mg и уравнения движения имеют вид   ω̇ = Mz −sgn(Mz )f1 mgR−sgn(ωz )mgδ z J (7)  V̇ = − sgn(M )f g x z 1 2. Скольжение заблокированного колеса ωz = 0. Значение силы трения скольжения (Fтр )x = − sgn(Vx )f2 mg. Точное значение сопротивления качения определяется из уравнения Mz − sgn(Vx )f2 mgR + MCz (N ~ ) = 0, таким образом ~ ) = sgn(Vx )f2 mgR − Mz , MCz (N при этом должно выполняться условие |sgn(Vx )f2 mgR − Mz | 6 δmg, (8) тогда уравнения движения имеют вид  ωz = 0 (9) V̇x = − sgn(Vx )f2 g Если выполняется условие |sgn(Vx )f2 mgR − Mz | > δmg, (10) то сопротивление качения имеет максимальное значение MCz (N ~ ) = − sgn(Mz )δmg, уравнения движения примут вид   ω̇ = Mz −sgn(Vx )f2 mgR−sgn(Mz )δmg z J (11)  V̇ = − sgn(V )f g x x 2 3. Общий случай ωz 6= 0, Vx 6= −ωz R. В этом случае (Fтр )x = − sgn(Vx + ωz R)f2 mg, MCz (N ~ ) = − sgn(ωz )δmg, здесь (Vx + ωz R) – проекция скорости точки касания на ось x. Уравнения движения примут вид   ω̇ = Mz −sgn(Vx +ωz R)f2 mgR−sgn(ωz )δmg z J (12)  V̇ = − sgn(V + ω R)f g x x z 2 59 Рассмотрим фазовую плоскость переменных ωz и Vx (рис. 2). Процесс торможения диска может быть интерпретирован как движение точки в фазовой плоскости из любого положения в начало координат, со- гласно уравнениям, приведенным выше. На фазовой плоскости имеются две специальные области. Первая область отвечает случаю движения без проскальзывания (Vx = −ωz R), при выполнении условия (4) дви- жение остается в этой области и определяется уравнениями (5), если выполнено (6), то движение уходит из этой области и подчиняется уравнениям (7). Вторая область отвечает скольжению заблокированного колеса (ωz = 0), если выполняются условия (8), то движение остается в этой области и задается уравне- ниями (9), в противном случае, при выполнении условия (10), движение уйдет из этой области согласно уравнениям (11). Если точка не находится в данных областях, то её движение подчиняется уравнениям (12). Рис. 2: Фазовая плоскость переменных ωz и Vx 2 Постановка антагонистической дифференциальной игры Рассматривая величину Mz как управляемый параметр, мы можем поставить задачу управления о на- хождении оптимального алгоритма торможения (например с наименьшим тормозным путём). Если обра- титься к приведенным выше уравнениям движения, становится понятно, что величина момента непосред- ственно влияет на изменение угловой скорости, изменение же скорости центра масс диска определяется величиной силы сухого трения, которая опосредовано зависит от величины тормозящего момента. Рассмот- рим некоторые простейшие варианты таких зависимостей [1, 2]. На рис. 3 приведена модель сухого трения, в которой предполагается f1 = f2 ; на рис. 4 представлена уточненная модель, в которой предполагается f1 > f2 . Рис. 3: Модель сухого трения (f1 = f2 ) Предположим, что нас интересует задача о наименьшем тормозном пути. Если рассмотреть её в рам- ках первой модели трения, то довольно очевидным является, что оптимальный момент для торможения 60 Рис. 4: Модель сухого трения (f1 > f2 ) имеет максимальное значение. Диск при этом, скорее всего, перейдет в режим проскальзывания. Одна- ко, на практике установлено, что тормозной путь при торможении без проскальзывания будет короче, что объясняется второй моделью трения, из которой видно, что значение трения скольжения меньше, чем мак- симальное значение трения сцепления. Поэтому наиболее эффективным в этом случае будет приложить такой момент, чтобы добиться максимально возможной силы трения сцепления, не переходя при этом в режим проскальзывания. Отметим, что при торможении диска проскальзывание возникает из-за слишком быстрого снижения угловой скорости диска по сравнению со снижением скорости центра масс (на фазовой плоскости это область выше прямой Vx = −ωz R), при этом существует угроза блокировки диска, которая может существенно снизить управляемость транспортным средством. Для предотвращения блокировки на практике зачастую используется система АБС (антиблокировочная система) [3], работа которой за- ключается в отслеживании значения угловой скорости и снятии тормозного усилия в случае возможной блокировки диска. Кроме этого, существует класс тормозных систем, не оборудованных системой АБС. Некоторые модели таких систем описаны в работе [4]. Приведем одну из них:   M0 tn , t ∈ [0; t0 ]; M= M0 tn0 , t ∈ [t0 , tω ]; (13) N Rf2 , t ∈ [tω , tv ].  Здесь M0 , n – конструкционные параметры механизма, t0 – момент времени, когда тормозящий момент достигает наибольшего значения Mmax = 1,1f1∗ N R (f1∗ – коэффициент трения сцепления для поверхности сухого асфальта, т.е. максимальный тормозящий момент не более чем на 10 процентов превосходит мак- симальный момент силы трения сцепления на поверхности сухого асфальта), tω – момент времени, когда угловая скорость становится равной нулю, tv – момент времени, когда скорость центра диска становится равной нулю. Такая модель тормозной системы позволяет избежать блокировки колеса, либо блокировка наступает на позднем этапе торможения, что уже не так критично. Таким образом, модель (13) и системы с АБС не препятствуют движению в режиме проскальзывания, поэтому не могут быть оптимальными в рамках поставленной задачи управления. Однако, оптимальный алгоритм в условиях реальной эксплуатации вполне может оказаться хуже, чем, например, представленный выше алгоритм (13). Основная причина этого состоит в том, что он будет за- висеть от величин f1 и f2 , которые могут быть различны для разных участков дороги (причиной может быть различное дорожное покрытие, лужа на дороге и пр.). Для того чтобы получить более универсальное решение, можно рассмотреть задачу об оптимальном торможении как задачу об управлении с неполной информацией. Один из подходов к решению такого рода задач – это представление их в виде дифферен- циальных антагонистических игр [6]. 1. Игроки и их управления В предлагамой игре первым игроком является система торможения, которая управляет тормозящим моментом Mz , значение которого ограничено некоторой величиной M ∗ : |Mz | 6 M ∗ . 61 Вторым игроком является поверхность дороги, которая управляет величинами f1 и f2 , которые также ограничены некоторыми величинами a и b: 0 < a 6 f2 < f1 6 b < 1. Задача игроков состоит в том, чтобы перевести систему из начального положения (ω0 , V0 ) в точку (0, 0), при этом первый игрок стремится минимизировать критерий качества, а второй его максимизирует. 2. Критерий качества Рассмотрим некоторые критерии качества, которые, на наш взгляд, представляют интерес для изучения. В критерии отражается наше желание потребовать минимальность тормозного пути при минимальных энергозатратах [5], при этом вклады каждой из этих величин можно суммировать с некоторым весом, тогда будем иметь ZT ZT I = α |Vx (t)|dt + β |Mz (t)|dt, (14) 0 0 где T – момент остановки, α, β – некоторые положительные постоянные. Также представляет интерес критерий, в котором оценивается эффективность энергозатрат ZT ZT Mz I=α |Vx (t)|dt + β dt. (15) Fтр R 0 0 Второе слагаемое этого критерия показывает, что первый игрок пытается достичь наибольшего значения силы трения при наименьшем значении тормозящего момента. Считая дорогу антагонистом, мы делаем существенное предположение о её поведении, которое, строго говоря, ей не свойственно. Однако, антагонистическая постановка задачи позволяет оценить гарантиро- ванный результат в наихудшем случае. Решение данной задачи может помочь в оптимизации современных систем торможения и послужит основой дальнейшим исследованиям оптимальных алгоритмов торможе- ния. Список литературы [1] P. Appell. Traité de mécanique rationnelle – Vol.1. Fizmatlit, Moscow, 1960 (in Russian). = П. Аппель. Теоретическая механика – Т.1. Физматлит, Москва, 1960. [2] J. H. Jellett. A treatise on the theory of friction. RCD, Moscow-Izhevsk, 2009 (in Russian). = Д.Х. Джеллетт. Трактат по теории трения. РХД, Москва-Ижевск, 2010. [3] V. N. Kravec, R. A. Musarskij, A. V. Motrenko. Modeling of the anti-locking system of a vehicle. Izvestija vuzov. Mashinostroenie, (2):31-34, 2011 (in Russian). = В.Н. Кравец, Р.А. Мусарский, А.В. Мотренко. Моделирование работы антиблокировочной системы легкового автомобиля. Известия вузов. Машино- строение, (2):31-34, 2011. [4] V. M. Zotov, T. V. Shtel’mah, T. N. Zotova, A. P. Fedin. Mathematical model of the brake system of the wheel of the vehicle not containing anti-locking mechanisms. Izv. VolgGTU, 2(8):39-42, 2007 (in Russian). = В.М. Зотов, Т.В. Штельмах, Т.Н. Зотова, А.П. Федин. Математическая модель тормозной системы колеса автомобиля, не содержащего антиблокировочные механизмы. Изв. ВолгГТУ, 2(8):39-42, 2007. [5] N. N. Krasovskii. Theory of motion control (linear systems). Nauka, Moscow, 1968 (in Russian). = Н.Н. Красовский. Теория управления движением (линейные системы). Наука, Москва, 1968. [6] N. N. Krasovskii, A. I. Subbotin. Position differential games. Nauka, Moscow, 1974 (in Russian). = Н.Н. Красовский, А.И. Субботин. Позиционные дифференциальные игры. Наука, Москва, 1974. 62 On the possibility of considering the braking of a disk in the form of an antagonistic differential game Alexey E. Lamotkin, Sergey I. Osipov, Dmitriy A. Pronchatov Ural Federal University (Yekaterinburg, Russia) Keywords: antagonistic differential game, disk braking, optimal control. The paper discusses the process of disk braking, using model of dry friction. In this setting, absolutely-solid the disk is considered as the simplest model of a wheel, the braking of which is carried out at the expense of the moment, which imitates the action a braking system that implements the braking algorithm. To find the optimal braking algorithm, the authors suggest in this paper to consider the braking process in the form of an antagonistic differential game in which the first player is the braking system controlling the braking torque, and the second is the surface of the road that can change the value of the coefficient of friction. Also possible quality criteria are considered. 63