Математическая кибернетика и системный анализ
Развитие идей Глушкова
Научная деятельность

 

Развитие теории автоматического управления в Институте кибернетики имени В.М.Глушкова и институтах Кибцентра НАН Украины

Введение
Работы в области теории и практики систем управления в Украине до начала 60-х годов
Cередина 70-х годов: проблема синтеза систем управления линейными и нелинейными объектами - одна из центральных проблем теории управления
Робастные системы
Нейросетевые системы
Задачи группового преследования
Управление с неполной информацией
Проблемы управления летательными и космическими аппартами
Литература

Введение

Юбилейная дата рождения академика В.М.Глушкова (1923 г.) - основателя Института кибернетики НАН Украины, носящего ныне его имя, хороший повод, чтобы, оглянувшись на несколько десятилетий назад, ко временам его создания, попытаться подвести итоги развития института в различных областях кибернетики. Принимая во внимание, что кибернетика по своему определению есть наука об управлении, то последней отведена одна из ключевых ролей. Поэтому настоящий обзор посвящен подведению итогов развития теории управления в Институте кибернетики и в институтах Кибцентра НАН Украины. Как известно, в начале 90-х годов, а затем и в середине этих годов на базе института кибернетики было создано несколько институтов, объединенных в рамках Кибцентра НАН Украины. Поэтому в нашем обзоре будут отмечены и работы сотрудников всех институтов Кибцентра, посвященные рассматриваемой тематике.

Работы обзорного характера неизбежно несут на себе в той или иной мере отпечаток субъективизма и авторы настоящего обзора в полной мере отдают себе отчет в том, что и он не свободен от этого недостатка. Поэтому мы приносим свои извинения авторам тех работ, которые в силу тех или иных причин не попали в наше поле зрения.

Далее следует сделать еще одно замечание. Несколько лет тому назад была опубликована фундаментальная работа обзорного характера [1], охватывающая широкий круг проблем становления и развития информатики в Украине. Настоящий обзор, посвященный более узкой предметной области и ограниченный более жесткими "географическими" рамками, включает в себя ряд публикаций последних лет и поэтому может служить дополнением к упомянутой работе.

Работы в области теории и практики систем управления в Украине до начала 60-х годов

Еще до начала 60-х годов, т.е. до основания Института кибернетики, в Украине уже достаточно интенсивно велись работы в области теории и практики систем управления. Наиболее активными центрами выполнения этих работ были Институты Академии наук Украины: электротехники, математики, горного дела, где усилиями С.А.Лебедева, А.Ю.Ишлинского, А.Г.Ивахненко, А.Н.Кухтенко, В.Н.Иносова, Л.В.Цукерника, О.М.Костюка, О.М.Крыжановского и др. был выполнен ряд важных теоретических и практических работ по созданию систем управления.

Конец 60-х годов был отмечен особо бурным развитием теории управления во всем мире и в институтах НАН Украины, в частности. Наряду с серьезными работами в области исследования традиционно наиболее часто рассматриваемых линейных систем с сосредоточенными параметрами был выполнен также анализ систем управления объектами с распределенными параметрами и широких классов нелинейных систем - как непрерывных, так и дискретных. При этом для линейных систем центр тяжести исследований сместился в сторону решения проблем синтеза.

Широкое распространение элементов и средств автоматики и вычислительной техники, функционирование которых носит импульсный (дискретный) характер, послужило стимулом к разработке методов математического описания и исследованию нелинейных импульсных систем управления с частотной и частотно-широтной импульсной модуляцией [2]. Эта монография на несколько лет опередила появление на Западе первой работы подобного рода, и хотя с момента выхода ее в свет прошло уже около 30 лет, она все еще не утратила своего значения. Большое внимание уделялось исследованию нелинейных разностных уравнений, описывающих динамику таких систем, анализу периодических процессов, применению метода функций Ляпунова для получения условий асимптотической устойчивости и диссипативности.

Проблема синтеза систем управления линейными и нелинейными объектами

В середине 70-х годов проблема синтеза систем управления линейными и нелинейными объектами стала одной из центральных проблем теории управления. При этом, как это часто бывает, при решении научных задач, выяснилось, что проблемы анализа и синтеза тесно связаны между собой. Решение задач синтеза было получено при использовании аппарата функций Ляпунова и их дискретных аналогов [3, 4]. Были решены задачи синтеза асимптотически устойчивых систем управления для достаточно широкого класса линейных и нелинейных объектов управления при различного рода ограничениях на управление. Рассматривалось также решение задачи, для которой синтезированное управление должно не только обеспечить асимптотическую устойчивость (или диссипативность) системы, но и минимизировать при этом некоторую функцию удельных расходов. Была решена обобщенная задача синтеза, для которой синтезированное управление должно минимизировать некоторый функционале качества; доказаны общие теоремы о свойствах оптимального управления, базирующихся на использовании аппарата функций Ляпунова. Для нелинейных объектов при функционале качества общего вида доказана теорема об оптимальности в нелинейной системе линейного алгоритма управления системой "линейно-квадратического приближения" при малых отклонениях.

В [5] решена задача Летова о построении множества допустимых нелинейных регуляторов для многомерных динамических систем. Получены аналитические выражения для коэффициентов обратной связи регулятора, содержащие параметры настройки. За счет выбора этих параметров в широких пределеах регулируется качество переходных процессов, не нарушая асимптотической устойчивости замкнутой системы. В частности. Можно придавать системе свойства оптимальности в смысле Летова-Калмана, В.И.Зубова, А.А.Красовского. Показана принципиальная возможность распространения полученных результатов на дискретные системы.

В 70-х и первой половине 80-х годов возрос интерес исследователей к решению проблем векторной оптимизации применительно к задачам синтеза систем автоматического управления с учетом противоречивости предъявляемых к ним требований. Результаты этих исследований изложены в работах [6]-[7].

Проблемам принятия решений в эргатических системах управления, в том числе с учетом конфликтных ситуаций, посвящены исследования [8-9]. Развитые там методы нашли применение и для класса логико-динамических систем.

Важные результаты в теоретическом и прикладном аспектах были получены при решении задач практической устойчивости и стабилизации движения динамических систем [10]. Используя эти результаты, разработана структура минимаксных регуляторов и фильтров Калмана, а также математические средства оптимального проектирования ускоряющих и фокусирующих систем заряженных элементарных частиц [12].

Классические методы управления, описанные в монографии [11] где в конструктивной, удобной для пользователя форме были использованы для получения законов управления в линейных системах при минимизации норм функции управления в соответствии с решением L-проблемы моментов.

В [13], [14] рассмотрены теоретические основы синтеза систем управления движущимися объектами с информационным блоком в виде высокоточного и перспективного навигационного устройства - бесплатформенной инерциальной навигационной системы. В этой работе предложен метод синтеза алгоритмов управления при ограничениях на управляющие параметры при условии, когда их число не превышает числа ступеней свободы объекта как твердого тела. Изложен метод построения алгоритмов нахождения параметров движения объекта по данным чувствительных элементов навигационной системы и были рассмотрены возможности коррекции бесплатформенной инерциальной навигационной системы как в общем случае, так и с использованием конкретных источников посторонней информации, в том числе спутниковой радионавигационной системы.

В работах [15], [16] решена важная как для теории управления, так и для других научных направлений проблема возмущения псевдоинверсных и проекционных матриц. На основе полученных теоретических результатов сформулированы принципы оптимального синтеза структур линейных систем управления и развиты средства построения адаптивных регуляторов при условии ограниченного времени использования информации о поведении системы.

Актуальным направлением является теория принятия решений, связанных с управлением динамическими системами. В работе [17] были изучены статистические закономерности случайных (в широком понимании) явлений: доказаны теории существования статистических закономерностей, а также теоремы о связи между такими закономерностями и критериями выбора решений, изучена мера неопределенности случайных явлений. В частности, в этой работе доказана теорема об однозначной зависимости в бейесовских задачах.

Важной является задача установления конструктивных связей между общими математическими теориями и математическими проблемами теории управления. В этом направлении перспективной оказалось применение теории дифференцируемых многообразий и расслоений, непрерывных групп и алгебр, внешних дифференциальных форм к изучению динамических управляемых систем. В результате получен ряд качественных результатов, являющихся значительным вкладом в дифференциально-геометрическую теорию управления и абстрактную теорию систем [18]-[19].

Конечно-разностный метод приближенного решения задач оптимального управления изложен в монографии [20]. Дальнейшее развитие этот метод нашел в применении к стохастическим, недифференцируемым и целочисленным задачам управления. Получены результаты по численной реализации стратегий Белмана, методов последовательного анализа вариантов и стохастического градиента, принципа максимума Понтрягина.
Одной из наиболее сложных в теории управления является проблема управления системами с распределенными параметрами. Был выполнен большой цикл теоретических и экспериментальных работ, связанных с обеспечением равновесия тороидальной плазмы в термоядерных установках токамак с помощью автоматически управляемого поперечного магнитного поля, создаваемого специальными управляемыми обмотками. Эти результаты существенно повлияли на развитие программы термоядерных исследований на токамаках, обеспечив возможность удержания в равновесии тороидальной плазмы.

Процессы управления в современных токамаках со сложной магнитной конфигурацией в отличие от предшествующего поколения токамаков с магнитными поверхностями близкими к круговым характеризуются многосвязностью и существенной неопределенностью, обусловленной использованием незамкнутых моделей, описывающих эти процессы. Применительно к этому классу динамических систем с быстропротекающими процессами были разработаны оригинальные подходы и методы автоматического регулирования [21]-[22]. Эти исследования и разработки нашли свое применение при создании цифровых систем управления плазмой[23].

Важные результаты были получены по восстановлению необходимых для управления параметров плазмы по данным магнитных измерений [24]-[26]. Устойчивые решения этих задач удалось найти благодаря использованию методов регуляризации.

Исследования по теории управления высокотемпературной плазмой стимулировали развитие общих принципов и методов управления быстро протекающими процессами в сплошных средах. Были разработаны базовые принципы построения систем управления, соответствующие разным уровням иерархии пространственно-временных масштабов плазменных процессов. Продуктивным оказался импедансный подход к анализу и синтезу систем управления. В его основу положено представление об операторе распределенного управляемого прибора как о некотором импедансном операторном соотношении, которое связывает электрическую и магнитную составляющие электромагнитного поля на некоторой поверхности, распределяющей объект и регулятор [22].

Изучению сложных динамических объектов посвящена монография [27], в которой рассматривались задачи моделирования процессов, устойчивости и построения систем автоматического управления объектами, описываемыми моделями химической кинетики и математической физики. Были созданы системы автоматической стабилизации температуры дуги плазмотрона, температуры термоядерного горения в реакторе токамак, проведены исследования разных типов неустойчивости в низко и высокотемпературной плазме, в редких металлах, в течениях жидкостей при больших числах Рейнольдса.

Возникновение новых технологий, основанных на использовании новых физических принципов, стимулировало и развитие новых методов и средств автоматического управления объектами с распределенными параметрами, что привело в конечном счете к формированию нового научного направления "Управление в физических системах". В рамках этого направления были разработаны методы синтеза распределенных регуляторов в виде композитных квазиконтинуальных искусственных регулирующих сред с внутренними источниками энергии. В основу их построения был положен принцип управления элементарными процессами в параметрически активизированных нелинейных электротехнических материалах. Такой подход обеспечивает высокую пространственно-временную разрешающую способность управляющих сред, перестраиваемость их характеристик, возможность распределенного усиления и операторного преобразования сигналов [27]-[29].

Разработанные активные управляющие среды были использованы в задачах подавления быстропротекающих неустойчивостей в плотных потоках заряженных частиц, для перестройки частоты лазера и резонатора, для построения экранов-покрытий с регулируемым коэффициентом отражения электромагнитных волн, а также в ряде других задач управления электрофизическими объектами [30].

В [31] был предложен новый подход к проблеме управления нелинейными системами с распределенными параметрами и создан функционально-топологический метод многозначных максимально допустимых отображений, который обобщает известный метод допустимых пар Ж.Л. Лионса. С его помощью достигнут значительный прогрес в теории управления объектами, которые описываются нелинейными операторными и дифференциально-операторными уравнениями, вариационными неравенствами и эволюционными включениями с ограничениями на управляемые и фазовые переменные. Получены условия разрешимости задач оптимального управления, обосновано необходимые условия оптимальности в форме вариационных неравенств и разработаны конструктивные методы регуляризации и аппроксимации [32].

В последние годы возрос интерес исследователей к анализу возможностей использования квантовомеханических систем для решения широкого спектра проблем, в том числе и проблем управления. В этой связи безусловный интерес представляют результаты, изложенные в [34]-[35], а также их дальнейшее развитие (см. [36]-[39]).

Исходя из анализа физических постановок формализованы задачи управления квантовыми системами и с помощью метода усреднения обоснованы их билинейные модели, указаны границы параметров, гарантирующие их адекватность [38]. На той же основе получена классификация линейно-параметрических каналов управления, установлен их квадратурный характер и бинарная природа. Для нелинейных систем управления, заданных оператором коприсоединенного представления вещественных групп Ли, доказана их гамильтоновость [39].

Проанализированы принципы построения квантовых сетей из квантовых элементов (многополюсников), получены формулы пересчета их характеристик (матриц рассеяния) для всех схемотехнических операций [37]. Рассмотрены задачи реализации: развиты эффективные геометрические методы синтеза квантовых двухполюсников [36].

Робастные системы

В конце 80-х среди специалистов по теории управления и разработчиков реальных систем управления возросло понимание того фундаментального обстоятельства, что поскольку после изучения практически любого реального объекта управления (идентификации его параметров) остается неизбежной некоторая "остаточная" неопределенность относительно его параметров (порождаемая хотя бы ограниченностью времени проведения экспериментов), то это, в сущности, означает, что вместо управления одним фиксированным объектом приходится иметь дело с некоторым классом объектов [40]. Следовательно, при исследовании устойчивости соответствующей замкнутой системы необходимо анализировать устойчивость некоторого класса динамических систем, т.е. проводить анализ робастной устойчивости. Этим вопросам были посвящени работы [41]- [43].

Существенный вклад был сделан в решение актуальной задачи современной теории управления - анализа и синтеза систем управления в условиях нестохастической неопределенности, когда параметры объекта управления неизвестны, а для них заданы лишь некоторые множественные оценки; аналогичные предположения принимаются и относительно внешних неконтролируемых возмущений. Для решения задач анализа и синтеза в условиях так оговоренной неопределенности был предложен и получил дальнейшее развитие метод получения гарантированных оценок параметров в виде многогранников [44], [45], [46]. В последствии для решения задач множественной идентификации в классе многогранников был разработан специальный "Tool-box" в составе широко используемого в настоящее время пакета "Matlab"[47], [48].

Наряду с этим был выполнен и большой цикл работ по дальнейшему совершенствованию метода оценивания фазового состояния и параметров объекта, базирующийся на построении последовательности аппроксимирующих эллипсоидов [49]-[52]. С помощью этого метода получены конструктивные и экономные с вычислительной точки зрения алгоритмы решения задач управления объектами с неконтролируемыми внешними возмущениями и помехами в каналах измерения. Однако эти алгоритмы, как и алгоритмы оптимальной калмановской фильтрации, являются критичными к нарушению априорных предположений о свойствах внешней среды и самих объектов управления, используемых в этих алгоритмах. При отличии свойств реальных объектов управления от свойств их математических моделей, используемых в существующих алгоритмах оценивания, основанных на методе эллипсоидов, последние теряют свою работоспособность. Указанный недостаток алгоритмов гарантированного эллипсоидального оценивания был устранен в работах [53], [54]. В этих работах был предложен ряд алгоритмов гарантированного эллипсоидального оценивания, обладающих свойством нечувствительности (робастности или грубости в смысле А.А.Андронова - Л.С.Понтрягина) к нарушению указанных предположений и делающих их работоспособными в реальных условиях. С помощью метода функций Ляпунова доказана сходимость предложенных робастных алгоритмов эллипсоидальных наблюдателей состояния.
В [55], [56] рассмотрен достаточно общий подход к проблеме множественного оценивания и была установлена тесная связь процедуры теоретико-множестенного оценивания с динамическим программированием. В частном случае это приводит к алгоритмам, близким к методу наименьших квадратов.

Были исследованы свойства регуляризированных решений, получаемых при идентификации модели дискретных систем с импульсным передаточным оператором, представляемым в виде разложения в бесконечный ряд по степеням оператора сдвига [57], [58].

В дальнейшем подход, основанный на регуляризации, был распространен на задачи идентификации динамических систем оценки текущего состояния при неполном наблюдении объекта и наличии ограниченных возмущений в измерениях [59], [60].

В [61] были разработаны оригинальные методы минимаксного оценивания. Идея состояла в том, что минимаксные оценки, будучи по своей природе грубыми со стохастической точки зрения, тем не менее имеют ряд привлекательных свойств и, в частности, могут быть асимптотически точными. Идея оказалась правильной, и свойства состоятельности минимаксных оценок были впоследствии обоснованы для достаточно широкого класса систем при естественных предположениях.

Между процедурами стохастической и множественной идентификации имеется качественное отличие, заключающееся в том, что конечным результатом применения первой является получение оценки в виде вектора, а второй - оценки в виде замкнутого ограниченного множества в том же векторном пространстве. Несмотря на то, что уже существует обширная научная литература, посвященная проблеме параметрической идентификации при ограниченных шумах, вопрос о выборе критериев оценки качества множественной идентификации все еще остается открытым.

Скалярный критерий качества множественной оценки можно выбирать либо исходя из чисто геометрических соображений, либо исходя из конкретных целей управления, для достижения которых и осуществляется идентификация. На основе именно этих соображений в [62] был предложен критерий качества проблемно-ориентированной (control-oriented) множественной идентификации и процедура активной идентификации, минимизирующая критерий.

Широко распространенный дедуктивный подход к решению задач идентификации и управления требует большого объема априорной информации об исследуемой модели. Значительно меньше априорной информации необходимо для индуктивного подхода, при котором оптимальная модель определяется как результат сравнения большого числа моделей-кандидатов по внешнему критерию. В работах [63]-[65] был предложен индуктивный метод моделирования и прогноза случайных процессов, получивший название метода группового учета аргументов (МГУА), который впоследствии нашел широкое применение и был развит в дальнейшем в [66]-[69].
МГУА обладает определенным разнообразием возможностей на всех этапах процесса моделирования по сравнению с другими методами построения моделей. Это касается прежде всего генераторов моделей и применяемых критериев качества структур, а также классов моделей (базисных функций). Этот метод отличается активным применением принципов автоматической генерации вариантов, последовательной селекции моделей и внешних критериев для построения моделей оптимальной сложности. Он имеет оригинальную многорядовую процедуру автоматической генерации структур моделей, имитирующую процесс биологической селекции с попарным учетом последовательных признаков. Такая процедура в современной терминологии называется полиномиальной нейронной сетью, причем ее структура является явной и строится автоматически.

Для сравнения и выбора лучших моделей применяются внешние критерии, основанные на разделении выборки на две и более частей, причем оценивание параметров и проверка качества моделей выполняется на разных подвыборках. Эта позволяет обойтись без обременительных априорных предложений, поскольку разделение выборки позволяет неявно (автоматически) учесть различные виды априорной неопределенности при построении моделей. МГУА обладает преимуществом при малых выборках данных за счет выбора сложностей модели, оптимально учитывающей информативность данных.

Теоретические аспекты МГУА рассмотрены в [70] и на основе аналогии между задачей построения модели по зашумленным экспериментальным данным и задачей прохождения сигнала через канал с шумом построены элементы теории помехоустойчивого моделирования. Основной результат этой теории состоит в том, что сложность оптимальной прогнозирующей модели зависит от уровня неопределенности в данных: чем он выше - тем проще (грубее) должна быть оптимальная модель. Средствами этой теории установлено, что МГУА является методом построения моделей с минимальной дисперсией ошибки прогнозирования.

Таким образом, МГУА является современной информационной технологией, которую следует отнести, с одной стороны, к интеллектуальным средствам анализа данных ввиду автоматического решения сложных задач построения моделей, а с другой - к средствам мягких вычислений ввиду применения элементов генетических методов и нейроподобных структур.

В конце 80-х и в 90-х годах был выполнен большой цикл работ по разработке теории адаптивных и робастных систем управления, функционирующих в условиях нестохастической неопределенности. При этом задачи синтеза оптимальных, квазиоптимальных и робастно-оптимальных систем были решены как для объектов управления, описываемых как в терминах диференциальных, так и разностных уравнений [71], [72], [73], [74]-[75].

Нейросетевые системы

В течение последних 10-15 лет существенно возрос интерес исследователей к исследованию возможностей использования нейросетевых систем для решения широкого спектра задач идентификации и управления. В русле этого научного направления в [76] были предложены нейросетевые модели нелинейных объектов управления и разработан метода идентификации таких моделей управления, который сводится к неитеративному обучению нейронной сети (настройке весовых коэффициентов связей). Метод основан на применении нечетких эллипсоидальных оценок обобщенного вектора параметров (весовых коэффициентов связей) нейросетевой модели [77].

Преимуществом предложенного метода является возможность рекурсивного получения текущих оценок при неполной или неточной априорной информации, а также "дообучения" нейронной сети при поступлении дополнительной информации.

Эффективность предложенного метода была подтверждена его успешным применением для решения прикладных задач, в частности, для распознавания отраженных ультразвуковых сигналов и снимков звездной камеры [78].

Существенные результаты были получены при изучении поведения линейных дискретных (стационарных и нестационарных) и некоторых классов нелинейных систем управления при наличии ограниченных возмущений, для которых заданы лишь их множественные оценки [79]- [81]. Для этого класса систем были получены точные выражения, определяющие их минимальные инвариантные множества, т.е. получено точное решение обобщенной задачи Б.А. Булгакова о "накоплении" возмущений. Доказанные в этих работах теоремы позволили получить ряд нетривиальных результатов о минимальных инвариантных множествах для систем с ограниченной нелинейностью, для систем с мультипликативными и аддитивными возмущениями, для релейных систем. Позже в [82] понятие минимального инвариантного множества было обобщено на некоторый класс динамических систем и была дана конструктивно вычисляемая оценка сверху радиуса минимального инвариантного множества класса динамических систем, выделяемого системой неравенств.

Большой цикл работ по теории динамических игр был выполнен сотрудниками Кибцентра НАН Украины. В этой области, развивая идеи метода альтернативного интеграла Л.С.Понтрягина Б.Н. Пшеничным (фото) в [83] был развит метод полугрупповых операторов или стратегий. Многими его учениками эта методика была распространена на различные классы динамических игр, были развиты численные процедуры для построения множеств предпочтения игроков, в том числе были решены некоторые классы игр с фазовыми ограничениями, с фиксированным и нефиксированным временем.

Было замечено, что в случае простых движений и выпуклых параметров игры [85] уже исходный оператор обладает полугрупповым свойством и, используя выпуклость множеств, его можно описать с помощью опорных функций на языке линейных неравенств. В совместной работе [84] были изучены линейные игры с фиксированным временем, где полугрупповое свойство обеспечивает условие выпуклости разности некоторых двух опорных функций множеств. Последнее эквивалентно свойству полного выметания для этих множеств. Операторная конструкция развивалась в направлении получения оценок операторов, изучения их свойств при условии выпуклости. Аналогичные конструкции попятных процедур при условии дискриминации преследователя для непрерывных и дискретных систем были построены позднее (см. [86]). Следует также отметить, что время окончания игры, согласно конструкции полугрупповых операторов тесно связано с максиминным временем, введенным Д.Л. Келенджеридзе.

Большой популярностью пользуется до сих пор метод, связанный со временем первого поглощения [87]. Исходная идея, правило экстремального прицеливания, принадлежит Н.Н. Красовскому [88], а реализация - Б.Н. Пшеничному [87]. В целом же это обобщение принципа максимума Понтрягина. В работе [87] изложен так называемый регулярный случай, где требуется единственность как в условии максимума по управлению, так и в условии минимума по нормали к касательной гиперплоскости в точке экстремального прицеливания. Впоследствии было замечено, что от первого условия можно отказаться (единственность максимума), переходя к решению соответствующего дифференциального включения в предположении полунепрерывности сверху и выпуклозначности маргинального отображения.

Правило экстремального прицеливания обосновывает, в частности, позиционный закон преследования по погонной кривой или кривой Эйлера. Теоремы о достаточных условиях окончания игры за время первого поглощения носили свое развитие и в других задачах. Так в работе [89] были исследованы игровые задачи с интегральными ограничениями на управления, в работе [90] рассмотрен случай запаздывания информации о состоянии, в работе [91] правило экстремального прицеливания было обобщено на случай группы преследователей и одного убегающего, были даны условия полной конфликтной управляемости, а в последнее время методика была применена к изучению интегральных и интегро-дифференциальных игр [92].

В работе [93] было получено решение проблемы синтеза управления для игровой задачи сближения в условиях помех измерения вектора состояния, свойства которых зависят от фазовых координат управляемых систем. Впоследствии [94, 95] были получены конструктивные результаты по определению условий, при которых преследователь за конечное число шагов из заданного начального состояния может сблизиться с убегающим на расстояние, не превышающее диаметра минимального инвариантного множества редуцированной системы.

Большой цикл работ посвящен решению задачи уклонения от встречи Понтрягина-Мищенко (обзор см. в [96]). Задача была решена авторами в линейном случае. Ее особенность состоит в том, что нужно найти условия на параметры конфликтно управляемого процесса, при которых возможно уклонение траектории от встречи с терминальным множеством из любых начальных положений на всем полубесконечном интервале времени.

В ряде работ, как указано в обзоре [96], были разработаны методы уклонения по направлению, переменных направлений инвариантных подпространств. В том числе исследованы нелинейные системы. Полученная в этом случае формула для представления решения в виде аналога формулы Тейлора, положила, по существу, начало развитию нелинейной теории убегания. Интенсивное развитие теории убегания привело к появлению множества тонких качественных результатов. Так были выделены грубый и тонкий случаи, условия вращаемости, получены условия высших порядков.

Задачи группового преследования

В 1974 году была сформулирована задача об убегании от группы преследователей [86, 96], примечательная тем, что терминальное множество в этом случае не является выпуклым, и даны достаточные условия ее разрешимости. Впоследствии была исследована проблема взаимодействия группировок управляемых объектов. Так, в частности, была высказана гипотеза о том, что в случае простых движений при двух преследователях и двух убегающих (области управления - единичные шары), хотя бы один из убегающих всегда убежит (избежит точной поимки). Гипотеза уже доказана (см. [86]).

Так случилось, что конструкции, применяемые в теории убегания, послужили базой для создания нового метода в теории преследования. Оказался справедливым следующий простой результат [85, 33]: для группы преследующих и убегающего с равными максимальными скоростями поимка убегающего возможна тогда и только тогда, когда начальное положение убегающего принадлежит внутренности выпуклой оболочки, натянутой на начальные состояния преследователей. В этом простом по форме результате неявно содержалось обоснование классического правила параллельного сближения, хорошо известного из инженерной практики.

Впоследствии для существенно более общих ситуаций был разработан метод разрешающих функций [97, 98] на основе введения и использования обратных функционалов Минковского. Метод обладает рядом достоинств. Он позволяет исследовать широкие классы игровых задач разной природы. Отмечена тесная идеологическая связь метода с первым прямым методом Понтрягина [103], а, именно, обращение в разрешающей функции в некоторый момент соответствует времени окончания игры согласно методу Понтрягина. Для простых движений и несколько более общих систем метод дает полное обоснование параллельного сближения, позволяет доказать его оптимальность.

В единой схеме охватываются нестационарные, дифференциально-разностные системы, процессы с переменной структурой. Метод позволяет рассмотреть интегральные и интегро-дифференциальные игры, исследовать игровые задачи для колебательных процессов и процессов с вращательной динамикой.

Детальное изучение метода разрешающих функций привело к появлению такого объекта как сопряженные дифференциальные игры, была установлена структура экстремальных селекторов (доставляющих минимум времени окончания игры). Идеи метода с успехом применены для решения задач группового и поочередного преследования. Последняя из перечисленных задач представляет собой усложненную динамическую задачу комивояжерного типа.

В последнее время [99-101] исследованы игровые задачи для систем с дробными по Риману-Лиувиллю и Джрбашяну-Нерсесяну производными, где в качестве сомножителя фундаментальной матрицы авторами введена обобщенная матричная функция Миттаг-Леффлера, для вычисления которой используется техника интерполяционных полиномов Лагранжа-Сильвестра, а в скалярном случае ее асимптотические представления. Использование последних позволяет сделать вывод о возможности окончания игры за конечное время из заданных начальных состояний, а также сравнить эти времена при задании начальных данных типа Коши или в виде дробного интеграла.

Управление с неполной информацией

В теории динамических игр очень важную роль играют те задачи, где информация о состоянии не является полной, что соответствует ситуации на практике. К ним относятся, в частности, задачи поиска движущихся объектов. Суть этих задач состоит в том, что вместо точного состояния объекта игроку становится известной лишь только плотность распределения положения игроков. В этом случае, как и во многих других, эволюция плотности распределения подчиняется уравнению Фоккера-Планка-Колмогорова, что является весьма сложной задачей. Чтобы обойти эту трудность была разработана клеточная модель поиска, связанная с дискретизацией процесса поиска как по времени, так и по состоянию [102]. Вместо уравнений движения игроков на конечном множестве состояний задается закон преобразования функции распределения состояния, причем переходная стохастическая матрица зависит от управлений игроков, т.е. ее элементы и являются управляющими воздействиями. Описаный выше процесс является марковским и билинейным. Для оптимизации вероятности обнаружения и среднего времени обнаружения используется дискретный принцип максимума Понтрягина и принцип динамического программирования Беллмана.

Рассмотрены различные эпизоды поиска: поиск с помощью группы однотипных и разнотипных объектов, с обменом и без обмена информацией, скрытный поиск, изучена задача поиска при взаимодействии группировок. Результаты иллюстрируются на примерах поиска на рубеже, по вызову и в заданном районе.
Различные аспекты непрерывного поиска рассмотрены в работе [104], где, в частности, получены необходимые условия оптимальности вероятности обнаружения за конечное время.

Проблемы управления летательными и космическими аппартами

Многие проблемы управления тесно связаны с космическими исследованиями, с расчетом траекторий движения космических аппаратов. Однако, обеспечением движения аппарата по расчетной орбите не исчерпывается спектр проблем, которые ставятся перед системами навигации и управления. Актуальными являются задачи маневрирования в космосе. Для их решения созданы алгоритмы и программы прогнозирования перемен динамических параметров объекта и быстрого решения задачи Ламберта с целью построения множеств достижимости в данный момент времени и на некотором временном интервале в зависимости от энергетических ресурсов. Разработано также математическое обеспечение для решения задачи быстрого построения множеств достижимости с учетом наличия атмосферы. Такие алгоритмы используются во время решения задач блокирования вероятных районов пуска балистических ракет противника, анализа возможных интервалов старта, исследования возможности перехвата маневрирующей космической цели.

Созданы методы исследования проблем взаимодействия космических аппаратов, влияние полученной информации на качество взаимодействия. Они применены для решения ряда прикладных задач оптимизации рубежа и момента атаки. Определено оптимальное уклонение космического аппарата от возможного перехвата другим аппаратом с дальнейшим возвращением на начальную орбиту в зависимости от интервалов задержки поступления информации о маневрах противника. Рассмотрена задача оптимизации моментов проведения маневров космическим аппаратом, который обслуживает несколько целей противника.

В последние годы выполнено ряд работ, посвященных решению задачи о мягкой посадке. Рассматривается игровая задача о сближении одного управляемого объекта, движущегося в верхнем полупространстве, с другим, движение которого происходит в горизонтальной плоскости. Тем самым моделируется движение разнотипных объектов в среде с трением. Целью является сближение геометрических координат и скоростей объектов в некоторый конечный момент времени [105]. В результате выделены начальные фазовые состояния первого объекта, а также установлены достаточные условия на параметры конфликтно-управляемого процесса, при которых задача о мягкой посадке разрешима за конечное время. При этом используется прием, позволяющий свести игровую задачу к эквивалентной задаче управления. На основе детального исследования множества достижимости последней, в явном (аналитическом) виде строятся управления первого объекта, позволяющие решить исходную задачу. Причем на первом этапе производится выравнивание скоростей объектов, а на заключительной стадии непосредственно осуществляется мягкая посадка. На каждом этапе гарантированное время на выполнение задачи может быть определено заранее.

В.М.Кунцевич, А.A.Чикрий

Наверх

 

HTD © 2003