Читать онлайн «Стохастическое оптимальное управление: случай дискретного времени»

Автор Д. Бертсекас

Д. БЕРТСЕКАС, С. ШРИВ СТОХАСТИЧЕСКОЕ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ СЛУЧАЙ ДИСКРЕТНОГО ВРЕМЕНИ Перевод с английского ВМ. Луткова, В А. Хаванскова Под редакцией А. А. Юшкевича Ш ш МБфагу МОСКВА "НАУКА" ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1985 32. 81 Б 52 УДК 62-50 STOCHASTIC OPTIMAL CONTROL The Discrete Time Case DIMITRI P. BERTSEKAS STEVEN E. SHREVE ACADEMIC PRESS New York San Francisko London 1978 Бертсекас Д. , Шрив С. Стохастическое оптимальное управление: случай дискретного времени. Пер. с англ. /Под ред. А. А. Юшкевича. - М. : Наука. Главная редакция физико-математической литературы, 1985. - 280 с. Книга посвящена проблемам управления при неполной информации в дискретных системах. Монография содержит единообразную и математически строгую теорию широкого класса задач динамического программирования и стохастического оптимального управления в дискретном времени. Ил л. 2. Библиогр. 129 назв. 1502000000-058 Б 158-85 053 (02)-85 © 1978, Academic Press, Inc. All Rights Reserved. © Перевод на русский язык. Издательство "Наука". Главная редакция физи ко-математической литературы, 1985 ОГЛАВЛЕНИЕ От редактора перевода 6 Предисловие 12 Глава 1 Введение 14 1. 1. Структура моделей последовательного принятия решений 14 1. 2. Задачи стохастического оптимального управления с дискретным временем: вопросы измеримости 17 1. 3. Связь книги с литературой 25 ЧАСТЫ АНАЛИЗ МОДЕЛЕЙ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ Глава 2 Монотонные отображения, лежащие в основе моделей динамического программирования 32 2. 1. Обозначения и предположения 32 2. 2. Постановка задачи 34 2. 3. Применение к частным случаям 36 2. 3. 1. Детерминированное оптимальное управление (36). 2. 3. 2. Стохастическое оптимальное управление — счетное пространство возмущений (37). 2. 3. 3.
Стохастическое оптимальное управление — формулировка с внешним интегралом (40). 2. 3. 4. Стохастическое оптимальное управление — мультипликативный функционал издержек (42) 2. 3. 5. Минимаксное управление (43). Глава 3 Модели с конечным горизонтом 44 3. 1. Общие замечения и предположения 44 3. 2. Основные результаты 45 3. 3. Применение к частным случаям 50 Глава 4 Модели с бесконечным горизонтом в предположении сжимаемости 55 4. 1. Общие замечания и предположения 55 4. 2. Результаты о существовании и сходимости 55 4. 3. Вычислительные методы 60 4. 3. 1. Последовательные приближения (60). 4. 3. 2. Итерация стратегий (64). 4. 3. 3. Математическое программирование (68). 4. 4. Применение к частным случаям 68 3 Глава 5 Модели с бесконечным горизонтом в предположении монотонности 70 5. 1. Общие замечания и предположения 70 5. 2. Уравнение оптимальности 71 5. 3. Характеризация оптимальных стратегий 76 5. 4. Сходимость алгоритма динамического программирования — существование стационарных оптимальных стратегий . · . . 78 5. 5. Применение к частным случаям 85 Глава 6 Обобщенная абстрактная модель динамического программирования 87 6. 1. Общие замечания и предположения 87 6. 2. Анализ моделей с конечным горизонтом 90 6. 3.