Д. БЕРТСЕКАС, С. ШРИВ
СТОХАСТИЧЕСКОЕ
ОПТИМАЛЬНОЕ
УПРАВЛЕНИЕ
СЛУЧАЙ
ДИСКРЕТНОГО ВРЕМЕНИ
Перевод с английского ВМ. Луткова, В А. Хаванскова
Под редакцией А. А. Юшкевича
Ш
ш
МБфагу
МОСКВА "НАУКА"
ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
1985
32. 81
Б 52
УДК 62-50
STOCHASTIC OPTIMAL
CONTROL
The Discrete Time Case
DIMITRI P. BERTSEKAS
STEVEN E. SHREVE
ACADEMIC PRESS
New York San Francisko London
1978
Бертсекас Д. , Шрив С. Стохастическое оптимальное
управление: случай дискретного времени. Пер. с англ. /Под ред. А. А. Юшкевича. - М. : Наука. Главная редакция физико-математической
литературы, 1985. - 280 с. Книга посвящена проблемам управления при неполной информации
в дискретных системах. Монография содержит единообразную и
математически строгую теорию широкого класса задач динамического
программирования и стохастического оптимального управления в
дискретном времени. Ил л. 2. Библиогр. 129 назв.
1502000000-058
Б 158-85
053 (02)-85
© 1978, Academic Press, Inc. All Rights Reserved. © Перевод на русский язык. Издательство "Наука". Главная редакция
физи ко-математической
литературы, 1985
ОГЛАВЛЕНИЕ
От редактора перевода 6
Предисловие 12
Глава 1
Введение 14
1. 1. Структура моделей последовательного принятия решений 14
1. 2. Задачи стохастического оптимального управления с дискретным
временем: вопросы измеримости 17
1. 3. Связь книги с литературой 25
ЧАСТЫ
АНАЛИЗ МОДЕЛЕЙ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
Глава 2
Монотонные отображения, лежащие в основе моделей динамического
программирования 32
2. 1. Обозначения и предположения 32
2. 2. Постановка задачи 34
2. 3. Применение к частным случаям 36
2. 3. 1. Детерминированное оптимальное управление (36). 2. 3. 2. Стохастическое оптимальное управление — счетное пространство
возмущений (37). 2. 3. 3.
Стохастическое оптимальное управление —
формулировка с внешним интегралом (40). 2. 3. 4. Стохастическое
оптимальное управление — мультипликативный функционал издержек (42)
2. 3. 5. Минимаксное управление (43). Глава 3
Модели с конечным горизонтом 44
3. 1. Общие замечения и предположения 44
3. 2. Основные результаты 45
3. 3. Применение к частным случаям 50
Глава 4
Модели с бесконечным горизонтом в предположении сжимаемости 55
4. 1. Общие замечания и предположения 55
4. 2. Результаты о существовании и сходимости 55
4. 3. Вычислительные методы 60
4. 3. 1. Последовательные приближения (60). 4. 3. 2. Итерация стратегий
(64). 4. 3. 3. Математическое программирование (68).
4. 4. Применение к частным случаям 68
3
Глава 5
Модели с бесконечным горизонтом в предположении монотонности 70
5. 1. Общие замечания и предположения 70
5. 2. Уравнение оптимальности 71
5. 3. Характеризация оптимальных стратегий 76
5. 4. Сходимость алгоритма динамического программирования —
существование стационарных оптимальных стратегий . · . . 78
5. 5. Применение к частным случаям 85
Глава 6
Обобщенная абстрактная модель динамического программирования 87
6. 1. Общие замечания и предположения 87
6. 2. Анализ моделей с конечным горизонтом 90
6. 3.