Теория игр вик 2
Марковский процесс принятия решений
Марковский процесс принятия решений(англ.Markov decision process (MDP)) — спецификация задачипоследовательного принятия решенийдля полностью наблюдаемой среды с марковской моделью перехода и дополнительными вознаграждениями. Назван в честьАндрея Маркова, служит математической основой для того, чтобы смоделировать принятие решения в ситуациях, где результаты частично случайны и частично под контролем лица, принимающего решения. Сегодня эта спецификация используются во множестве областей, включая робототехнику, автоматизированное управление, экономику и производство.
Содержание
- Теория игр
- . Содержание
- История исследований по теории игр
- Представление игр
- Экстенсивная форма
- Нормальная форма
- Характеристическая функция в игре
- Применение теории игр
- Описание и моделирование
- Нормативный анализ (выявление наилучшего поведения)
- Типы игр Кооперативные и некооперативные
- Симметричные и несимметричные
- С нулевой суммой и с ненулевой суммой
- Параллельные и последовательные
- С полной или неполной информацией
- Игры с бесконечным числом шагов
- Дискретные и непрерывные игры
- Метаигры
- Стохастическая игра
- История исследований стохастических игр
- Применение стохастических игр
- Некооперативная игра
- Некооперативная игра в нормальной форме
- Некооперативная игра в развернутой форме
- Принципы оптимальности Эффективность по Парето
- Равновесие Нэша: формальное определение
- Равновесии дрожащей руки: формальное определение
- Собственное равновесие
- Определение
- Сильное равновесие
- Равновесие в доминирующих стратегиях
- Равновесие, совершенное по под-играм
- Кооперативная игра
- Математическое представление кооперативной игры
- Свойства характеристической функции
- Примеры кооперативных игр
- Решение кооперативных игр
- Свойства
- Формальное определение
- История возникновения
- Дальнейшие свойства
- Вектор Шепли
- Формальное определение
- Аксиоматика вектора Шепли
- Литература
- Антагонистическая игра
- Дифференциальные игры
- Сетевые игры
- Кооперативные стохастические игры
- Марковский процесс принятия решений
- Определение
- Классическая дилемма заключённого
- Обобщённая форма
- Примеры из реальной жизни
- Повторяющаяся дилемма заключённого
- Психология обучения и теория игр
- Восточная философия
- Генетика
- Игрок в теории игр
- Типы стратегий
- Терминология
- Формальные определения
- Доминирование и равновесие Нэша
- Последовательное исключение доминируемых стратегий
- Литература