Методы решения конечных игр
Перед тем, как решать игру т×п, нужно, прежде всего, попытаться ее упростить, избавившись от лишних стратегий. Введем понятие «доминирования».
Стратегия игрока называется доминирующей стратегией (среди его стратегий) или (слабо) заведомо-оптимальной, если она доминирует любую другую его стратегию либо эквивалентна ей, а сильно доминирующей – если только доминирует любую другую.
Первая стратегия “слабо доминирует” вторую (то есть первая стратегия “заведомо не хуже”, чем вторая) – когда первая стратегия при любых действиях партнеров не хуже второй стратегии и, по крайней мере, для одного варианта действий партнеров строго лучше.
Первая стратегия “сильно доминирует” вторую (то есть первая стратегия “заведомо лучше”, чем вторая) – когда первая стратегия при любых действиях партнеров лучше второй стратегии.
Если две стратегии доставляют одинаковые выигрыши при любых действиях партнеров, то они эквивалентны для игрока.
Если же из пары стратегий ни одна не слабо доминирует другую и они не эквивалентны, то они несравнимы.
Поясним сказанное примером. Пусть игра 5×5 задана матрицей таблицы 5.
Таблица 5
| В1 | В2 | В3 | В4 | В5 |
А1 | 3 | 4 | 5 | 2 | 3 |
А2 | 1 | 8 | 4 | 3 | 4 |
А3 | 10 | 3 | 1 | 7 | 6 |
А4 | 4 | 5 | 3 | 4 | 8 |
А5 | 1 | 8 | 4 | 3 | 4 |
Прежде всего заметим, что в ней стратегия А5 дублирует стратегию А2, поэтому любую из них можно отбросить. Отбрасывая А5, замечаем, что в строке А1 все выигрыши больше (или равны) соответствующим выигрышам строки А4, значит А1 доминирует над А4. Отбросим А4 и получим матрицу 3×5.
Перейдя к стратегиям игрока В замечаем, что в ней некоторые стратегии игрока В доминируют над другими: например, В3 над В4 и В5, a В1 - над стратегией В2 , поскольку игрок В стремится отдать поменьше. Отбрасывая названные столбцы, получим игру 2×2.
В руководствах по теории игр обычно останавливаются на решении простейших игр 2×2, 2×хп и m×2, которое допускает геометрическую интерпретацию, но мы этого делать не будем - рассмотрим решение в общем виде.
Пусть имеется игра т×п без седловой точки с матрицей (a,j) (см. таблицу 27.5).
Таблица 6
| В1 | В2 | … | Вn |
А1 | a11 | a12 | … | a1n |
А2 | a12 | a22 | … | a2n |
… | … | … | … | … |
Аm | am1 | am2 | … | amn |
Допустим, что все выигрыши аij положительны (этого всегда можно добиться, прибавляя ко всем членам матрицы достаточно большое число М; от этого цена игры увеличится на М, а решение S*A, S*B не изменится). Если все аij положительны, то конечно, и цена игры, т. е. средний выигрыш при оптимальной стратегии, тоже положителен: v > 0.
Мы хотим найти решение игры, т. е. две оптимальные смешанные стратегии S*A = (p1, р2, …, рт), S*B = (q1, q2,..., qn), дающие каждой стороне максимально возможный для нее средний выигрыш (минимальный проигрыш).
Найдем сначала S*A. Мы знаем, что если один из игроков (в данном случае это А) применяет свою оптимальную стратегию, то другой (B) не может улучшить свое положение, отступая от своей. Заставим противника (В) отступать от своей оптимальной стратегии, пользуясь чистыми стратегиями В1, В2, ..., Вп (а мы тем временем упорно держимся стратегии SA). В любом случае наш выигрыш будет не меньше, чем v:
a11 p1 + a21 p2 +…+ am1 pm ≥ v
a12 p1 + a22p2 +…+ am2 pm ≥ v
………………………………..
a1n p1 + a2n p2 +…+ amn pm ≥ v
Разделим полученные неравенства на положительную величину v и введем обозначения
.
Тогда система условий примет вид
a 11 х1 + a21 х2 +…+ am1 хm ≥ 1
a12 х1 + a22х2 +…+ am2 хm ≥ 1
………………………………..
a1n х1 + a2n х2 +…+ amn хm ≥ 1
где х1, х2,..., хт - неотрицательные переменные.
В силу того, что p1 + р2 + … + pm = 1, переменные x1, х2,..., хт удовлетворяют условию
х1 + х2+ … + хт = 1/v .
Но v есть не что иное, как наш гарантированный выигрыш; естественно, мы хотим сделать его максимальным, а значит, величину 1/v - минимальной.
Таким образом, задача решения игры свелась математической задаче линейного программирования: найти неотрицательные значения переменных х1, х2, ..., хт такие, чтобы они удовлетворяли линейным ограничениям-неравенствам и обращали в минимум линейную функции этих переменных:
L = х1 + х2+ … + хт → min
Оптимальная стратегия игрока В находится совершенно аналогично, с той разницей, что В стремится минимизировать, а не максимизировать выигрыш, а значит обратить в максимум величину - 1/v , а в ограничениях-неравенствах вместо знаков ≥ будут стоять знаки ≤.
В некоторых случаях решение данных задач имеет большую размерность и не требует высокой точности. Для этой категории задач целесообразно применять приближенные численные методы решения игр.
Наиболее простым и наглядным является так называемый метод итераций (иначе - метод Брауна-Робинсон). Идея его в следующем. Разыгрывается «мысленный эксперимент», в котором стороны А и В поочередно применяют друг против друга свои стратегии, стремясь выиграть побольше (проиграть поменьше). Эксперимент состоит из ряда «партий» игры. Начинается он с того, что один из игроков (скажем, А) выбирает произвольно одну из своих стратегий Ai. Противник (B) отвечает ему той из своих стратегий Bj, которая хуже всего для А, т. е. обращает его выигрыш при стратегии Ai в минимум. Дальше снова очередь А — он отвечает В той своей стратегией которая дает максимальный выигрыш при стратегии В противника. Дальше — снова очередь противника. Он отвечает нам той своей стратегией Ak, которая является наихудшей не для последней, примененной нами, стратегии Ак, а для смешанной стратегии, в которой до сих пор примененные стратегии Аi, Ак встречаются с равными вероятностями. И так далее: на каждом шаге итерационного процесса каждый игрок отвечает на очередной ход другого той своей стратегией, которая является оптимальной для него относительно смешанной стратегии другого, в которую все примененные до cux пор стратегии входят пропорционально частотам их применения.
Вместо того чтобы вычислять каждый раз средний выигрыш, можно пользоваться просто «накопленным» за предыдущие ходы выигрышем и выбирать ту свою стратегию, при которой этот накопленный выигрыш максимален (минимален). Доказано, что такой метод сходится: при увеличении числа «партий» средний выигрыш на одну партию будет стремиться к цене игры, а частоты применения стратегий — к их вероятностям в оптимальных смешанных стратегиях игроков.
Рассмотрим применение итерационного метода на конкретном примере. Продемонстрируем его на примере игры 3×3 предыдущего параграфа (таблица 4). Чтобы не иметь дела с отрицательными числами, прибавим к элементам матрицы таблицы 4 число 5 (см. таблицу 7); при этом цена игры увеличится на 5, а решение. S*A , S*В не изменится.
Таблица 7
| В1 | В2 | В3 |
А1 | 7 | 2 | 9 |
А2 | 2 | 9 | 0 |
А3 | 9 | 0 | 11 |
Начнем с произвольно выбранной стратегии игрока А,— например, со стратегии А3. В таблице 8 приведены первые 15 шагов итерационного процесса по методу Брауна — Робинсон. В первом столбце дан номер партии (пары выборов) k, во втором — номер i выбранной в данной партии стратегии игрока А. В последующих трех столбцах — «накопленный выигрыш» за первые k партий при тех стратегиях, которые применяли игроки в предыдущих партиях и при стратегиях В1, В2, Вз игрока В в данной партии (получается прибавлением элементов соответствующей строки к тому, что было строкой выше). Из этих накопленных выигрышей в таблице 8 подчеркнут минимальный (если их несколько, подчеркиваются все). Подчеркнутое число определяет ответный выбор игрока В в данной партии — он выбирает ту стратегию, которая соответствует подчеркнутому числу (если их несколько, берется любая). Таким образом определяется номер j оптимальной (в данной партии) стратегии В (ставится в следующем столбце).
Таблица 8
к | i | B1 | B2 | В3 | j | A1 | А2 | А3 |
|
| v* |
1 | 3 | 9 | 0 | 11 | 2 | 2 | 9 | 0 | 0 | 9 | 4,5 |
2 | 2 | 11 | 9 | 11 | 2 | 4 | 18 | 0 | 4,5 | 9 | 6,75 |
3 | 2 | 13 | 18 | 11 | 3 | 13 | 18 | 11 | 3,67 | 6 | 4,84 |
4 | 2 | 15 | 27 | 11 | 3 | 22 | 18 | 22 | 2,75 | 5,50 | 4,13 |
5 | 1 | 22 | 29 | 20 | 3 | 31 | 18 | 33 | 4,00 | 6,60 | 5,30 |
6 | 3 | 31 | 29 | 31 | 2 | 33 | 27 | 33 | 4,84 | 5,50 | 5,17 |
7 | 1 | 38 | 31 | 40 | 2 | 35 | 36 | 33 | 4,43 | 5,14 | 4,79 |
8 | 2 | 40 | 40 | 40 | 2 | 37 | 45 | 33 | 5,00 | 5,61 | 5,30 |
9 | 2 | 42 | 49 | 40 | 3 | 46 | 45 | 44 | 4,45 | 5,11 | 4,78 |
10 | 1 | 49 | 51 | 49 | 1 | 53 | 47 | 53 | 4,90 | 5,30 | 5,10 |
11 | 3 | 58 | 51 | 60 | 2 | 55 | 56 | 53 | 4,64 | 5,09 | 4,87 |
12 | 2 | 60 | 60 | 60 | 2 | 57 | 65 | 53 | 5,00 | 5 ,41 | 5,20 |
13 | 2 | 62 | 69 | 60 | 3 | 66 | 65 | 64 | 4,61 | 5,07 | 4,84 |
14 | 1 | 69 | 71 | 69 | 1 | 73 | 67 | 73 | 4,93 | 5,21 | 5,07 |
15 | 3 | 78 | 71 | 80 | 2 | 75 | 76 | 73 | 4,74 | 5,06 | 4,90 |
В последующих трех столбцах дается накопленный выигрыш за k партий соответственно при стратегиях A1, А2, А3 игрока А (получается прибавлением элементов столбца Bj к тому, что было строкой выше). В последних трех столбцах таблицы 8 даны: — нижняя оценка цены игры, равная минимальному накопленному выигрышу, деленному на число партий k; — верхняя оценка цены игры, равная максимальному накопленному выигрышу, деленному на k; v* — среднее арифметическое между ними (оно служит лучшей, чем нижняя и верхняя, приближенной оценкой цены игры).
График, построенный по результатам последнего столбца и представленный на рисунке 10 показывает, что величина v* незначительно колеблется около цены игры v = 5 (цена исходной игры была 0, но мы прибавили к элементам матрицы по 5).
Рисунок 10. График зависимости v* от номера итерации
Подсчитаем по таблице 8 частоты стратегий игроков. Получим:
р1 = 4/15 = 0,266, р2 = 7/15 = 0,468; р3 = 4/15 = 0,266,
q1 = 2/15 = 0,133, q2 = 8/15 = 0,534, q3 = 5/15 = 0,333,
что не так уж сильно отличается от вероятностей, вычисленных аналитически.
Очень важным преимуществом итерационного метода решения игр является то, что его трудоемкость сравнительно медленно возрастает с увеличением размерности игры т× п, тогда как трудоемкость метода линейного программирования растет при увеличении размерности задачи гораздо быстрее.
Замечание: в теории игр считается, что каждому игроку известны все возможные стратегии противника, неизвестно лишь то, какой именно из них он воспользуется в данной партии игры. В реальном конфликте это обычно не так: перечень возможных стратегий противника как раз неизвестен, и наилучшим решением в конфликтной ситуации нередко будет именно выйти за пределы известных противнику стратегий, «ошарашить» его чем-то совершенно новым, непредвиденным!
Тема 2. | Математический аппарат оценки рисков и их последствий |
Занятие 9. | Принятие решения в условиях неопределенности |
Учебные вопросы |
|
- Историческая справка
- 2. Цели и задачи изучения дисциплины.
- 3. Современное состояние теории и практики риск-менеджмента.
- 1. Процесс принятия решения как наука
- 2. Методы исследования операций. Основные понятия и определения, область применения
- 3. Принципы и аспекты системного подхода
- 1. Основные термины и определения менеджмента риска
- 2. Система неопределенностей
- 3. Понятие риска и его сущность.
- 1. Классификация рисков
- 2. Виды рисков
- 2.1. Предпринимательские риски
- 2.2. Коммерческие риски
- 2.3. Финансовые риски
- 2.4. Валютные риски
- 2.5. Кредитные риски
- 2.6. Экономические риски
- 2.7. Операционные риски
- 2.8. Трансляционные риски
- 2.9. Инвестиционные риски
- 2.10. Банковские риски
- 2.11. Процентный риск
- 2.12. Производственные риски
- 2.13. Политические риски
- 2.14. Технические риски
- 2.15. Отраслевые риски
- 2.16. Аудиторский риск
- 3. Классификация рисков авиапредприятий
- 1. Необходимые сведения из теории вероятности
- 2. Применение вероятностных подходов в менеджменте риска.
- 3. Вероятностный подход к минимизации риска
- Теория игр
- Матричные игры
- Методы решения конечных игр
- Задачи теории статистических решений
- Основные критерии статистических решений.
- 3. Примеры практического применения теории игр
- Прогнозирование рисков
- 1. Экспертные методы в менеджменте риска
- 2. Общая характеристика эвристических методов решения задач менеджмента риска
- 3. Алгоритмы основных эвристических методов
- 1. Три понимания риск-менеджмента
- 2. Пять уровней восприятия риска
- 3. Сущность и содержание риск-менеджмента
- 4. Этапы управления рисками
- 5. Риск-менеджмент как форма предпринимательства.
- 1. Стратегия риск-менеджмента.
- 2. Приемы риск-менеджмента (методы воздействия на риск)