Смешанные стратегии матричных игр.
Если платежная матрица не имеет седловой точки, т.е. В табл. 4.4 приведен пример, когда нижняя цена игры Таблица 4.4.
Здесь Обратимся к общему случаю матричной игры, представленной в табл. 4.2. Обозначим через
Вектор Аналогично, вектор
полностью определяет характер игры игрока В и называется смешанной стратегией игрока В. Игрок В, как и игрок А, располагает бесконечным множеством смешанных стратегий. Пусть игроки А и В применяют смешанные стратегии
Функция (4.9) называется платежной функцией игры с матрицей, заданной в табл. 4.5. Нижней ценой игры называется число
Верхней ценой игры называется число
Таблица 4.5.
Оптимальными смешанными стратегиями называются стратегии, удовлетворяющие соотношению (сравнить с формулой (4.6)).
Величину
определенную соотношением (4.12), называют ценой игры. Дадим другое определение оптимальных смешанных стратегий. Определение. Векторы
Из соотношения (4.13) следует, что в седловой точке 1. Какие матричные игры имеют решение в смешанных стратегиях? 2. Как находить решение матричной игры, если оно существует?
Ответы на данные вопросы дают две следующие теоремы. Теорема 4.1. Основная теорема теории матричных игр. (Дж. фон Нейман). Для матричной игры с любой матрицей А величины
Более того, существует хотя бы одна ситуация в смешанных стратегиях
Теорема 4.2. Основные свойства оптимальных смешанных стратегий. Пусть
Оптимальная смешанная стратегия
Аналогично, только те вероятности
Имеют место соотношения
Рассмотрим методы решения некоторых матричных игр.
4.4. Графические решения матричных игр Графический метод применим к тем играм, в которых хотя бы один игрок имеет две стратегий.. Рассмотрим игру 2×п, представленную в табл. 4.6. Эта игра не имеет седловой точки. Согласно теореме 4.2 имеем
Таблица 4.6
Максимум функции
найдем, построив ее график. Для этого поступаем следующим образом. Построим графики прямых wk=а1k p + a2k(1-p)=(a1k-a2k)p + a2k (4.16) для каждого к = 1, 2,..., п в системе координат pOw (рис.4.1). В соответствии с требованием (4.16) на каждой из построенных прямых определяются и отмечаются наименьшие значения. На рис. 4.2 эти значения выделены полужирной ломаной линией. Эта ломаная огибает снизу все семейство построенных прямых и называется нижней огибающей семейства. В соответствии с (4.14) цену игры υ определяет верхняя точка построенной нижней огибающей. Координаты этой точки являются оптимальной стратегией игрока А:
Рис. 4.1 Рис. 4.2 Пример 4.3. Найти решение игры вида 2×п, приведенной в табл. 4.7. Таблица 4.7
Решение. Проведем анализ игры на наличие седловой точки. Нижняя цена игры равна -1, верхняя равна 1. Седловой точки нет. Решение надо искать в смешанных стратегиях.
Построим график нижней огибающей (4.15). Предварительно запишем уравнения прямых:
Графики данных прямых, построенных в системе координат pOw, представлены на рис.4.3. Рис. 4.3 Нижняя огибающая выделена на рис. 4.3 полужирной ломаной линией. Точка максимума нижней огибающей лежит на пересечении прямых w4 и w5. Решая уравнение p -6р + 5, получим popt = Таким образом, цена игры и оптимальная стратегия игрока А равны:
Иногда решение матричной игры сводится только к поиску оптимальных смешанных стратегий игрока А. При этом стратегии противника могут не интересовать исследователя. Однако в целом ряде случаев необходимо знать оптимальные смешанные стратегии обоих игроков. Пусть в наивысшей точке нижней огибающей пересекаются прямые wk и w
где q находят из уравнения
Таким образом, игрок В применяет стратегию Вк с вероятно стью qk = q, а стратегию Bt — с вероятностью ql = 1 - q. Рис. 4.4 Пример 4.4. Для условий примера 4.3 определить смешанные стратегии игрока В. Решение. В наивысшей точке нижней огибающей пересекаются прямые w4 и w5 (рис.4.3), при этом прямая w4 имеет положительный наклон, а прямая w5 — отрицательный. Составим уравнение: q-(1-q)=0 × q+5(1-q) или 7q=6. Отсюда находим
Таким образом, цена игры и оптимальная стратегия игрока В равны
Примет 4.5. Найти решение игры вида Таблица 4.9
Решение. Проведем анализ игры на наличие седловой точки. Нижняя цена игры равна 0, верхняя цена игры равна 3. Седловой точки нет. решение надо искать в смешанных стратегиях.
Построим график верхней огибающей. Предварительно запишем уравнения прямых:
Графики этих прямых, построенных в системе координат Рис. 4.6 Верхняя огибающая выделена на рис. 4.6 полужирной ломаной линией. точка минимума верхней огибающей лежит на пересечении прямых Решая уравнение Найдем оптимальную стратегию игрока А. в самой нижней точке верхней огибающей пересекаются прямые
Отсюда находим
Таким образом, цена игры и оптимальные стратегии игроков А и В равны
Игры с природой. Игра с природой - это парная матричная игра, в которой сознательный игрок А(статистик) выступает против участника, совершенно безразличного к результату игры, называемого природой. Эти игры обладают некоторыми особенностями по сравнению с рассмотренными парными матричными играми. Например, при их решении достаточно найти оптимальное решение только для статистика А, так как природа в рекомендациях не нуждается, развиваясь в соответствии с определенными законами независимо от того, удобно это статистику или нет. Пусть статистик использует стратегии А1, A2,..., Аm, а природа обладает стратегиями П1, П2,..., Пn. Если статистик имеет возможность оценить последствия применения каждой своей чистой стратегии Аi в зависимости от любой стратегии природы Пk, т.е. если ему известен численный результат aikдля каждой допустимой комбинации (AiПk),то игру можно задать платежной матрицей (табл. 4.10) В последнем столбце табл. 4.10 приведены минимально возможные выигрыши статистика αi при стратегии Ai, а в последней строке - максимально возможный выигрыш статистика βk при состоянии Пк. Таблица 4.10
Помимо матрицы платежей (aik), приведённой в табл.4.10, для анализа игры с природой используется также матрица рисков статистика. Риском статистика rik называют разность между максимальным выигрышем
Для анализа игры с природой часто используются средние значения рисков
В этих формулах введена вероятность qk наступления события Пк. Таким образом, матрица рисков статистика имеет вид табл. 4.11. Таблица 4.11
С учетом (4.23) табл. 5.10 можно записывать также в виде табл. 4.12. Таблица 4.12
Перед тем как переходить к выбору оптимальной стратегии, нужно сравнить нижнюю и верхнюю чистые цены. В случае неравенства этих цен при возможности упрощают платежную матрицу, учитывая доминирование стратегий статистика. Отбрасывать те или иные состояния природы нельзя, так как она может реализовать свои состояния независимо от того, выгодны они статистику или нет. К матрице рисков обычно переходят после упрощения платежной матрицы.
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|