Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Решение игр в смешанных стратегиях




Если игра не имеет cедловой точки, то применение чистых стратегий не дает оптимального решения игры. Так, в задаче 9.1 а, седловая точка отсутствует. В таком случае можно полу­чить оптимальное решение, случайным образом чередуя чистые стратегии.

Смешанной стратегией SA игрока А называется применение чистых стратегий Аь А2,..., At,..., Ат с вероятностями ри р2,..., />,,

..., рт, причем сумма вероятностей равна 1: V/>,- = 1. Смешанные стратегии игрока А записываются в виде матрицы решение (или решение) игры: это пара оптимальных стратегий S*A,SB в общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей опти­мальной стратегии, то другому не может быть выгодно отступать от своей. Выигрыш, соответствующий оптимальному решению, называется ценой игры v. Цена игры удовлетворяет неравенству:

(9.5)

а < v< P,

где а и р - нижняя и верхняя цены игры.

Справедлива следующая основная теорема теории игр - тео­рема Неймана1. Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.

Пусть S'A =(/>,*, р\,...,р'т) и S'B =(q'],q'2,...,qtn) - пара опти­мальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.

Справедлива теорема об активных стратегиях: если один из игро­ков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры v, если второй игрок не выходит за пределы своих активных стратегий.

Эта теорема имеет большое практическое значение - она дает конкретные модели нахождения оптимальных стратегий при от­сутствии седловой точки.

Рассмотрим игру размера 2x2, которая является простейшим случаем конечной игры. Если такая игра имеет седловую точку, то оптимальное решение - это пара чистых стратегий, соответст­вующих этой точке.

Игра, в которой отсутствует седловая точка, в соответствии с основной теоремой теории игр оптимальное решение существует и определяется парой смешанных стратегий S*A-=(p],p\). и

Для того чтобы их найти, воспользуемся теоремой об активных стратегиях. Если игрок А придерживается своей оптимальной стратегии S*A, то его средний выигрыш будет равен цене игры v, какой бы активной стратегией ни пользовался игрок В. Для игры

2x2 любая чистая стратегия противника является активной, если отсутствует седловая точка. Выигрыш игрока А (проигрыш игрока В) - случайная величина, математическое ожидание (среднее значение) которой является ценой игры. Поэтому средний выиг­рыш игрока А (оптимальная стратегия) будет равен v и для 1-й, и для 2-й стратегии противника.

Пусть игра задана платежной матрицей

Р =

п а а21 а

Средний выигрыш игрока А, если он использует оптимальную

_• ХА2Л смешанную стратегию SA =,;, а игрок В - чистую страте-

\Р\ Pi)

гию В\ (это соответствует 1-му столбцу платежной матрицы Р), равен цене игры v:

a\if'i +<*г\Р2 = v-

Тот же средний выигрыш получает игрок А, если 2-й игрок применяет стратегию Bi, т.е. апр[ + а22р\ = v. Учитывая, что Р\ + Р*2 ~ '' получаем систему уравнений для определения ма!ьной стратегии S'A и цены ифы v:

Применяя теорему об активных стратегиях при отыскании S*B - оптимальной стратегии игрока В, получаем, что при любой

чистой стратегии игрока А (А\ или А^) средний проигрыш игрока В равен цене игры v, т.е.

a22q'2 = v,
(9.9)

\а\\Я\ \a2lq[

(Ч\

Тогда оптимальная стратегия S*B(q\,q\) определяется формулами:

Ч\ =

«22-«12

«II +«22-^12 ~
Чг =

(9.10)

«12"'
 

«11 +«22

Применим полученные результаты для отыскания оптималь­ных стратегий для игры, рассмотренной в задаче 9.1. 9.3. Найти оптимальные стратегии игры, приведенной в задаче 9.1.

Решение. Игра "поиск" задана платежной матрицей без седловой точки:

Р =

-1 1 1 -1

Поэтому ищем решение в смешанных стратегиях; для игрока А средний выигрыш равен цене игры v (при В\ и В^У, для игрока В средний проигрыш равен цене игры v (при А\ и Ai). Системы уравнений (9.6) и (9.9) в данном случае имеют вид:

-1)д + 1 ■ р\ = v, 1 • Р\ - 1 • р\ = v, Р*\ + ft = 1,

(-1)?,* + 1 • q\ = v, 1 • Ч\ ~ 1' Чг = v-

«I* +4*2=1

Решая эти системы, получаем р\ = р"2 = q[ = q\ = -, v = 0.

Это означает, что оптимальная стратегия каждого игрока со­стоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью 1/2, при этом средний выигрыш равен 0>

Чистая стратегия В2 (рис. 9.7) не выгодна для игрока В, по­скольку при любой стратегии игрока А она дает последнему больший выигрыш, чем чистая стратегия В\. На основании принципа минимакса выделим прямую В\В\ и на ней точку В\ с наибольшей ординатой на оси I-I. Чистая стратегия Ai является оптимальной для игрока А, а чистая стратегия В\ - для игрока В. Оптимальное решение: S'A = (0;l), S*B = (1;0), цена игры v = a2i = = а = р, т.е. имеется седловая точка.

Графический метод можно применять при решении игры 2 х п и т х 2.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...