Основная теорема теории игр
Каждая конечная игра имеет, по крайней мере, одно решение (возможно, в области смешанных стратегий) [4]. Выигрыш, получаемый в результате решения, называется ценой игры. Следствие 2. Каждая конечная игра имеет цену. Очевидно, что цена игры v всегда лежит между нижней ценой игры α и верхней ценой игры β: α< v <β. Введём специальное обозначение для смешанных стратегий. Если, например, наша смешанная стратегия состоит в применении стратегий А1, А2, А3 с частотами р1, р2, р3, причём р1+р2+р3=1, будем обозначать эту стратегию . Аналогично смешанную стратегию противника будем обозначать: , где q 1, q 2, q 3 - частоты, в которых смешиваются стратегии В1, В2, В3; q 1+ q 2+ q 3=1. Оптимальные стратегии, образующие решения игры, будем обозначать SA*, SB*. Определение 11. Стратегии, входящие в решение игры, называются активными. Определение 12. Игра, в которой все стратегии обеих сторон являются активными, называется полностью усреднённой. Решение игры обладает замечательным свойством. Теорема 14. Если один из игроков придерживается своей оптимальной смешанной стратегией, то выигрыш остаётся неизменным и равным цене игры v независимо от того, что делает другой игрок, если только он не выходит за пределы своих активных стратегий [15].
Элементарные методы решения игр. Игры 2x2 и 2х п.
Если игра m x n не имеет седловой точки, то нахождение решения есть вообще довольно трудная задача, особенно при больших т и п. Эту задачу можно упростить, если уменьшить число стратегий, вычёркивая излишние стратегии: дублирующие и заведомо невыгодные. Рассмотрим, например, игру с матрицей Таблица 15 - Игра, представленная в виде матрицы.
Стратегия А3 в точности повторяет ("дублирует") стратегию А1 поэтому любую из этих двух стратегий можно вычеркнуть. Сравнивая почленно строки А1 и A2, видим, что каждый элемент строки А2 меньше (или равен) соответствующего элемента строки А1. Очевидно, мы никогда не должны пользоваться стратегией А2; она заведомо является невыгодной. Вычёркивая А3 и А2, приводим матрицу к более простому виду. Далее замечаем, что для противника стратегия В3 заведомо невыгодна; вычёркивая её, приводим матрицу к окончательному виду. Таблица 16 - Окончательная матрица игры.
Таким образом, игра 4x4 вычёркиванием дублирующих и заведомо невыгодных стратегий сведена к игре 2x3. Замечание 2. Процедура вычёркивания дублирующих и заведомо невыгодных стратегий всегда должна предшествовать решению игры. Наиболее простыми типами конечных игр, которые всегда можно решить элементарными способами, являются игры 2x2 и 2х п. Рассмотрим игру 2x2 с матрицей (таблица 17). Таблица 17 - Игра 2х2.
Здесь могут встретиться два случая: 1. игра имеет седловую точку; 2. игра не имеет седловую точку. Решение Первый случай. Если игра 2x2 имеет седловую точку, то решение очевидно: это - пара чистых стратегий, пересекающихся в седловой точке. Замечание 3. В игре 2x2 наличие седловой точки всегда соответствует существованию заведомо невыгодых стратегий, которые должны быть вычеркнуты при предварительном анализе. Второй случай. Если седловой точки нет, то α≠β. Требуется найти оптимальную смешанную стратегию игрока А: . Она отличается тем свойством, что, каковы бы ни были действия противника (если только он не выходит за пределы своих «полезных стратегий»), выигрыш будет равен цене игры v.
В игре 2x2 обе стратегии противника являются «полезными», - иначе игра имела бы решение в области чистых стратегий (седловую точку). Значит, если мы придерживаемся своей оптимальной стратегии , то противник может пользоваться любой из своих чистых стратегий В1, В2, не изменяя среднего выигрыша v. Отсюда имеем два уравнения: . (15) Из которых, принимая во внимание, что p1 + р2 = 1, получим: . (16) Цену игры v найдём, подставляя значение р1, р2 в любое уравнение (15). Если цена игры известна, то для определения оптимальной стратегии противника достаточно одного уравнения, например: , откуда, учитывая, что q 1+ q 2 = 1, имеем , q 2 = 1- q 1. (17) Пример 21. У нас (А) имеется два вида вооружения А1 и А2: у противника (В) -два вида помех: B1 и В2. Вероятность выполнения боевой задачи при различных комбинациях "вооружения" — "помехи" задана матрицей 2x2. Найти решение. Таблица 18 - Заданная матрица игры.
Решение. 1. α = 0,3; β = 0,7. Игра не имеет седловой точки. 2. По формуле (16) находим: = р2 = 1 - p1=1-0,4=0,6 3. Цена игры v = a 11·р1+ a 21·р2=0,2·0,4+0,7·0,6=0,5 4. По формуле (17) находим ; q 2 = 1- q 1=1-0,5=0,5 5. Оптимальные стратегии А и В будут: S*A= Вывод. А должен в 40% всех случаях применять вооружение А1, а в 60% -вооружения А2. В должен в половине всех случаев применять помехи В1, а в половине - помехи В2. Если обе стороны, или, по крайней мере, одна из них, будут применять свои оптимальные стратегии, то вероятность выполнения боевой задачи будет равна v = 0,5.
Геометрическая интерпретация игры 2x2, игры 2x п. Пусть имеется игра 2x2 (таблица 17). Возьмём участок оси абсцисс длиной 1 и проведём через его концы А1 и А2 два перпендикуляра к оси абсцисс: ось I и II. На оси I будем откладывать выигрыш при стратегии А1 на оси II - выигрыш при стратегии А2. Рассмотрим стратегию противника В1 она даёт две точки на осях I и II с ординатами, соответственно, а 11 и а 21. Проведём через эти точки прямую B1B1. Рисунок 11 Очевидно, если мы при стратегии противника В1 будем применять смешанную стратегию, то наш средний выигрыш, равный в этом случае a 11p1+ a 21p2, изобразится точкой М на прямой В1В1; абсцисса этой точки равна р2. Прямую В1В1 изображающую выигрыш при стратегии В1 будем условно называть "стратегией В1". Очевидно, точно таким же образом может быть построена и стратегия В2.
Рисунок 12 Нам нужно найти оптимальную стратегию S *A, т.е. такую, для которой минимальный выигрыш (при любом поведении В) обращался бы в максимум. Для этого построим нижнюю границу выигрыша при стратегиях В1В2, т.е. ломаную B1NB2. Эта нижняя граница будет выражать минимальный выигрыш игрока А при любых его смешанных стратегиях; точка N, в которой этот минимальный выигрыш достигает максимума, и определяет решение и цену игры. Ордината точки N есть цена игры v, a её абсцисса равна р2 - частоте применения стратегии А2 в оптимальной смешанной стратегии SA [6]. В нашем случае решение игры определялось точкой пересечения стратегий. Однако, это не всегда будет так. На рисунке 13 показан случай, когда, несмотря на наличие пересечения стратегий, решение даёт для обоих игроков чистые стратегии А2 и В2, а цена игры v = a 22. Рисунок 13 В данном случае матрица имеет седловую точку, и стратегия А1 является заведомо невыгодной, т.к. при любой чистой стратегии противника она даёт меньший выигрыш, чем А2. В случае, когда заведомо невыгодная стратегия имеется у противника, геометрическая интерпретация имеет вид, представленный на рисунке 14. Рисунок 14 В данном случае нижняя граница выигрыша совпадает со стратегией В1 стратегия В2 для противника является заведомо невыгодной. Мы пришли к следующему графическому способу нахождения оптимальной стратегии: 1. построить линии стратегий В; 2. обвести нижнюю границу выигрыша; 3. найти на ней максимум, он будет равен цене игры v и разделит отрезок между точками А1 и А2 в отношении р2:р1. Оптимальную стратегию В можно найти, построив вместо нижней границы выигрыша верхнюю границу и на ней искать не максимум, а минимум. Игра 2хп. Совершенно аналогично может быть решена любая игра 2х п, где у нас имеются всего две стратегии, а у противника - произвольное число. Пусть мы располагаем двумя стратегиями: А1 и А2, а противник - " п " стратегиями: В1, В2,…, Вn. Матрица ║ ai j║ задана; она состоит из двух строк и " п " столбцов. Аналогично случаю двух стратегий дадим задаче геометрическую интерпретацию; " п " стратегий изобразятся " п " прямыми. Строим нижнюю границу выигрыша (ломаную B1MNB2) и находим на ней точку N с максимальной ординатой. Эта точка даёт решение игры (стратегию ); ордината точки N равна цене игры v, а абсцисса равна частоте р2 стратегии А2.
Рисунок 15 В данном случае оптимальная стратегия противника получается применением смеси двух "полезных" стратегий: В2 и В4, пересекающихся в точке N. Стратегия В3 является заведомо невыгодной, а стратегия В1 - невыгодной при оптимальной стратегии S *A. Если А будет придерживаться своей оптимальной стратегии, то выигрыш не изменится, какой бы из своих "полезных" стратегий ни пользовался В, однако, он изменится, если В перейдёт к стратегиям B1 или В3. В теории игр доказывается, что и любой конечной игры m x n имеется решение, в котором число "полезных" стратегий той и другой стороны не превосходит наименьшего из двух чисел m и n. В частности, из этого следует, что игры 2х п всегда имеют решение, в котором с той и другой стороны участвует не более двух "полезных" стратегий. Непосредственно по чертежу находим пару "полезных" стратегий противника Bj и Вк пересекающихся в точке N (если в точке N пересекается более двух стратегий, берём любые две из них). Мы знаем, что если игрок А придерживается своей оптимальной стратегии, то выигрыш не зависит от того, в какой пропорции применяет В свои "полезные" стратегии, следовательно, (16) Из этих уравнений и условия р2=1-р1, находим р1, р2 и цену игры v. Зная цену игры, можно сразу определить оптимальную стратегию игрока В. . Для этого решается, например, уравнение qj а 1 j + qk а 1 k=v, где qj + qk =1. В случае, когда мы располагаем m стратегиями, а противник - всего двумя, очевидно, задача решается совершенно аналогичным способом; достаточно заметить, что, изменяя знак выигрыша на обратный, можно превратить игрока А из "выигрывающегося" в "проигрывающегося". Можно решить игру и без перемены знака выигрыша; тогда задача решается непосредственно для В, но строится не нижняя, а верхняя граница выигрыша. На границе ищется точка N с минимальной ординатой, которая и есть цена игры v.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|