Решение игры в чистых стратегиях
Пусть дана матрица игры (игра в нормальной записи):
где A и B – участники игры. Участник A выбирает стратегию. Понятие наилучшего (оптимального) решения является сложным понятием. Для того, чтобы утверждать, что какое-то решение является оптимальным, нужно знать, что именно мы понимаем под словом «оптимальный». Например, фирма, при выборе своих управленческих решений, может руководствоваться следующими соображениями: § максимизация прибыли; § минимизация издержек; § завоевать место на рынке; § стремиться к минимизации хозяйственных рисков; § и др. Каждое из этих соображений приводит к определенному критерию оптимальности. Решения, которые оптимальны с точки зрения одного критерия, могут быть неоптимальными с точки зрения другого. Например, если фирма выбрала в качестве критерия оптимальности принцип достижения наибольшей прибыли, то может оказаться, что решение, которое обеспечивает наибольшую прибыль, приводит к появлению высоких хозяйственных рисков. Одним из критериев оптимальности является критерий гарантированного результата. Этот критерий заключается в том, что наилучшим решением (оптимальной стратегией) будет такое решение, которое даёт игроку определённый (гарантированный) выигрыш (или проигрыш) независимо от действий других участников игры. В соответствии с критерием гарантированного результата игрок A для каждой своей стратегии
Игрок B для каждой стратегии Значение
Теорема 1. Для любой матричной игры выполняется неравенство
То есть нижняя цена игры не больше чем верхняя цена игры. Доказательство. Зафиксируем значение i=1,2…,m и найдем наименьший элемент строки {ai1, ai2, …, ain}, который обозначим ail(i). Таким образом
Обозначим akl(k) наибольшее из чисел {a1l(1), a2l(2),…, aml(m)}, тогда akl(k)= Зафиксируем значение j=1,2…,n и найдем наибольший элемент столбца {a1j, a2j, …, amj}, который обозначим ap(j)j. Таким образом ap(j)j = Обозначим ap(q)q наименьшее из чисел { ap(1)1, ap(2)2,…, ap(n)n }, тогда ap(q)q = Из (1.3) следует неравенство ail(i)≤aij, верное для всех i=1.2….,m и j=1.2…,n. Подставляя в него i=k, получим неравенство α=akl(k)≤akj (1.7) Из (1.5) следует неравенство ap(j)j≥aij, верное для всех i=1.2….,m и j=1.2…,n. Подставляя в него i=k, получим неравенство ap(j)j≥akj. Итак получаем α=akl(k)≤akj≤ ap(j)j≤ ap(q)q=β, что и требовалось доказать. Если первый игрок стремится получить гарантированный результат, то он выбирает из своего множества стратегий стратегию k, для которой наименьшее значение выигрыша равно нижнему значению игры α. Тогда при любом выборе вторым игроком стратегии j будет верно неравенство aij≥ α, то есть α является гарантированным выигрышем первого игрока.
Аналогично, если второй игрок стремится получит гарантированный результат, то он выберет стратегию q, для которой наибольшее значение проигрыша будет равно верхнему значению игры β. Тогда при любом выборе первым игроком стратегии i будет верно неравенство aij≤β, то есть β является гарантированным верхним значением проигрыша второго игрока. Будет ли исход игры, реализующийся при стратегиях k и q, равновесным зависит от того, равны или нет числа α и β. Если верхняя цена равна нижней цены игры, т.е. выполняется равенство:
то число Пусть платёжная матрица удовлетворяет уравнению (1.8). Это значит, что существует её элемент alk, для которого верно равенство
Исход Теорема 2. Если один участник игры выбирает свою оптимальную (максиминную/минимаксную) стратегию, то лучшим выбором для другого участника будет своя (минимаксная/максиминная) стратегия. Доказательство. Пусть игрок A выбрал свою оптимальную стратегию Итак, если платёжная матрица имеет седловую точку, то ни одному участнику игры не выгодно в одностороннем порядке отказываться от своей оптимальной (максиминной/минимаксной) стратегии. Другими словами в cедловой точке наблюдается баланс интересов, поэтому эту точку называют точкой равновесия. Если платёжная матрица имеет седловую точку, то: 1) Игрок A имеет оптимальную максиминную стратегию; 2) Игрок B имеет минимаксную стратегию; 3) Применение оптимальных стратегий даёт ситуацию равновесия, которая оказывается равновесием в чистых стратегиях. 4) Игра имеет решение
Пример. Найти решение игры.
Решение. Игрок A руководствуясь принципом гарантированного результата. Для этого он в каждой строке ищет минимальный элемент, затем максимальное значение в полученном столбце минимумов
Игрок B:
Если верхняя и нижняя цены игры принимают различные значения, то согласно теореме 1 справедливо строгое неравенство α<β. В этом случае применение первым игроком максиминной стратегии дает возможность второму игроку сделать свой проигрыш меньшим, чем число β, если он откажется от минимаксной стратегии. И наоборот, применение вторым игроком минимаксной стратегии дает возможность первому игроку сделать выигрыш большим, чем число α, если он откажется от максиминной стратегии. Тогда исход, который реализуется при максиминной и минимаксной стратегиях, не будет равновесным. Других равновесных исходов также не существует, следовательно игра без седловой точки не имеет решения в чистых стратегиях. Пример. Найти решение игры.
Решение. Пример. В платёжной матрице найти точку равновесия.
Точкой равновесия будет являться точка 6. Пример. Посёлок Паново состоит из одной улицы. Два предпринимателя решили разместить свои киоски с продовольственными товарами. Других продовольственных магазинов в посёлке нет. Будем считать, что: 1. Оба киоска продают один и тот же ассортимент товаров по одним и тем же ценам; 2. Плотность жителей равномерно распределена по длине улицы. Найти положение киосков, исходя из того, что каждый предприниматель стремится к наибольшей выручке. Решение. Возьмём длину улицы за 1, тогда весь посёлок расположится на отрезке Рисунок 1
Обозначим x – координата первого киоска; y – координата второго киоска. Очевидно, что Найдём выручку X первого киоска. Цену товара возьмём за 1.
Первый предприниматель решает задачу а второй соответственно Таким образом, получаем игру с постоянной суммой, равной 1. Применим принцип гарантированного результата. Первый предприниматель ожидает, что второй будет выбирать такое значение y, чтобы выручка первого была минимальной, то есть он исходит из пессимистических ожиданий: 1-й выбирает такой x, чтобы:
2-й выбирает такой y, чтобы: Найдём оптимальные стратегии: Аналогично Таким образом, лучшими стратегиями будет размещение киосков на середине улицы спиной друг к другу. Это равновесие не выгодно жителям посёлка, но обеспечивает равновесие между предпринимателями. В примере два конкурента фактически борются за долю, превышающую
где если Равновесие:
Смешанное расширение игры Пусть матричная игра представлена платежной матрицей с элементами aij, где i=1,2,…,m – стратегии первого игрока, j=1,2,…,n – стратегии второго игрока. Данные стратегии игроков будем называть чистыми стратегиями. В предыдущем параграфе мы доказали, что решение матричной игры в чистых стратегиях (т.е. при выборе каждым игроком одной и только одной стратегии из заданного множества его стратегий) существует тогда и только тогда, когда платежная матрица имеет седловую точку. Рассмотрим выбор стратегий в игре без седловой точки. Если игрок может предвидеть, какую из чистых стратегий изберёт противник, он может найти наилучший ответ на ход противника. Таким образом, каждый игрок заинтересован в том, чтобы его ходы были непредсказуемы. Для этого необходимо ввести в выбор стратегий элемент случайности. Однако отсутствие логики при выборе стратегий ухудшит положение каждого из игроков. Компромисс заключается в том, что игроки чередуют (смешивают) свои стратегии случайным образом, но по определённой разумной схеме. Этой схеме должна соответствовать комбинация чистых стратегий. Введем следующие изменения правил игры: каждый игрок наряду с отдельными стратегиями из своего множества стратегий может применять их комбинации, в которых стратегии представлены в определенных пропорциях. Рассмотрим матричную игру, представленную Таблицей 5. Таблица 5
где
Вектор
Аналогично второй игрок чередует (смешивает) свои стратегии так, чтобы: Стратегия 1 имела частоту (вероятность) Стратегия 2 имела частоту (вероятность)
Стратегия n имела частоту (вероятность) Вектор
Возможность применять наряду со стратегиями Множества смешанных стратегий 1-го и 2-го игроков представляют собой соответственно:
Очевидно, что чистые стратегии игроков входят как элементы в множество их смешанных стратегий. Пусть первый игрок выбрал некоторую смешанную стратегию x, а второй – y. Тогда каждый исход Для каждой пары смешанных стратегий x€X и y€Y можно найти среднее значение выигрыша, которое мы обозначим
Легко проверить, что функция H(x,y) двух векторных переменных x и y будет непрерывна на компактном множестве Sx х Sy. Очевидно, что первый игрок заинтересован в том, чтобы платёж Число Теорема 3. Нижнее значение игры в смешанных стратегиях меньше или равно верхнему значению игры в смешанных стратегиях, т.е. справедливо неравенство
Доказательство Зафиксируем смешанную стратегию x из множества Sx и обозначим H(x,y(x)) наименьшее значение функции H(x,y) на компактном ограниченном множестве Sy. Тогда для всех x из Sx и y из Sy выполняется неравенство H(x,y(x))≤ H(x,y) (1.11) В соответствии с определением нижнее значение игры будет равно
где x* - максиминная стратегия 1-го игрока. Подставляя в неравенство (1.11) x=x*, получим H(x*,y(x*))≤H(x*,y), и с учетом (1.12), получим неравенство
Зафиксируем смешанную стратегию y из множества Sy и обозначим H(x(y),y) наибольшее значение функции H(x,y) на компактном ограниченном множестве Sx. Тогда для всех x из Sx и y из Sy выполняется неравенство H(x(y),y)≥ H(x,y) (1.14) В соответствии с определением нижнее значение игры будет равно
где y* - минимаксная стратегия 2-го игрока. Подставляя в неравенство (1.14) y= y*, получим H(x(y*),y*)≥H(x,y*), с учетом (1.15), получим неравенство
верное для всех x из Sx. Подставляя в неравенство (1.13) y= y*, и в неравенство (1.16) x=x*, получим неравенства
откуда следует
Теорема доказана. В соответствии с принципом гарантированного результата первый игрок ищет максиминную стратегию Аналогично, второй игрок ищет минимаксную стратегию Для того, чтобы применение стратегий
т.е., чтобы исход
то есть необходимо и достаточно, чтобы нижнее значение игры было равно верхнему значению игры
Примем без доказательства теорему 4. Теорема 4. В любой матричной игре нижнее значение игры в смешанных стратегиях равно верхнему значению игры в смешанных стратегиях, т.е. Теорема (4) доказывает существование решения матричной игры в смешанных стратегиях. Число v называется значением игры в смешанных стратегиях. Равновесные стратегии Совокупность v (значение игры) и Решение игры обладает следующими свойствами: Свойство 1. Пусть Доказательство. По определению α≤ai~j (1.23) Возьмем произвольную смешанную стратегию y={ y1, y2,…, yn} из Sy. тогда справедливо α≤∑ai~j yj (1.24) Введем вектор x~={x~1, x~2,…, x~m}, где x~i=1, если i= i~ и x~i=0, если i ≠ i~. Вектор x~ удовлетворяет свойствам смешанной стратегии, поэтому положим, что x~ принадлежит множеству Sx. Преобразуем правую часть неравенства (1): ∑ai~j yj=∑∑ai~j x~i yj =Η(x~,y) Тогда из неравенства (1.24) следует, что для любой смешанной стратегии y из Sy справедливо неравенство α≤ Η(x~,y) (1.25) По определению
В неравенство (1.25) подставим y= y(x~), получим α≤ Η(x~, y(x~) (1.27) Из неравенств (1.26) и (1.27) следует
Свойство 2. Пусть Доказывается аналогично свойству 1. Свойство 3. Нижняя чистая цена игры и верхняя чистая цена игры ограничивают значение сверху и снизу значение игры в смешанных стратегиях: Доказательство следует из теоремы (4) и свойств (1) и (2). Свойство 4. Если матричная игра имеет равновесие в чистых стратегиях, то чистое значение игры Доказательство следует из свойства (3). В случае, когда матричная игра имеет седловую точку, оптимальная смешанная стратегия первого игрока
И оптимальная смешанная стратегия 2-го игрока будет иметь вид
Таким образом, равновесия в чистых стратегиях является частным случаем равновесия в смешанных стратегиях. 5. Теорема об активных стратегиях. Стратегия i первого игрока называется его активной стратегией, если в оптимальной стратегии Теорема 5. Если один из участников игры применяет свою оптимальную стратегию, то ожидаемый выигрыш останется неизменным и равным v независимо от характера действий другого участника игры в пределах его активных стратегий. Доказательство. Обозначим
С другой стороны, по определению значение игры будет равно Таким образом, получаем систему
Это условие может выполняться только в случае, когда Теорема доказана.
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|