Показатели эффективности и неэффективности чистых стратегий игроков.
Решение игры в смешанных стратегиях.
Если нижняя V и верхняя цены игры в смешанных стратегиях совпадают, то их общее значение V — V = называется ценой игры в смешанных стратегиях. Нижняя и верхняя цены игры в чистых стратегиях и и цена игры в смешанных стратегиях V связаны между собой неравенствами < V< . Стратегии P° и Q° соответственно игроков А и В, удовлетворяющие равенствам V — а(Р°) = (Q°) (и тогда это общее значение очевидно равно Н(Р°, Q°)), называются оптимальными смешанными стратегиями соответственно игроков A и В. Таким образом, оптимальные смешанные (в частности, чистые) стратегии Р° и Q0 соответственно игроков А и В обладают тем свойством, что если один из игроков придерживается своей оптимальной стратегии, то противнику невыгодно отклоняться от своей оптимальной стратегии. Множества оптимальных смешанных стратегий соответственно игроков А и В обозначим через (SA)° и (SB)°. Полным решением игры в смешанных стратегиях называется трехэлементная совокупность {(SA)°,(SB)°, V}. Любая пара оптимальных стратегий Р° и Q0 соответственно игроков А и В и цена игры в смешанных стратегиях V образуют частное решение в смешанных стратегиях.
Теорема 1. (Основная теорема матричных игр Дж. фон Неймана.) Любая матричная игра имеет решение в смешанных стратегиях, т.е. существуют цена игры в смешанных стратегиях V и оптимальные смешанные стратегии Р° и Q0 соответственно игроков А и В, т.е.
V = V = max (Р)= = min (Q) = (Р°) = (Q°) = Н(Р°, Q°).
Теорема 2. (Свойство равнозначности седловых точек.) Если (х ', у') и (х", у") — седловые точки функции f (x, у) на декартовом произведении Х x Y, то значения данной функции в этих точках совпадают: f (x', у') = f (x",y").
Теорема 3. (Свойство взаимозаменяемости седловых точек.) Если (х', у') и (х", у") — седловые точки функции f(x, у) на декартовом произведении Х x Y, то (х', у") и (х", у') — также седловые точки функции / (х, у) на множестве X x Y.
Теорема 4. (Критерий существования седловой точки.) Для того чтобы функция f (х, у), х X, у Y, имела седловую точку на декартовом произведении X x Y, необходимо и достаточно, чтобы существовали
max inf f(x,у) и min sup f(x,у) и выполнялось их равенство max inf f(x,у) = min sup f(x,у)
Теорема 5. Если множества X Rm и Y Rn — выпуклые компакты, а функция f(x, у) непрерывна по совокупности переменных (х, у) X x Y u вогнуто-выпукла (выпукло-вогнута) на X xУ, то у нее на декартовом произведении X x Y существуют седловые точки. Определение и существование показателя эффективности смешанной стратегии игрока А относительно множеств смешанных и чистых стратегий игрока В. Теорема 1. Для каждой смешанной (в частности, чистой) стратегии Р е SA игрока А существует (достигается)
a(P;SB) = min H(P,Q).
Для каждой смешанной (в частности, чистой) стратегии Q SB игрока В существует (достигается)
(Q;SA) = max H(P,Q).
Число а(Р; SB) называется показателем эффективности смешанной стратегии Р SA игрока А относительно множества SB смешанных стратегий игрока В.
Число а(Р; ) = min Н(Р, Q) = minH(P, Вj)
называется показателем эффективности смешанной стратегии Р SA игрока А относительно множества чистых стратегий игрока В. В частности, если Р = Аi — чистая стратегия, то а( ; ) = — показатель эффективности чистой стратегии (относительно множества чистых стратегий игрока В).
Теорема 2 (НЕ НУЖНО). Показатели эффективности любой смешанной (в частности, чистой) стратегии Р SA игрока А относительно множесте и SB соответственно чистых и смешанных стратегий противника В равны: а(Р; )= а(Р; )
Показатели эффективности и неэффективности чистых стратегий игроков. Рассмотрим матричную [ m х n ] - игру с игроками А и В, задаваемую матрицей выигрышей A. Показателем эффективности стратегии A i назовем минимальный выигрыш при этой стратегии (т.е. минимальный элемент i -й строки матрицы A):
Максимином, или нижней ценой игры в чистых стратегиях, называется наибольший из показателей эффективности стратегий Аi, i = 1, 2,..., т,
Стратегия Ak, показатель эффективности которой совпадает с максимином ак = а, называется максиминной стратегией игрока А. Множество всех (чистых) максиминных стратегий игрока А обозначим через . Принцип выбора игроком А максиминной стратегии в качестве эффективной называется максиминным принципом. Если игрок А придерживается максиминного принципа выбора стратегий, то ему при любой игре противника В гарантирован выигрыш в чистых стратегиях, не меньший максимина а. Показателем неэффективности стратегии Bj назовем максимальный проигрыш игрока В при этой стратегии (т.е. максимальный элемент j -го столбца матрицы А): Минимаксом, или верхней ценой игры в чистых стратегиях, называется наименьший из показателей неэффективности стратегий Bj, j = 1,2,..., п:
Стратегия , показатель неэффективности которой совпадает с минимаксом , называется минимаксной стратегией игрока В. Множество всех (чистых) минимаксных стратегий игрока В обозначим через . Принцип выбора игроком В минимакснои стратегии в качестве эффективной называется минимаксным принципом. Если игрок В придерживается минимаксного принципа выбора стратегий, то он при любой игре противника А не может проиграть больше мини- макса .
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|