Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Выигрыш-функции игроков в антагонистической игре: области определения, области значений.




Степень удовлетворения интересов игрока А характеризуется функцией выигрыша игрока А , определенной на мн-ве Х= всех ситуаций и ставящей в соответствие каждой ситуации x X некоторое число FA (x) R, называемое выигрышем игрока А. (т.е. обл. определения это Х, обл. значения- R- мн-во действ. чисел).

Аналогично, для игрока В функция выигрыша FB:Y R определена на мн-ве Y= ситуаций y=(Bj,Ai) и каждой из них ставит в соответствие число FB(y) R, называемое выигрышем игрока В. (т.е. обл. определения это Y, обл. значения- R-мн-во действ. чисел).

В антагонистической игре выполняется: FA(x)=-FB(y).

56.=45

57. Определение выигрыш-функции в смешанных стратегиях: координатные и векторно-матричные формулы ее представления. (26 баллов) (=14)

58. Редуцирование игр, привести пример. (24 балла) (=81)

59. Понятие седловых точек действительной функции двух векторных аргументов. (20 баллов) (=95)

60. Показателем неэффективности стратегии Ai по критерию Байеса относительно рисков является средний риск:

этот показатель является взвешенным средним рисков i-й строки матрицы рисков с весами qj, j = 1,…, n.

Оптимальной среди чистых стратегий по критерию Байеса относительно рисков является стратегия Ai0, показатель неэффективности которой минимален, то есть минимален средний риск.

В качестве показателя неэффективности смешанной стратегии по критерию Байеса относительно рисков.

Оптимальной среди всех смешанных (в том числе и чистых) стратегий по критерию Байеса относительно рисков будем считать стратегию Р0, показатель неэффективности которой минимален.

61. Теорема. (Критерии оптимальных стратегий).

Пусть V-цена игры, H(P,Q) – выигрыш-функция, SA и SB – множества смешанных стратегий соответственно игроков А и В.

1. Для того чтобы стратегия РО игрока А была оптимальной, необходимо и достаточно, чтобы выполнялось неравенство:

H(PО,Q)≥V

Для любого Q ϵ SB, т.е. выбор игроком А оптимальной стратегии РО гарантирует ему выигрыш H(PО,Q), не меньший цены игры V, при любой стратегии Q игрока В.

2. Для того чтобы стратегия QO игрока В была оптимальной, необходимо и достаточно, чтобы выполнялось неравенство

H(PО,Q)≤V

Для любого Р ϵ SА , т.е. выбор игроком В оптимальной стратегии QО гарантирует ему проигрыш H(P,QО), не больший цены игры V, при любой стратегии Р игрока А.

Данная теорема остаётся справедливой, если в её формулировке множество смешанных стратегий SA и SB заменить соответственно на множество чистых стратегий SСA и SСB.

Доказательство:

Утверждение 1:

Необходимость:

Пусть Р0 оптимальная стратегия игрока А. тогда по теореме фон Неймана показатель эффективности стратегии Р0 равен цене игры V:

(1)

Рассматривая как показатель эффективности стратегии Р0 относительно множества S B смешанных стратегий игрока В, будем иметь по определению:

(2)

Из равенств (1) и (2) получаем неравенство H(PО,Q)≥V

Достаточность:

Пусть для некоторой стратегии Р0 игрока А выполняется неравенство H(PО,Q)≥V. Для доказательство оптимальности стратегии Р0 достаточность показать справедливость равенства

Так как неравенство выполняется для любой стратегии игрока В, то

(3)

Но цена игры V равна нижней цене игры V, по определению которой

(4)

Совокупность (3) и (4) эквивалентна равенству . Достаточность доказана

Утверждение 2:

АНАЛОГИЧНЫЕ РАССЖУДЕНИЯ.

62. Для того, чтобы существовала цена игры в чистых стратегиях, то есть для того, чтобы нижняя цена игры равнялась верхней цене игры необходимо и достаточно, чтобы у матрицы существовала седловая точка.

Седловая точка, это ситуация, при которой удовлетворяются интересы каждого из игроков А и В, то есть если выполняются неравенства или , где - нижняя цена игры(), а - верхняя цена игры(). Таким образом элемент является минимальным в -ой строке и максимальным в -ом столбце. При этом оптимальными чистыми стратегиями для игроков А и В будут стратегии обеспечивающие выигрыш игроку А и проигрыш игроку В.

63. Пусть имеем – игру с матрицей выигрышей А игрока А. Ситуация (A k, B l), сложившаяся в результате выбора игроками А и В соответственно стратегий A k и B l, , , называется удовлетворительной для игрока А, если

il kl, i =1,2,…, m

Ситуация (A k, B l) будет удовлетворительной для игрока А тогда, и только тогда, когда его выигрыш kl совпадает с показателем неэффективности l стратегии B l игрока В:

kl = l

т.е. будет максимальной в l -м столбце матрицы А.

64. Критерий Байеса относительно рисков при равновероятных состояниях природы, q1 =…= qn =1/n, превращается в критерий Лапласа относительно рисков. Тогда величина ij, получающаяся из i = q1ri1 + q2ri2 + …+qnrin = jrij, i=1,…,m при qj=1/n, j=1,2,…n, или более простая величина ij представляет собой показатель неэффективности стратегии Аi по критерию Лапласа относительно рисков. Следовательно, оптимальной среди чистых стратегий по критерию Лапласа относительно рисков является стратегия Aij , показатель неэффективности ioj который минимален.

Подставляя в (P) = jr(P,Пj) значения qj=1/n, j=1,…, n, получим показатель неэффективности смешанной стратегии Р по критерию Лапласа относительно рисков, вместо которого можно рассматривать более простую величину (P) = (P,Пj). Стратегия Р, для которой показатель (P) принимает минимальное значение, является оптимальной среди всех стратегий множества SA.

65.=39

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...