Выигрыш-функции игроков в антагонистической игре: области определения, области значений.
⇐ ПредыдущаяСтр 7 из 7 Степень удовлетворения интересов игрока А характеризуется функцией выигрыша игрока А , определенной на мн-ве Х= всех ситуаций и ставящей в соответствие каждой ситуации x X некоторое число FA (x) R, называемое выигрышем игрока А. (т.е. обл. определения это Х, обл. значения- R- мн-во действ. чисел). Аналогично, для игрока В функция выигрыша FB:Y R определена на мн-ве Y= ситуаций y=(Bj,Ai) и каждой из них ставит в соответствие число FB(y) R, называемое выигрышем игрока В. (т.е. обл. определения это Y, обл. значения- R-мн-во действ. чисел). В антагонистической игре выполняется: FA(x)=-FB(y). 56.=45 57. Определение выигрыш-функции в смешанных стратегиях: координатные и векторно-матричные формулы ее представления. (26 баллов) (=14) 58. Редуцирование игр, привести пример. (24 балла) (=81) 59. Понятие седловых точек действительной функции двух векторных аргументов. (20 баллов) (=95) 60. Показателем неэффективности стратегии Ai по критерию Байеса относительно рисков является средний риск: этот показатель является взвешенным средним рисков i-й строки матрицы рисков с весами qj, j = 1,…, n. Оптимальной среди чистых стратегий по критерию Байеса относительно рисков является стратегия Ai0, показатель неэффективности которой минимален, то есть минимален средний риск. В качестве показателя неэффективности смешанной стратегии по критерию Байеса относительно рисков. Оптимальной среди всех смешанных (в том числе и чистых) стратегий по критерию Байеса относительно рисков будем считать стратегию Р0, показатель неэффективности которой минимален. 61. Теорема. (Критерии оптимальных стратегий). Пусть V-цена игры, H(P,Q) – выигрыш-функция, SA и SB – множества смешанных стратегий соответственно игроков А и В.
1. Для того чтобы стратегия РО игрока А была оптимальной, необходимо и достаточно, чтобы выполнялось неравенство: H(PО,Q)≥V Для любого Q ϵ SB, т.е. выбор игроком А оптимальной стратегии РО гарантирует ему выигрыш H(PО,Q), не меньший цены игры V, при любой стратегии Q игрока В. 2. Для того чтобы стратегия QO игрока В была оптимальной, необходимо и достаточно, чтобы выполнялось неравенство H(PО,Q)≤V Для любого Р ϵ SА , т.е. выбор игроком В оптимальной стратегии QО гарантирует ему проигрыш H(P,QО), не больший цены игры V, при любой стратегии Р игрока А. Данная теорема остаётся справедливой, если в её формулировке множество смешанных стратегий SA и SB заменить соответственно на множество чистых стратегий SСA и SСB. Доказательство: Утверждение 1: Необходимость: Пусть Р0 – оптимальная стратегия игрока А. тогда по теореме фон Неймана показатель эффективности стратегии Р0 равен цене игры V: (1) Рассматривая как показатель эффективности стратегии Р0 относительно множества S B смешанных стратегий игрока В, будем иметь по определению: (2) Из равенств (1) и (2) получаем неравенство H(PО,Q)≥V Достаточность: Пусть для некоторой стратегии Р0 игрока А выполняется неравенство H(PО,Q)≥V. Для доказательство оптимальности стратегии Р0 достаточность показать справедливость равенства Так как неравенство выполняется для любой стратегии игрока В, то (3) Но цена игры V равна нижней цене игры V, по определению которой (4) Совокупность (3) и (4) эквивалентна равенству . Достаточность доказана Утверждение 2: АНАЛОГИЧНЫЕ РАССЖУДЕНИЯ. 62. Для того, чтобы существовала цена игры в чистых стратегиях, то есть для того, чтобы нижняя цена игры равнялась верхней цене игры необходимо и достаточно, чтобы у матрицы существовала седловая точка. Седловая точка, это ситуация, при которой удовлетворяются интересы каждого из игроков А и В, то есть если выполняются неравенства или , где - нижняя цена игры(), а - верхняя цена игры(). Таким образом элемент является минимальным в -ой строке и максимальным в -ом столбце. При этом оптимальными чистыми стратегиями для игроков А и В будут стратегии обеспечивающие выигрыш игроку А и проигрыш игроку В.
63. Пусть имеем – игру с матрицей выигрышей А игрока А. Ситуация (A k, B l), сложившаяся в результате выбора игроками А и В соответственно стратегий A k и B l, , , называется удовлетворительной для игрока А, если il kl, i =1,2,…, m Ситуация (A k, B l) будет удовлетворительной для игрока А тогда, и только тогда, когда его выигрыш kl совпадает с показателем неэффективности l стратегии B l игрока В: kl = l т.е. будет максимальной в l -м столбце матрицы А. 64. Критерий Байеса относительно рисков при равновероятных состояниях природы, q1 =…= qn =1/n, превращается в критерий Лапласа относительно рисков. Тогда величина ij, получающаяся из i = q1ri1 + q2ri2 + …+qnrin = jrij, i=1,…,m при qj=1/n, j=1,2,…n, или более простая величина ij представляет собой показатель неэффективности стратегии Аi по критерию Лапласа относительно рисков. Следовательно, оптимальной среди чистых стратегий по критерию Лапласа относительно рисков является стратегия Aij , показатель неэффективности ioj который минимален. Подставляя в (P) = jr(P,Пj) значения qj=1/n, j=1,…, n, получим показатель неэффективности смешанной стратегии Р по критерию Лапласа относительно рисков, вместо которого можно рассматривать более простую величину (P) = (P,Пj). Стратегия Р, для которой показатель (P) принимает минимальное значение, является оптимальной среди всех стратегий множества SA. 65.=39
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|