Выигрыш-функции игроков в антагонистической игре: области определения, области значений.
⇐ ПредыдущаяСтр 7 из 7 Степень удовлетворения интересов игрока А характеризуется функцией выигрыша игрока А Аналогично, для игрока В функция выигрыша FB:Y В антагонистической игре выполняется: FA(x)=-FB(y). 56.=45 57. Определение выигрыш-функции в смешанных стратегиях: координатные и векторно-матричные формулы ее представления. (26 баллов) (=14) 58. Редуцирование игр, привести пример. (24 балла) (=81) 59. Понятие седловых точек действительной функции двух векторных аргументов. (20 баллов) (=95) 60. Показателем неэффективности стратегии Ai по критерию Байеса относительно рисков является средний риск:
Оптимальной среди чистых стратегий по критерию Байеса относительно рисков является стратегия Ai0, показатель неэффективности которой минимален, то есть минимален средний риск. В качестве показателя неэффективности смешанной стратегии Оптимальной среди всех смешанных (в том числе и чистых) стратегий по критерию Байеса относительно рисков будем считать стратегию Р0, показатель неэффективности которой минимален. 61. Теорема. (Критерии оптимальных стратегий). Пусть V-цена игры, H(P,Q) – выигрыш-функция, SA и SB – множества смешанных стратегий соответственно игроков А и В.
1. Для того чтобы стратегия РО игрока А была оптимальной, необходимо и достаточно, чтобы выполнялось неравенство: H(PО,Q)≥V Для любого Q ϵ SB, т.е. выбор игроком А оптимальной стратегии РО гарантирует ему выигрыш H(PО,Q), не меньший цены игры V, при любой стратегии Q игрока В. 2. Для того чтобы стратегия QO игрока В была оптимальной, необходимо и достаточно, чтобы выполнялось неравенство H(PО,Q)≤V Для любого Р ϵ SА , т.е. выбор игроком В оптимальной стратегии QО гарантирует ему проигрыш H(P,QО), не больший цены игры V, при любой стратегии Р игрока А. Данная теорема остаётся справедливой, если в её формулировке множество смешанных стратегий SA и SB заменить соответственно на множество чистых стратегий SСA и SСB. Доказательство: Утверждение 1: Необходимость: Пусть Р0 – оптимальная стратегия игрока А. тогда по теореме фон Неймана показатель эффективности
Рассматривая
Из равенств (1) и (2) получаем неравенство H(PО,Q)≥V Достаточность: Пусть для некоторой стратегии Р0 игрока А выполняется неравенство H(PО,Q)≥V. Для доказательство оптимальности стратегии Р0 достаточность показать справедливость равенства Так как неравенство выполняется для любой стратегии
Но цена игры V равна нижней цене игры V, по определению которой
Совокупность (3) и (4) эквивалентна равенству Утверждение 2: АНАЛОГИЧНЫЕ РАССЖУДЕНИЯ. 62. Для того, чтобы существовала цена игры в чистых стратегиях, то есть для того, чтобы нижняя цена игры равнялась верхней цене игры необходимо и достаточно, чтобы у матрицы существовала седловая точка. Седловая точка, это ситуация, при которой удовлетворяются интересы каждого из игроков А и В, то есть если выполняются неравенства
63. Пусть имеем
Ситуация (A k, B l) будет удовлетворительной для игрока А тогда, и только тогда, когда его выигрыш
т.е. будет максимальной в l -м столбце матрицы А. 64. Критерий Байеса относительно рисков при равновероятных состояниях природы, q1 =…= qn =1/n, превращается в критерий Лапласа относительно рисков. Тогда величина Подставляя в 65.=39
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|