Игра в смешанных стратегиях
ТЕОРИЯ ИГР И ПРИНЯТИЯ РЕШЕНИЙ ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ИГР При решении задач экономики и последующего принятия решения приходится учитывать множество факторов различного характера, причем эти факторы обладают свойствами неопределенности. Следовательно, результат принятия решения будет также составлять неопределенность. Например, количество проданных товаров в значительной степени зависит от спроса населения на тот или иной товар. Спрос является величиной случайной и зависит от многих факторов, которые являются неопределенными. В процессе поиска принятия решений появляются многочисленные варианты, которые приходится рассматривать, чтобы выбрать наилучший из числа имеющихся. С этой целью необходимо проводить количественный анализ и на его основе принимать обоснованное решение. Для обоснования принятия решений в условиях неопределенности разработаны специальные математические методы и модели. Задачи принятия решений в условиях полной или частичной неопределенности решаются с помощью теории игр и статистических решений. Теория игр — математическая (модель) теории конфликтных ситуаций, занимается принятием решений в этих ситуациях двумя или более противниками, каждый из которых стремится оптимизировать свои решения за счет других. Игра — это совокупность правил, определяющих сущность конфликтной ситуации, которые устанавливают: а) выбор способа действия игроками на каждом этапе игры; б) информацию, которой обладает каждый игрок при выполнении таких выборов; в) плату для каждого игрока после завершения любого этапа игры. Основными понятиями теории игр являются: конфликтующие стороны, называемые игроками, одна реализация игры — партией и набор еe возможных конечных состояний, называемых исходом игры, — это Выигрыш, ничья или проигрыш. Игрокам (участникам игры) известны Платежи в виде матрицы А = { aik }.
Развитие игры во времени проходит последовательно по этапам (ходам). Ходом в теории игр называется выбор одного из правил действия, предусмотренных игрой, и его реализацию. Ходы бывают личные и случайные. Личным ходом называют сознательный выбор игроком одного из вариантов действия и его осуществление. Случайным ходом называют выбор, выполняемый не волевым решением игрока, а каким-либо способом случайного выбора, например, бросание монеты, сдача карт, вращение барабана рулетки и т.д. Одним из основных показателей теории игр является стратегия. Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе этого игрока от начала до окончания игры. Оптимальной называется такая стратегия игрока, которая при многократном проведении игры обеспечивает игроку максимально возможный средний выигрыш или минимально возможный средний проигрыш. В зависимости от причин, вызывающих неопределенность исходов, игры делят на основные группы: 1. Комбинаторные игры, в которых правила позволяют каждому игроку проанализировать все разнообразные ходы и выбрать тот из них, который ведет к лучшему исходу для этого игрока. Неопределенность исхода связана с тем, что количество ходов слишком велико и практически игрок не в состоянии их перебрать и проанализировать. К таким играм относятся шахматы, шашки и др. 2. Азартные игры — это игры, источником неопределенности которых являются случайные факторы. Эти игры состоят из случайных ходов, при анализе которых применяется теория вероятностей. К ним относятся рулетка, игра в кости, отгадывание стороны выпадения монеты и т.д.
3. Стратегическими играми являются такие, в которых неопределенность исхода вызвана тем, что каждый из игроков, принимая решение о выборе предстоящего хода, не знает, какой стратегии будут придерживаться другие участники игры. Такие игры изучает теория игр. В игре могут сталкиваться интересы двух или более игроков. Если в игре участвуют два игрока, то игра называется парной, если число игроков больше двух, то она называется множественной. Различают игры по сумме выигрыша. Игра называется с нулевой суммой, если один игрок выигрывает за счет другого, а сумма выигрыша одного равна проигрышу другого. Парная игра с нулевой суммой называется антагонистической, так как интересы игроков прямо противоположны. Наиболее полно исследованы в теории игр антагонистические игры. В зависимости от количества возможных стратегий игры делятся на конечные и бесконечные. Игра называется конечной, если у каждого игрока имеется только конечное число стратегий. Игра называется бесконечной, если хотя бы у одного игрока имеется бесконечное число стратегий. По количеству ходов, которые выполняют игроки для достижения определенных целей, игры бывают одношаговые и многошаговые. Одношаговые игры состоят в том, что игрок делает один ход. В многошаговых — игроки выполняют последовательно ряд ходов согласно правилам игры. ПОСТАНОВКА ИГРОВЫХ ЗАДАЧ Основными вопросами теории игр являются: 1. Какие свойства стратегий следует считать признаками оптимальности. 2. Существуют ли стратегии игроков, которые обладали бы свойствами оптимальности. 3. Как определить оптимальные стратегии, если они существуют. Рассмотрим игру двух лиц с нулевой суммой. Пусть игра состоит из двух ходов: игрок I выбирает стратегию Аi а игрок II — стратегию Вк, а выигрыши
Если Пусть функция B1 B2 … Bk … Bn
(9.2) Строки матрицы А соответствуют стратегии Аi, столбцы — стратегии Вk. Матрица А называется платежной или матрицей игры. Элемент aik платежной матрицы А является выигрышем игрока I, если он выбрал стратегию Аi, а игрок II принял стратегию Вк. Стратегии Аi и В называются чистыми стратегиями игроков.
Пусть игрок I выбирает некоторую стратегию Аi, тогда в худшем случае (например, игроку II известен выбор этой стратегии). Он получит выигрыш, равный min aik, то есть минимальному элементу в строке i платежной матрицы А. Учитывая такое положение, игроку I необходимо выбрать такую стратегию, чтобы максимизировать минимальный выигрыш: (9.3)
Величина α называется нижней ценой игры, которая обеспечивает гарантированный выигрыш игрока I. Стратегия Аi обеспечивающая получение такого выигрыша называется максиминной. Игрок II при выборе стратегии Вк проиграет не более максимального значения из элементов k-го столбца, то есть величина проигрыша не больше max aik Игрок II выберет такую величину, которая максимальный проигрыш β минимизирует, то есть (9.4)
Величина Пусть выигрыш игрока I будет V, тогда его значение ограничено нижней и верхней ценами игры, то есть
(9.5) Если же значение
(9.6) то выигрыш игрока I составляет определенную величину и игра называется вполне определенной, а выигрыш (9.6) называется значением игры и равен элементу Вполне определенные игры называют также играми с седловой точкой или играми в чистых стратегиях. Элемент Пример 9.1 Определить нижнюю и верхнюю цены игры, оптимальные стратегии игроков и цену игры, если платежная матрица представлена в виде:
Для матрицы А введем обозначения чистых стратегий.
i то есть для i Определяем нижнюю цену игры и верхнюю цену игры Так как Оптимальной стратегией игрока I является первая чистая стратегия A1, элементы которой соответствуют первой строке платежной матрицы А, то есть А1 = (5, 6, 4, 3). Оптимальной стратегией для игрока II будет чистая стратегия В4 с элементами четвертого столбца матрицы А, то есть В4 = = (3, 2, 1, 0). Ответ: А1 = (5, 6,4, 3), В4 = (3, 2, 1,0) и α= β = V = 3. Пример 9.2 Определить нижнюю и верхнюю цены игры, если платежная матрица А задана в виде:
Так как Ответ: ИГРА В СМЕШАННЫХ СТРАТЕГИЯХ Если платежная матрица не имеет седловой точки, то цена игры V определяется условием (9.5), то есть игрок I обеспечит выигрыш не меньше Чистые стратегии игроков в их оптимальных смешанных стратегиях называются активными. Теорема 1. Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш (или минимальный средний проигрыш), равный цене игры V независимо от действий другого игрока, лишь бы он придерживался своих активных стратегий. Теорема 2. Теорема Дж. фон Неймана (основная теорема теории игр). Каждая конечная матричная игра имеет по крайней мере оптимальное решение в смешанных стратегиях. Следствие. Каждая конечная игра имеет цену, величина которой является математическим ожиданием выигрыша I игрока и проигрыша игрока II. Выигрыш — V называется ценой игры и соответствует оптимальному решению. Смешанные стратегии для соответствующих игроков I и II — S: и S2 обозначают:
(9.7) (9.8) где Ai и Вк — чистые стратегии игроков I и II соответственно,
(9.9) Вероятности применения соответствующих стратегии игроками I и II, причем:
Зная платежную матрицу А, можно определить средний выигрыш (математическое ожидание) М (А, X, Y):
(9.10) Решить матричную игру — это означает определить цену игры V и оптимальные стратегии, то есть
Рассмотрим конечную игру, матрица которой имеет размер 2x2, то есть
(9.11) Определить оптимальные стратегии игроков I и II и соответствующие им вероятности для матрицы (9.11), то есть
Для игрока I получаем систему уравнений
(9.12) Для игрока II система имеет вид:
(9.13) Если Решая системы уравнений (9.12) и (9.13), находим вероятности X и У в виде:
(9.14) Пример 9.3 Дана платежная матрица А:
Найти решение игры, то есть определить оптимальные стратегии игроков и цену игры. Решение 1. Определяем нижнюю и верхнюю цены игры:
Так как 2. Определяем решение в смешанных стратегиях, вычисляя вероятности применения соответствующих стратегий игроками I и II. Запишем системы уравнений:
для игрока I
для игрока II
Решая эти системы, находим вероятности: Ответ:
При решении игровых задач платежные матрицы в большинстве случаев имеют размерность т х п, в которых Дублирующими называются стратегии, которым соответствует одинаковые значения элементов в платежной матрице, то есть матрица содержит одинаковые строки (столбцы). Если в платежной матрице элементы строки Аj, не меньше соответствующих элементов строки Aj, то строка Аi,- называется доминирующей, а строка Аj - — доминируемой. Аналогично можно определить доминирующий и доминируемый столбцы. Игроку I невыгодно применять стратегии, которым соответствуют доминируемые строки. Игроку II невыгодно применять стратегии, которым соответствуют доминирующие столбцы. При решении матричных игр можно сокращать размерность матриц, исключая из нее доминируемые строки и доминирующие столбцы, если такие имеются. Для упрощения вычислений можно выполнить преобразование платежной матрицы, при котором не изменяются значения вероятностей смешанных стратегий. Теорема 3. Если Пример 9.4. Определить оптимальные стратегии игроков и величину цены игры, если платежная матрица имеет вид:
(9.15) Решение 1. Так как стратегия А3 является доминирующей над стратегией А4 , то исключаем стратегию А4 в табл. (9.15) и получаем табл. 9,16.
(9.16)
2. В табл. 9.16 с позиции игрока II стратегии В3 и В4 являются доминирующими, поэтому эти столбцы исключаем и получаем табл. 9.17 в виде:
(9.17) 3. Исключаем дублирующую стратегию A3 в табл. (9.15) и получим расчетную таблицу в виде:
4. Преобразуем матрицу C1 на основании теоремы 3, полагая k = 10 и b = -4;
(9.18) 5. Определяем нижнюю и верхнюю цены игры матрицы (9.18):
Так как 6. Определяем решение игры в смешанных стратегиях, составляя системы уравнений для соответствующих вероятностей: для игрока I
(9.19) для игрока II
(9.20)
Решая системы (9.19) и (9.21), находим вероятности:
Переходим к исходной платежной матрице, вычисляя цену игры
Ответ:
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2026 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|