Игра в смешанных стратегиях
ТЕОРИЯ ИГР И ПРИНЯТИЯ РЕШЕНИЙ ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ИГР При решении задач экономики и последующего принятия решения приходится учитывать множество факторов различного характера, причем эти факторы обладают свойствами неопределенности. Следовательно, результат принятия решения будет также составлять неопределенность. Например, количество проданных товаров в значительной степени зависит от спроса населения на тот или иной товар. Спрос является величиной случайной и зависит от многих факторов, которые являются неопределенными. В процессе поиска принятия решений появляются многочисленные варианты, которые приходится рассматривать, чтобы выбрать наилучший из числа имеющихся. С этой целью необходимо проводить количественный анализ и на его основе принимать обоснованное решение. Для обоснования принятия решений в условиях неопределенности разработаны специальные математические методы и модели. Задачи принятия решений в условиях полной или частичной неопределенности решаются с помощью теории игр и статистических решений. Теория игр — математическая (модель) теории конфликтных ситуаций, занимается принятием решений в этих ситуациях двумя или более противниками, каждый из которых стремится оптимизировать свои решения за счет других. Игра — это совокупность правил, определяющих сущность конфликтной ситуации, которые устанавливают: а) выбор способа действия игроками на каждом этапе игры; б) информацию, которой обладает каждый игрок при выполнении таких выборов; в) плату для каждого игрока после завершения любого этапа игры. Основными понятиями теории игр являются: конфликтующие стороны, называемые игроками, одна реализация игры — партией и набор еe возможных конечных состояний, называемых исходом игры, — это Выигрыш, ничья или проигрыш. Игрокам (участникам игры) известны Платежи в виде матрицы А = { aik }.
Развитие игры во времени проходит последовательно по этапам (ходам). Ходом в теории игр называется выбор одного из правил действия, предусмотренных игрой, и его реализацию. Ходы бывают личные и случайные. Личным ходом называют сознательный выбор игроком одного из вариантов действия и его осуществление. Случайным ходом называют выбор, выполняемый не волевым решением игрока, а каким-либо способом случайного выбора, например, бросание монеты, сдача карт, вращение барабана рулетки и т.д. Одним из основных показателей теории игр является стратегия. Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе этого игрока от начала до окончания игры. Оптимальной называется такая стратегия игрока, которая при многократном проведении игры обеспечивает игроку максимально возможный средний выигрыш или минимально возможный средний проигрыш. В зависимости от причин, вызывающих неопределенность исходов, игры делят на основные группы: 1. Комбинаторные игры, в которых правила позволяют каждому игроку проанализировать все разнообразные ходы и выбрать тот из них, который ведет к лучшему исходу для этого игрока. Неопределенность исхода связана с тем, что количество ходов слишком велико и практически игрок не в состоянии их перебрать и проанализировать. К таким играм относятся шахматы, шашки и др. 2. Азартные игры — это игры, источником неопределенности которых являются случайные факторы. Эти игры состоят из случайных ходов, при анализе которых применяется теория вероятностей. К ним относятся рулетка, игра в кости, отгадывание стороны выпадения монеты и т.д.
3. Стратегическими играми являются такие, в которых неопределенность исхода вызвана тем, что каждый из игроков, принимая решение о выборе предстоящего хода, не знает, какой стратегии будут придерживаться другие участники игры. Такие игры изучает теория игр. В игре могут сталкиваться интересы двух или более игроков. Если в игре участвуют два игрока, то игра называется парной, если число игроков больше двух, то она называется множественной. Различают игры по сумме выигрыша. Игра называется с нулевой суммой, если один игрок выигрывает за счет другого, а сумма выигрыша одного равна проигрышу другого. Парная игра с нулевой суммой называется антагонистической, так как интересы игроков прямо противоположны. Наиболее полно исследованы в теории игр антагонистические игры. В зависимости от количества возможных стратегий игры делятся на конечные и бесконечные. Игра называется конечной, если у каждого игрока имеется только конечное число стратегий. Игра называется бесконечной, если хотя бы у одного игрока имеется бесконечное число стратегий. По количеству ходов, которые выполняют игроки для достижения определенных целей, игры бывают одношаговые и многошаговые. Одношаговые игры состоят в том, что игрок делает один ход. В многошаговых — игроки выполняют последовательно ряд ходов согласно правилам игры. ПОСТАНОВКА ИГРОВЫХ ЗАДАЧ Основными вопросами теории игр являются: 1. Какие свойства стратегий следует считать признаками оптимальности. 2. Существуют ли стратегии игроков, которые обладали бы свойствами оптимальности. 3. Как определить оптимальные стратегии, если они существуют. Рассмотрим игру двух лиц с нулевой суммой. Пусть игра состоит из двух ходов: игрок I выбирает стратегию Аi а игрок II — стратегию Вк, а выигрыши и каждого из игроков удовлетворяет условию: (9.1) Если то Пусть функция Составим матрицу А, в которой укажем стратегии Ai, i = (1,n) первого игрока и Вk, к = (1,n) — второго игрока (9.2). B1 B2 … Bk … Bn
(9.2) Строки матрицы А соответствуют стратегии Аi, столбцы — стратегии Вk. Матрица А называется платежной или матрицей игры. Элемент aik платежной матрицы А является выигрышем игрока I, если он выбрал стратегию Аi, а игрок II принял стратегию Вк. Стратегии Аi и В называются чистыми стратегиями игроков.
Пусть игрок I выбирает некоторую стратегию Аi, тогда в худшем случае (например, игроку II известен выбор этой стратегии). Он получит выигрыш, равный min aik, то есть минимальному элементу в строке i платежной матрицы А. Учитывая такое положение, игроку I необходимо выбрать такую стратегию, чтобы максимизировать минимальный выигрыш: (9.3) Величина α называется нижней ценой игры, которая обеспечивает гарантированный выигрыш игрока I. Стратегия Аi обеспечивающая получение такого выигрыша называется максиминной. Игрок II при выборе стратегии Вк проиграет не более максимального значения из элементов k-го столбца, то есть величина проигрыша не больше max aik Игрок II выберет такую величину, которая максимальный проигрыш β минимизирует, то есть (9.4) Величина называется верхней ценой игры, а соответствующая проигрышу стратегии — минимаксной. Пусть выигрыш игрока I будет V, тогда его значение ограничено нижней и верхней ценами игры, то есть (9.5) Если же значение совпадают, то есть (9.6) то выигрыш игрока I составляет определенную величину и игра называется вполне определенной, а выигрыш (9.6) называется значением игры и равен элементу Вполне определенные игры называют также играми с седловой точкой или играми в чистых стратегиях. Элемент в платежной матрице А является одновременно минимальным в строке i и максимальным в столбце k и называется седловой точкой. Седловой точке соответствуют оптимальные стратегии игроков, а их совокупность является решением игры. Решение игры показывает, что если один из игроков принимает свою оптимальную стратегию, то для другого игрока отклонение от оптимальной стратегии не является выгодным. Пример 9.1 Определить нижнюю и верхнюю цены игры, оптимальные стратегии игроков и цену игры, если платежная матрица представлена в виде: Для матрицы А введем обозначения чистых стратегий. и для I и II игроков соответственно и укажем справа столбец минимальных значений элементов в каждой строке, то есть для max aik, и строку (под матрицей) для максимальных значений в каждом столбце,
i то есть для i Определяем нижнюю цену игры и верхнюю цену игры Так как то цена игры V равна Оптимальной стратегией игрока I является первая чистая стратегия A1, элементы которой соответствуют первой строке платежной матрицы А, то есть А1 = (5, 6, 4, 3). Оптимальной стратегией для игрока II будет чистая стратегия В4 с элементами четвертого столбца матрицы А, то есть В4 = = (3, 2, 1, 0). Ответ: А1 = (5, 6,4, 3), В4 = (3, 2, 1,0) и α= β = V = 3. Пример 9.2 Определить нижнюю и верхнюю цены игры, если платежная матрица А задана в виде: Так как то седловой точки нет, и решение матричной игры в чистых стратегиях не существует. Цена игры V находится в пределах 5<V<7. Ответ: ИГРА В СМЕШАННЫХ СТРАТЕГИЯХ Если платежная матрица не имеет седловой точки, то цена игры V определяется условием (9.5), то есть игрок I обеспечит выигрыш не меньше а игрок II обеспечит проигрыш не больше Так как то игрок I стремится увеличить выигрыш, а игрок II — уменьшить проигрыш. Если действия игроков неизвестны, то они будут применять чистые стратегии случайным образом с определенной вероятностью. Таким образом, смешанная стратегия — это полный набор чистых стратегий игрока при многократном выполнении ходов в одних и тех же условиях с соответствующими вероятностями. Чистые стратегии игроков в их оптимальных смешанных стратегиях называются активными. Теорема 1. Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш (или минимальный средний проигрыш), равный цене игры V независимо от действий другого игрока, лишь бы он придерживался своих активных стратегий. Теорема 2. Теорема Дж. фон Неймана (основная теорема теории игр). Каждая конечная матричная игра имеет по крайней мере оптимальное решение в смешанных стратегиях. Следствие. Каждая конечная игра имеет цену, величина которой является математическим ожиданием выигрыша I игрока и проигрыша игрока II. Выигрыш — V называется ценой игры и соответствует оптимальному решению. Смешанные стратегии для соответствующих игроков I и II — S: и S2 обозначают: (9.7) (9.8) где Ai и Вк — чистые стратегии игроков I и II соответственно, (9.9) Вероятности применения соответствующих стратегии игроками I и II, причем: Зная платежную матрицу А, можно определить средний выигрыш (математическое ожидание) М (А, X, Y): (9.10) Решить матричную игру — это означает определить цену игры V и оптимальные стратегии, то есть (три числа). В ответах задач иногда опускают значения чистых стратегий, а указывают только вероятности соответствующие определенным чистым стратегиям.
Рассмотрим конечную игру, матрица которой имеет размер 2x2, то есть (9.11) Определить оптимальные стратегии игроков I и II и соответствующие им вероятности для матрицы (9.11), то есть Для игрока I получаем систему уравнений (9.12) Для игрока II система имеет вид:
(9.13) Если и игроки имеют только оптимальные смешанные стратегии, то определитель матрицы А (9.11) не равен нулю. Следовательно, системы (9.12) и (9.13) имеют единственные решения. Решая системы уравнений (9.12) и (9.13), находим вероятности X и У в виде:
(9.14) Пример 9.3 Дана платежная матрица А:
Найти решение игры, то есть определить оптимальные стратегии игроков и цену игры. Решение 1. Определяем нижнюю и верхнюю цены игры: Так как то игра не содержит седловой точки и цена игры имеет значение в пределах 2. Определяем решение в смешанных стратегиях, вычисляя вероятности применения соответствующих стратегий игроками I и II. Запишем системы уравнений: для игрока I для игрока II Решая эти системы, находим вероятности: Ответ: При решении игровых задач платежные матрицы в большинстве случаев имеют размерность т х п, в которых то есть исходная матрица является сложной. Размерность матрицы можно сократить, исключая в них дублирующие и заведомо невыгодные доминирующие стратегии игроков. Дублирующими называются стратегии, которым соответствует одинаковые значения элементов в платежной матрице, то есть матрица содержит одинаковые строки (столбцы). Если в платежной матрице элементы строки Аj, не меньше соответствующих элементов строки Aj, то строка Аi,- называется доминирующей, а строка Аj - — доминируемой. Аналогично можно определить доминирующий и доминируемый столбцы. Игроку I невыгодно применять стратегии, которым соответствуют доминируемые строки. Игроку II невыгодно применять стратегии, которым соответствуют доминирующие столбцы. При решении матричных игр можно сокращать размерность матриц, исключая из нее доминируемые строки и доминирующие столбцы, если такие имеются. Для упрощения вычислений можно выполнить преобразование платежной матрицы, при котором не изменяются значения вероятностей смешанных стратегий. Теорема 3. Если являются решением платежной матрицы А, то решением игры с платежной матрицей является тройка чисел где — любое действительное число. Пример 9.4. Определить оптимальные стратегии игроков и величину цены игры, если платежная матрица имеет вид: (9.15) Решение 1. Так как стратегия А3 является доминирующей над стратегией А4 , то исключаем стратегию А4 в табл. (9.15) и получаем табл. 9,16. (9.16)
2. В табл. 9.16 с позиции игрока II стратегии В3 и В4 являются доминирующими, поэтому эти столбцы исключаем и получаем табл. 9.17 в виде: (9.17) 3. Исключаем дублирующую стратегию A3 в табл. (9.15) и получим расчетную таблицу в виде: 4. Преобразуем матрицу C1 на основании теоремы 3, полагая k = 10 и b = -4; (9.18) 5. Определяем нижнюю и верхнюю цены игры матрицы (9.18): Так как то седловой точки нет. 6. Определяем решение игры в смешанных стратегиях, составляя системы уравнений для соответствующих вероятностей: для игрока I (9.19) для игрока II (9.20)
Решая системы (9.19) и (9.21), находим вероятности: Переходим к исходной платежной матрице, вычисляя цену игры Ответ:
Воспользуйтесь поиском по сайту: ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|