А теперь от теории принятия решений перейдём к матричным играм.
Матричная игра игроков с нулевой суммой может рассматриваться, как следующая абстрактная игра двух игроков. Игрок А имеет m стратегий i = 1, 2, …, m. Игрок В имеет n стратегий j = 1, 2, …, n. Каждой паре стратегий (i , j) поставлено в соответствие число а Каждый из игроков делает один ход: игрок А выбирает свою i-ю стратегию (i = Каждая стратегия игрока i = Если рассмотреть матрицу А:
то проведение каждой партии матричной игры с матрицей сводится к выбору игроком А i-й строки, а игроком В j-го столбца и получения игроком А (за счет игрока В) выигрыша а Как было сказано выше, главным в теории игр является понятие оптимальных стратегий игроков. В это понятие интуитивно вкладывается такой смысл: стратегия игрока является оптимальной, если применение этой стратегии обеспечивает ему наибольший гарантированный выигрыш при всевозможных стратегиях другого игрока. Исходя из этих позиций, игрок А исследует матрицу выигрышей следующим образом: для каждого значения i (i =
т.е. определяется минимальный выигрыш для игрока А при условии, что он примет свою i-ю чистую стратегию, затем из этих минимальных выигрышей отыскивается такая стратегия i = i
Определение игры
Дадим определение понятию «Игра». Игрой называется набор
где N – произвольное множество игроков; S – произвольное множество всех исходов игры; XK - произвольное множество стратегий коалиции K - возможные действия каждого из игроков; - объем информации, которую может получить каждая сторона о действиях другой; - исход игры в результате каждой совокупности ходов противников. Игроки: Считается заданным список игроков. Если игроков различать по номерам, то их список сводится к множеству Действия: Каждый игрок Интересы: Степень заинтересованности игрока k в той или иной ситуации s определяется размером выигрыша Основной целью теории игр является выработка рекомендаций для удовлетворительного поведения игроков в конфликте, то есть выявление для каждого из них «оптимальной стратегии». Оптимальной называется стратегия, которая при многократно повторяющейся игре гарантирует игроку максимально возможный средний выигрыш (или эквивалентно минимально возможный средний проигрыш). Опишем некоторые основные понятия, используемые в теории игр. Заинтересованные стороны называются игроками. Любое возможное действие для игрока называется его стратегией. В условиях конфликта каждый игрок придерживается выбранной им стратегии, в результате появляется набор стратегий, называемый ситуацией. Заинтересованность игроков в каждой конкретной ситуации, проявляется в том, что каждому игроку в данной ситуации приписывается число, выражающее степень удовлетворённости его интересов. Такое число называется выигрышем. Игра начинается с некоторого положения и состоит из последовательности личных ходов, при каждом из которых один из игроков совершает выбор среди нескольких возможностей. Некоторые ходы могут быть случайными (таковы, например, бросание кости или тасование колоды карт). Примерами игр такого типа являются шахматы, в которых нет случайных ходов (кроме разыгрывания того, кто будет играть белыми), бридж, в котором случай играет большую роль. На примере бриджа и шахмат можно показать другой важный элемент игры. Именно, в шахматной игре каждый игрок знает любой ход, который был сделан до этого момента, в то время как в бридже это знание игрока обычно неполно. Таким образом, в некоторых играх игрок не в состоянии определить, какой из нескольких возможных ходов был фактически сделан, будь то ход одного из его противников или случайный ход. На практике это означает, что, когда игрок делает свой ход, он не знает точной позиции игры и должен делать ход с учетом того, что имеется несколько возможных позиций. В конце игры игроки обычно получают какой-либо выигрыш, (может быть в форме денег, престижа или иного удовлетворения), который зависит от протекания игры. В общее представление об игре входят 3 элемента: 1 чередование ходов, которые могут быть как личными, так и случайными 2 возможная недостаточность информации 3 функция выигрыша Запишем теперь основные этапы поиска решения игры: 1 проверка наличия (или отсутствия) равновесия в чистых стратегиях (к этому вопросу вернёмся чуть позже). При наличии равновесной ситуации указываются соответствующие оптимальные стратегии игроков и цена игры. 2 поиск доминирующих стратегий (в случае успеха этого поиска – отбрасывание доминирующих строк и столбцов в исходной матрице игры). 3 замена игры на её смешанное расширение и отыскание оптимальных смешанных стратегий и цены игры.
Отметим, что нормальная форма антагонистической игры сводится к некоторой матрице А с числом строк равным числу стратегий игрока 1 и с числом столбцов, равным числу стратегий игрока 2. Выигрыш – если игрок 1 выбирает i-ю стратегию, а игрок 2 j-ю стратегию – представляет собой элемент Игроков, как участников игры, интересует, какие из стратегий являются выигрышными с точки зрения максимизации доли каждого игрока в выигрыше. Однако, результаты случайных ходов, известны только в вероятностном смысле, поэтому лучше рассматривать математическое ожидание функции выигрыша, определённое в случае, когда игроки используют n-набор стратегий. Поэтому для описания математического ожидания функции выигрыша, при условии, что игрок i применяет стратегию Пример 1: игра «Орлянка».
Первый игрок прячет монету орлом или решкой вверх, а второй пытается угадать, как она спрятана. Если он не угадывает – платит первому одну денежную единицу, если угадывает – первый платит ему одну денежную единицу. В данной игре каждый игрок имеет две стратегии: «орёл» и «решка». Множество ситуаций в игре состоит из 4 элементов. В строках таблицы указаны стратегии первого игрока Х, в столбцах – стратегии второго игрока Y. Для каждой из ситуаций указаны выигрыши первого и второго игроков. Рассмотрим основную теорему матричных игр. Основная теорема теории матричных игр (по Дж. фон Нейману). Для матричной игры с любой матрицей Авеличины
Более того, существует хотя бы одна ситуация в смешанных стратегиях
Иными словами, любая матричная игра имеет решение в смешанных стратегиях. Поиск этого решения опирается на установленные факты. Приведём доказательство данной теоремы (автор: Дж. Б. Данциг, 1951г.) Теорема. Каждая матричная игра с нулевой суммой всегда имеет решение в смешанных стратегиях, т.е. существуют такое число Комментарий. Формула (*) означает, что: если игрок 1 отклоняется от своей оптимальной стратегии, то его выигрыш не увеличивается по сравнению с ценой игры; если от своей оптимальной стратегии отклоняется игрок 2, то по сравнению с ценой игры его проигрыш не уменьшается. Доказательство. Пусть матрица игры равна
Из этого следует, что от увеличения всех элементов матрицы Для определения среднего оптимального выигрыша игрока 1, соответствующего первоначальной платёжной матрице, необходимо из найденной цены игры вычесть величину Классификация игр
Различные виды игр можно классифицировать, основываясь на том или ином принципе: по числу игроков, по числу стратегий, по свойствам функций выигрыша, по возможности предварительных переговоров и взаимодействия между игроками в ходе игры. В зависимости от числа игроков различают игры с двумя, тремя и более участниками. Согласно другому принципу классификации (по количеству стратегий) различают конечные и бесконечные игры. В конечных играх игроки располагают конечным числом возможных стратегий (например, в игре в орлянку игроки имеют по два возможных хода - они могут выбрать "орел" или "решку"). Сами стратегии в конечных играх нередко называются чистыми стратегиями (смысл этого названия будет ясен далее). Соответственно, в бесконечных играх игроки имеют бесконечное число возможных стратегий. Так в ситуации «Продавец-Покупатель» каждый из игроков может назвать любую устраивающую его цену и количество продаваемого (покупаемого) товара. Третий способ классификации игр-по свойствам функции выигрыша (платежных функций). Важным случаем в теории игр является ситуация, когда выигрыш одного из игроков равен проигрышу другого, т.е. налицо прямой конфликт между игроками. Подобные игры называются играми с нулевой суммой, или антагонистическими играми. Игры в орлянку или в шахматы - типичные примеры антагонистических игр. Прямой противоположностью играм такого типа являются игры с постоянной разностью, в которых игроки и выигрывают, и проигрывают одновременно, так что им выгодно действовать сообща. Между этими крайними случаями имеется множество игр с ненулевой суммой, где имеются и конфликты, и согласованные действия игроков. Можно также выделить 2 способа задания игры. 1 так называемая позиционная форма. При этом определяются: · порядок ходов · альтернативы (возможные ходы), доступные каждому из игроков на момент наступления его хода · информация, которой владеет каждый из игроков на момент очередного хода · выигрыши (для каждого игрока) как функции от выбранных ходов · вероятностные распределения на множестве возможных состояний внешней среды 2. нормальная или стратегическая форма. Каждый участник (игрок) k , где Ранее упоминалось о таком понятии, как «антагонистическая игра». Примером такой игры может служить игра «Орлянка». Дадим определение антагонистической игре. Антагонистическая игра - игра, в которой участвуют два игрока (обычно обозначаемые I и II) с противоположными интересами. Для антагонистической игры характерно, что выигрыш одного игрока равен проигрышу другого и наоборот, поэтому совместные действия игроков, их переговоры и соглашения лишены смысла.. Определяются антагонистические игры заданием множеств стратегий игроков и выигрышей игрока I в каждой ситуации, состоящей в выборе игроками своих стратегий. Таким образом, формально антагонистическая игра есть тройка ‹А, В, Н›, в которой А и В - множества стратегий игроков, а Н (а, b) - вещественная функция (функция выигрыша) от пар (а, b), где а A, b В. Игрок I, выбирая а, стремится максимизировать Н(а, b),а игрок II, выбирая b, - минимизировать Н (а, b). Пример 2: Рассмотрим игру G (4х5) в матричной форме.
Очевидно надо выбирать ту стратегию, при которой выигрыш максимален. (Это так называемый принцип минимакса. О нём чуть позже). В правом добавочном столбце запишем минимальное значение выигрыша в каждой строке; обозначим его для i-ой строки
Из всех значений Теорема о минимаксе. Можно доказать, что для любой функции F(x,y) определённой на произвольном декартовом произведении X × Y имеет место неравенство Запишем 2 утверждения: Утверждение 1. Точка 0 (в m-мерном пространстве) содержится в выпуклой оболочке m+n точек
Утверждение 2. Существуют числа Доказательство: Пусть А – матричная игра. Имеет место либо утверждение 1, либо утверждение 2. Если верно утверждение 1 то 0 является выпуклой линейной комбинацией m+n векторов. Поэтому существуют такие
Если бы все числа
тогда можно положить
Значит Предположим, что верно утверждение 2. Тогда Принцип минимакса. Рассмотрим игру Матричные игры
В этом параграфе будет рассказано о принципе максимина, рациональном представлении матрицы игры, о решении игры при помощи фиктивного разыгрывания.
Начнём непосредственно с матричных игр. Тройка Мы знаем, что антагонистическую игру двух участников с нулевой суммой (напомним, что нулевая сумма – это когда выигрыш одного игрока равен проигрышу другого) удобно задавать с помощью, так называемой платёжной матрицы. Каждый элемент такой матрицы Строки матрицы соответствуют стратегиям игрока 1, столбцы – стратегиям игрока 2, а её элементы – результатам (т.е. выигрышам) первого. Если взять элементы матрицы с обратным знаком, то это будут выигрыши второго игрока. Здесь надо отметить, что вопрос о выборе стратегии является основным в теории игр. Для примера проанализируем произвольную игру Рекомендуемые страницы: Воспользуйтесь поиском по сайту: ©2015- 2021 megalektsii.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
|