Решение матричной игры в чистых стратегиях
Математиком А. Вальдом был сформулирован принцип суть которого состоит в том, что при принятии решения в условиях неопределенности разумно исходить из того, что сложится наименее благоприятная ситуация. Исходя из этого принципа игрок 1 может рассуждать следующим образом: «Предположим, что я выберу -ю стратегию, тогда в худшем для меня случае я получу выигрыш величиной
где -количество строк в матрице игры, т.е. количество чистых стратегий 2-го игрока. Тогда я должен выбрать такую строку, т.е. -ю стратегию ( - количество столбцов в матрице игры), при которой этот минимум максимальный». Определение. Число называется нижней ценой игры или максимином, а соответствующая ему стратегия (строка) - максиминной. Аналогично, второй игрок, также исходя из наихудшего исхода, должен рассуждать следующим образом: «Предположим, что я выберу -ю стратегию, тогда в худшем для меня случае я потеряю величину
Тогда я должен выбрать такой столбец, т.е. -ю стратегию, при которой этот максимум минимальный» Определение Число называется верхней ценой игры или минимаксом, а соответствующая ему стратегия игрока (столбец) - минимаксной. Теорема Нижняя цена игры не превосходит верхней цены игры. Если для некоторой игры верхняя и нижняя цены равны, т.е. выполняется , или что то же самое где - соответствующий элемент матрицы игры, то очевидно для этого элемента выполняется неравенство Сравнивая это неравенство с (3) видим, что оказывается ситуация является равновесной, т.е. оптимальной, т.е. решением игры. Величина при этом, очевидно, является ценой игры, т.е. рассматриваемые принципы максимина и минимакса приводят к оптимальному и равновесному состоянию. Это еще раз свидетельствует об обоснованности их использования при принятии решений.
Определение Игра, для которой называется игрой с седловой точкой. Пример. Для игровой матрицы из примера 4.1 найти седловые точки, если они есть. Нахождение нижней и верхней цен игры, равно как и проверка существования седловых точек и их нахождение, для матричных игр удобно проводить по следующей схеме Видно, что максимин имеет место в 1-й строке, т.е. при первой стратегии 1-го игрока. Минимакс - в первом столбце, т.е. при 1-й стратегии 2-го игрока. При этом они совпадают, т.е. имеется седловая точка. Это ситуация
Решение матричной игры в смешанных стратегиях
Игра, заданная некоторой матрицей, может не иметь седловой точки. Пример. Рассмотрим платёжную матрицу Для первого игрока находим максимин Для второго игрока находим минимакс Следовательно, минимакс и максимин не совпадают, т.е. положения равновесия в чистых стратегиях не существует. Если среди чистых стратегий решения игры нет, то для его нахождения используются смешанные стратегии. Справедлива теорема. Теорема Неймана (основная теорема теории игр) Каждая конечная игра имеет,по крайней мере, одно оптимальное решение, возможно среди смешанных стратегий. При этом если - платежная матрица, - оптимальная смешанная стратегия первого игрока, a - второго, то число
является ценой игры. Определение. Если чистая стратегия входит в смешанную с ненулевой вероятностью, то она называется активной Активные стратегии обладают свойством, выражаемым следующей теоремой. Теорема (об активных стратегиях) Если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остаётся неизменным и равным цене игры , если второй игрок не выходит за пределы своих активных стратегий. Игра с природой
Кроме антогонистических рассматривают так называемые неантогонистические игры. В этом случае предполагают, что действия противника не носят характер строгого противостояния. Его интересы могут быть разными и в общем случае не совпадающими с нашими, однако они не являются «злонамеренно» направленными против нас. Простейшим примером такой ситуации является следующая.
Предположим, что известна (в общем случае смешанная) стратегия применяемая одним из игроков. Например, из опыта предыдущих наблюдений. Этот игрок использует свою стратегию вне зависимости от нашей стратегии. Такую игру принято называть игрой с природой. Природа как бы не имея в общем желания нам навредить действует по своим законам. Пусть торговое предприятие имеет т стратегий: и имеется n возможных состояний природы: . Так как природа не является заинтересованной стороной, исход любого сочетания поведения сторон можно оценить выигрышем первой стороны для каждой пары стратегий и . Все показатели игры заданы платежной матрицей размерности По платежной матрице можно принять ряд решений. Например, оценить возможные исходы: минимальный выигрыш т.е. наименьшая из величин в каждой -й строке как пессимистическая оценка; максимальный выигрыш – то наилучшее, что дает выбор -го варианта При анализе «игры с природой» вводится показатель, по которому оценивают, насколько то или иное состояние «природы» влияет на исход ситуации. Этот показатель называют риском. Риск при пользовании стратегией и состоянии «природы» оценивается разностью между максимально возможным выигрышем при данном состоянии «природы» и выигрышем при выбранной стратегии : Исходя из этого определения можно оценить максимальный риск каждого решения: Решения могут приниматься по результатам анализа ряда критериев.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|