Основные понятия теории стратегических игр
На практике часто появляется необходимость согласования действии фирм, объединении, министерств и других участников проектов в случаях, когда их интересы не совпадают. В таких ситуациях теория игр позволяет найти лучшее решение для поведения участников, обязанных согласовывать действия при столкновении интересов. Теория игр все шире проникает в практику экономических решений и исследований. Ее можно рассматривать как инструмент, помогающий повысить эффективность плановых и управленческих решений. Это имеет большое значение при решении задач в промышленности, сельском хозяйстве, на транспорте, в торговле, особенно при заключении договоров с иностранными государствами на любых иерархических уровнях. Так, можно определить научно обоснованные уровни снижения розничных цен и оптимальный уровень товарных запасов, решать задачи экскурсионного обслуживания и выбора новых линий городского транспорта, задачу планирования порядка организации эксплуатации месторождений полезных ископаемых в стране и др. Классической стала задача выбора участков земли под сельскохозяйственные культуры. Метод теории игр можно применять при выборочных обследованиях конечных со-вокупностей, при проверке статистических гипотез. Обычно теорию игр определяют как раздел математики для изучения конфликтных ситуаций. Это значит, что можно выработать оптимальные правила поведения каждой стороны, участвующей в решении конфликтной ситуации. В экономике, например, оказался недостаточным аппарат математического анализа, занимающийся определением экстремумов функций. Появилась необходимость изучения так называемых оптимальных минимаксных и максиминных решений. Следовательно, теорию игр можно рассматривать как новый раздел оптимизационного подхода, позволяющего решать новые задачи при принятии решений.
Игра - упрощенная формализованная модель реальной конфликтной ситуации. Математически формализация означает, что выработаны определенные правила действия сторон в процессе игры: варианты действия сторон; исход игры при данном варианте действия; объем информации каждой стороны о поведении всех других сторон. Одну играющую сторону при исследовании операций может представлять коллектив, преследующий некоторую общую цель. Однако разные члены коллектива могут быть по-разному информированы об обстановке проведения игры. Выигрыш или проигрыш сторон оценивается численно, другие случаи в теории игр не рассматриваются, хотя не всякий выигрыш в действительности можно оценивать количественно. Игрок - одна из сторон в игровой ситуации. Стратегия игрока - его правила действия в каждой из возможных ситуаций игры. Существуют игровые системы управления, если процесс управления в них рассматривается как игра. Платежная матрица (матрица эффективности, матрица игры) включает все значения выигрышей (в конечной игре). Пусть игрок 1 имеет т стратегий Аi, а игрок 2 - п стратегий Вj, ( ; ). Игра может быть названа игрой т х п. Представим матрицу эффективности игры двух лиц с нулевой суммой, сопроводив ее необходимыми обозначениями (табл. 2.1). Таблица 2.1 В данной матрице элементы – значения выигрышей игрока 1 – могут означать и математическое ожидание выигрыша (среднее значение), если выигрыш является случайной величиной. Величины ,– соответственно минимальные значения элементов , по строкам и максимальные - по столбцам. Их содержательный смысл будет отражен ниже. В теории игр не существует установившейся классификации видов игр. Однако по определенным критериям некоторые виды можно выделить.
Количество игроков. Если в игре участвуют две стороны, то ее называют игрой двух лиц. Если число сторон больше двух, ее относят к игре п игроков. Наибольший интерес вызывают игры двух лиц. Они и математически более глубоко проработаны и в практических приложениях имеют наиболее обширную библиографию [3, 7, 12, 13]. Количество стратегий игры. По этому критерию игры делятся на конечные и бесконечные. В конечной игре каждый из игроков имеет конечное число возможных стратегий. Если хотя бы один из игроков имеет бесконечное число возможных стратегий, игра является бесконечной. Взаимоотношения сторон. Согласно данному критерию игры делятся на кооперативные, коалиционные и бескоалиционные. Если игроки не имеют право вступать в соглашения, образовывать коалиции, то такая игра относится к бескоалиционным; если игроки могут вступать в соглашения, создавать коалиции - коалиционной. Кооперативная игра - это игра, в которой заранее определены коалиции. Характер выигрышей. Этот критерий позволяет классифицировать игры с нулевой и с ненулевой суммой. Игра с нулевой суммой предусматривает условие: «сумма выигрышей всех игроков в каждой партии равна нулю». Игры двух игроков с нулевой суммой относят к классу антагонистических. Естественно, выигрыш одного игрока при этом равен проигрышу другого. Примерами игр с нулевой суммой служат многие экономические задачи. В них общий капитал всех игроков перераспределяется между игроками, но не меняется. К играм с ненулевой суммой также можно отнести большое количество экономических задач. Например, в результате торговых взаимоотношений стран, участвующих в игре, все участники могут оказаться в выигрыше. Игра, в которой нужно вносить взнос за право участия в ней, является игрой с ненулевой суммой. Вид функции выигрышей. По этому критерию игры подразделяются на матричные, биматричные, непрерывные, выпуклые, сепарабельные и т. д. Поясним суть некоторых из них. Матричная игра - конечная игра двух игроков с нулевой суммой. В общем случае ее платежная матрица является прямоугольной (см. табл. 2.1). Номер строки матрицы соответствует номеру стратегии, применяемой игроком 1. Номер столбца соответствует номеру стратегии игрока 2. Выигрыш игрока 1 является элементом матрицы. Выигрыш игрока 2 равен проигрышу игрока 1. Как показано в приложении, матричные игры всегда имеют решения в смешанных стратегиях. Они могут быть решены методами линейного программирования.
Биматричная игра - конечная игра двух игроков с ненулевой суммой. Выигрыши каждого игрока задаются своей матрицей, в которой строка соответствует стратегии игрока 1, а столбец — стратегии игрока 2. Однако элемент первой матрицы показывает выигрыш игрока 1, а элемент второй матрицы - выигрыш игрока 2. Для биматричных игр так же, как и для матричных, разработана теория оптимального поведения игроков. Если функция выигрышей каждого игрока в зависимости от стратегий является непрерывной, игра считается непрерывной. Если функция выигрышей выпуклая, то и игра - выпуклая. Если функция выигрышей может быть разделена на сумму произведений функций одного аргумента; то игра относится к сепарабельной. Количество ходов. Согласно этому критерию игры можно разделить на одношаговые и многошаговые. Одношаговые игры заканчиваются после одного хода каждого игрока. Так, в матричной игре после одного хода каждого из игроков происходит распределение выигрышей. Многошаговые игры бывают позиционными, стохастическими, дифференциальными и др. Подробнее см. [3,7,12,13]. Информированность cmoрон. По данному критерию различают игры с полной и неполной информацией. Если каждый игрок на каждом ходу игры знает все ранее примененные другими игроками на предыдущих ходах стратегии, такая игра определяется как игра с полной информацией. Если игроку не все стратегии предыдущих ходов других игроков известны, то игра классифицируется как игра с неполной информацией. Мы далее убедимся, что игра с полной информацией имеет решение. Решением будет седловая точка при чистых стратегиях. Степень неполноты и н формации. По этому критерию игры подразделяются на статистические (в условиях частичной неопределенности) и стратегические (в условиях полной неопределенности, см. разд. 3.2). Игры с природой (см. гл. 3, 6) часто относят к статистическим играм. В статистической игре имеется возможность получения информации на основе статистического эксперимента, при котором вычисляется или оценивается распределение вероятностей состояний (стратегий) природы. С теорией статистических игр тесно связана теория принятия экономических решений.
Получив некоторое представление о существующих подходах к классификации игр, можно остановиться на оценках игры. Рассмотрим матричную игру, представленную матрицей выигрышей т х п, где число строк , а число столбцов (см. табл. 2.1). Применим принцип получения максимального гарантированного результата при наихудших условиях. Игрок 1 стремится принять такую стратегию, которая должна обеспечить максимальный проигрыш игрока 2. Соответственно игрок 2 стремится принять стратегию, обеспечивающую минимальный выигрыш игрока 1. Рассмотрим оба этих подхода. Подход игрока 1.Он должен получить максимальный гарантированный результат при наихудших условиях. Значит, при выборе отвечающей этим условиям своей чистой стратегии он должен выбрать гарантированный результат в наихудших условиях, т.е. наименьшее значение своего выигрыша а,., которое обозначим Чтобы этот гарантированный эффект в наихудших условиях был максимальным, нужно из всех а, выбрать наибольшее значение. Обозначим его а и назовем чистой нижней ценой игры («максимин»): Таким образом, максиминной стратегии отвечает строка матрицы, которой соответствует элемент ai. Какие бы стратегии ни применял игрок 2, игрок 1 максиминной чистой стратегией гарантировал себе выигрыш, не меньший, чем a. Таково оптимальное поведение игрока 1. Подход игрока 2. Своими оптимальными стратегиями он стремится уменьшить выигрыш игрока 1, поэтому при каждой j -й чистой стратегии он отыскивает величину своего максимального проигрыша в каждом j- м столбце, т.е. определяет максимальный выигрыш игрока 1, если игрок 2 применит j -ю чистую стратегию. Из всех своих n j- х чистых стратегий он отыскивает такую, при которой игрок 1 получит минимальный выигрыш, т.е. определяет чистую верхнюю цену игры («минимакс»): Чистая верхняя цена игры показывает, какой максимальный выигрыш может гарантировать игрок 1, применяя свои чистые стратегии, - выигрыш, не меньший, чем a. Игрок 2 за счет указанного выше выбора своих чистых стратегий не допустит, чтобы игрок 1 мог получить выигрыш, больший, чем b. Таким образом, минимаксная стратегия отображается столбцом платежной матрицы, в котором находится элемент b (см. табл. 2.1). Она является оптимальной чистой гарантирующей стратегией игрока 2, если он ничего не знает о действиях игрока 1.
Чистая цена игры v - цена данной игры, если нижняя и верхняя ее цены совпадают: В этом случае игра называется игрой с седловой точкой. Пример 2.1. Определить верхнюю и нижнюю цены при заданной матрице игры и указать максиминную и минимаксную стратегии. Представим матрицу игры с обозначениями стратегий bj, a. j, (табл. 2.2). Т а б л и ц а 2.2 Решение. Определим нижнюю цену игры: ; ; (см. столбец ). Определим верхнюю цену игры: ; ; ; (см. строку bj). Таким образом, , т.е. Значит, – чистая цена игры при стратегиях А 2и B 1. Следовательно, имеем игру с седловой точкой. Пример 2.2. Определим максиминную и минимаксную стратегии при заданной матрице эффективности (табл. 2.3). Решение. Определим максиминную стратегию: ; ; Максиминная стратегия - строка А 2. Таблица 2.3 Определим минимаксную стратегию:
Минимаксная стратегия - столбец В 2. Здесь , следовательно, седловой точки нет. Если матрица игры содержит элемент, минимальный в своей строке и максимальный в своем столбце, то он, как уже сказано выше, является седловой точкой. В этом случае мы имеем игру с седловой точкой. Пусть в игре с седловой точкой один игрок придерживается седловой точки, тогда другой получит лучший результат, если также будет придерживаться этой точки. Лучшее поведение игрока не должно повлечь уменьшение его выигрыша. Зато худшее поведение может привести к этому. В данном случае решением игры являются: • чистая стратегия игрока 1; • чистая стратегия игрока 2; • седловой элемент. Оптимальные чистые стратегии — это чистые стратегии, образующие седловую точку. В игре без седловой точки, если игрок 1 информирован о стратегии, принятой игроком 2, он сможет принять оптимальную стратегию, которая не совпадает с максиминной. Пример 2.3. Дана матрица игры
Допустим, игроку 1 стало известно, что игрок 2 принял минимаксную стратегию. Игрок 1 должен выбрать оптимальную стратегию при условии, что B 2 – стратегия игрока 2 ( = 5). Решение. Определим максиминную стратегию игрока 1:
Стратегия игрока 1 – А 2 - максиминная. Выберем оптимальную стратегию для игрока 1. Ею будет не максиминная А 2, дающая игроку 1 выигрыш = 4, а та стратегия, которая соответствует . В этом случае его максимальный гарантированный выигрыш будет равен верхней цене игры , поэтому он выберет свою оптимальную стратегию А 1, зная, что игрок 2 выбрал свою стратегию В 2. Таким образом, рассмотренный пример дает результат, отличный от результата при игре с седловой точкой. Стратегия является оптимальной, если ее применение обеспечит игроку наибольший гарантированный выигрыш при любых возможных стратегиях другого игрока. На примере 2.3 показано, что бывают ситуации, когда игрок 1 может получить выигрыш, превосходящий максиминный, если ему известны намерения игрока 2. При многократном повторении игры в сходных условиях можно добиться гарантированного среднего выигрыша, превосходящего для игрока 1 максиминный. СМЕШАННЫЕ СТРАТЕГИИ Если в матричной игре отсутствует седловая точка в чистых стратегиях, то находят верхнюю и нижнюю цены игры. Они показывают, что игрок 1 не получит выигрыша, превосходящего верхнюю цену игры, и что игроку 1 гарантирован выигрыш, не меньший нижней цены игры. В примере 2.3 игрок 1 получил по своей оптимальной стратегии А 1, отличной от максиминной, выигрыш, равный верхней цене игры. Такова плата за информированность о стратегии игрока 2. Это крайний случай. Не улучшится ли результат игрока 1, если информация о действиях противной стороны будет отсутствовать, но игрок будет многократно применять чистые стратегии случайным образом с определенной вероятностью? В такой ситуации, оказывается, можно получать выигрыши, в среднем большие нижней цены игры, но меньшие верхней. Смешанная стратегия игрока - это полный набор применения его чистых стратегий при многократном повторении игры в одних и тех же условиях с заданными вероятностями. Подведем итоги сказанного и перечислим условия применения смешанных стратегий: • игра без седловой точки; • игроки используют случайную смесь чистых стратегий с заданными вероятностями; • игра многократно повторяется в сходных условиях; • при каждом из ходов ни один игрок не информирован о выборе стратегии другим игроком; • допускается осреднение результатов игр. Применяются следующие обозначения смешанных стратегий. Для игрока 1 смешанная стратегия, заключающаяся в применении чистых стратегий А1, А2,..., Аm с соответствующими вероятностями р1, р2,..., рm,
где , Для игрока 2
где , qj – вероятность применения чистой стратегии Вj. В случае, когда pi = 1, для игрока 1 имеем чистую стратегию:
Чистые стратегии игрока являются единственно возможными несовместными событиями. В матричной игре, зная матрицу А (она относится и к игроку 1, и к игроку 2), можно определить при заданных векторах и средний выигрыш (математическое ожидание эффекта) игрока 1: , где и - векторы; рi и qj - компоненты векторов. Путем применения своих смешанных стратегий игрок 1 стремится максимально увеличить свой средний выигрыш, а игрок 2 - довести этот эффект до минимально возможного значения. Игрок 1 стремится достигнуть . Игрок 2 добивается того, чтобы выполнялось условие . Обозначим и векторы, соответствующие оптимальным смешанным стратегиям игроков 1 и 2, т.е. такие векторы и , при которых будет выполнено равенство Цена игры g – средний выигрыш игрока 1 при использовании обоими игроками смешанных стратегий. Следовательно, решением матричной игры являются: 1) - оптимальная смешанная стратегия игрока 1; 2) - оптимальная смешанная стратегия игрока 2; 3) g - цена игры. Смешанные стратегии будут оптимальными ( и ), если они образуют седловую точку для функции , т.е. Существует основная теорема математических игр (доказательство см. в приложении). Теорема 2.1. Для матричной игры с любой матрицей A величины И существуют и равны между собой: . Следует отметить, что при выборе оптимальных стратегий игроку 1 всегда будет гарантирован средний выигрыш, не меньший, чем цена игры, при любой фиксированной стратегии игрока 2 (и, наоборот, для игрока 2). Активными стратегиями игроков 1 и 2 называют стратегии, входящие в состав оптимальных смешанных стратегий соответствующих игроков с вероятностями, отличными от нуля. Значит, в состав оптимальных смешанных стратегий игроков могут входить не все априори заданные их стратегии.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|