Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Проблема оптимального решения в теории игр. Типы равновесий




 

Оптимальными стратегиями в теории конфликтов считаются такие стратегии, которые приводят игроков к устойчивым равновесиям, т.е. неким ситуациям, удовлетворяющим всех игроков.

Оптимальность решения в теории игр основана на понятии равновесной ситуации:

1) ни одному из игроков не выгодно отклоняться от равновесной ситуации, если все другие остаются в ней,

2) смысл равновесия - при многократном повторении игры, игроки выйдут на ситуацию равновесия, начав игру в любой стратегической ситуации.

В каждом взаимодействии могут существовать следующие виды равновесий:

1. равновесие в осторожных стратегиях. Определяется стратегиями, обеспечивающими игрокам гарантированный результат;

2. равновесие в доминирующих стратегиях.

Доминирующей стратегией называется такой план действий, который обеспечивает участнику максимальный выигрыш вне зависимости от действий другого участника. Поэтому равновесием доминирующих стратегий будет пересечение доминирующих стратегий обоих участников игры.

Если оптимальные стратегии игроков доминируют над всеми остальными их стратегиями, то игра имеет равновесие в доминирующих стратегиях. В игре "дилемма заключенных" равновесным по Нэшу набором стратегий будет ("признавать - признавать"). Причем важно отметить, что как для игрока А, так и для игрока Б "признавать" является доминирующей стратегией, тогда как "не признавать" – доминируемой;

3. равновесие Нэша. Равновесием Нэша называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения.

Допустим, - игра n лиц в нормальной форме, где — набор чистых стратегий, а - набор выигрышей.

Когда каждый игрок выбирает стратегию в профиле стратегий , игрок получает выигрыш . Причем выигрыш зависит от всего профиля стратегий: не только от стратегии, выбранной самим игроком , но и от чужих стратегий. Профиль стратегий является равновесием по Нэшу, если изменение своей стратегии не выгодно ни одному игроку, то есть для любого

Игра может иметь равновесие Нэша и в чистых стратегиях, и в смешанных.

Нэш доказал, что если разрешить смешанные стратегии, тогда в каждой игре n игроков будет хотя бы одно равновесие Нэша.

В ситуации, равновесной по Нэшу, стратегия каждого игрока обеспечивает ему наилучший отклик на стратегии других игроков;

4. Равновесие Штакельберга. Модель Штакельберга – теоретико-игровая модель олигополистического[1] рынка при наличии информационной асимметрии. В этой модели поведение фирм описывается динамической игрой с полной совершенной информацией, в которой поведение фирм моделируется с помощью статической игры с полной информацией. Главной особенностью игры является наличие лидирующей фирмы, которая первой устанавливает объём выпуска товаров, а остальные фирмы ориентируются в своих расчетах на нее. Основные предпосылки игры:

· отрасль производит однородный товар: отличия продукции разных фирм пренебрежимо малы, а значит, покупатель при выборе, у какой фирмы покупать, ориентируется только на цену;

· в отрасли действует небольшое число фирм;

· фирмы устанавливают количество производимой продукции, а цена на неё определяется исходя из спроса;

· существует так называемая фирма-лидер, на объём производства которой ориентируются остальные фирмы.

Таким образом, модель Штакельберга используется для нахождения оптимального решения в динамических играх и соответствует максимальному выигрышу игроков, исходя из условий, сложившихся после уже сделанного выбора одним или несколькими игроками. Равновесие по Штакельбергу. - ситуация, когда ни один из игроков не может увеличить свой выигрыш в одностороннем порядке, а решения принимаются сначала одним игроком и становятся известными второму игроку. В игре «дилемма заключенных» равновесие по Штакельбергу будет достигнуто в квадрате (1;1) - "признавать вину" обоими преступниками;

5. оптимальность по Парето - такое состояние системы, при котором значение каждого частного критерия, описывающего состояние системы, не может быть улучшено без ухудшения положения других игроков.

Принцип Парето гласит так: «Всякое изменение, которое не приносит убытков, а которое некоторым людям приносит пользу (по их собственной оценке), является улучшением». Таким образом, признаётся право на все изменения, которые не приносят никому дополнительного вреда.

Множество состояний системы, оптимальных по Парето, называют «множеством Парето», «множеством альтернатив, оптимальных в смысле Парето», либо «множеством оптимальных альтернатив».

Ситуация, когда достигнута эффективность по Парето - это ситуация, когда все выгоды от обмена исчерпаны.

Эффективность по Парето является одним из центральных понятий для современной экономической науки. На основе этого понятия строятся первая и вторая фундаментальные теоремы благосостояния.

Одним из приложений Парето-оптимальности является Парето-распределение ресурсов (трудовых ресурсов и капитала) при международной экономической интеграции, т.е. экономическом объединении двух и более государств. Интересно, что Парето-распределение до и после международной экономической интеграции было адекватно математически описано (Далимов Р.Т., 2008). Анализ показал, что добавленная стоимость секторов и доходы трудовых ресурсов движутся противонаправленно в соответствии с хорошо известным уравнением теплопроводности аналогично газу или жидкости в пространстве, что дает возможность применить методику анализа, используемую в физике, в отношении экономических задач по миграции экономических параметров.

Оптимум по Парето гласит, что благосостояние общества достигает максимума, а распределение ресурсов становится оптимальным, если любое изменение этого распределения ухудшает благосостояние хотя бы одного субъекта экономической системы.

Парето-оптимальное состояние рынка - ситуация, когда нельзя улучшить положение любого участника экономического процесса, одновременно не снижая благосостояния как минимум одного из остальных.

Согласно критерию Парето (критерию роста общественного благосостояния), движение в сторону оптимума возможно лишь при таком распределении ресурсов, которое увеличивает благосостояние по крайней мере одного человека, не нанося ущерба никому другому.

Говорят, что ситуация S* доминирует по Парето ситуацию S, если:

· для любого игрока его выигрыш в S<=S*

· есть хотя бы один игрок, для которого его выигрыш в ситуации S*>S

В задаче "дилемма заключенных" равновесию по Парето, когда улучшить положение ни одного из игроков, не ухудшая при этом положение другого, нельзя, соответствует ситуация квадрата (2;2).

 

Рассмотрим пример 1:

5,5 1,2

3,1 4,4

Равновесия в доминирующих стратегиях нет.

Равновесие по Нэшу. (5,5) и (4,4). Так как ни одному из игроков невыгодно по отдельности отклоняться от выбранной стратегии.

Оптимум по Парето. (5,5). Так как выигрыш игроков при выборе этих стратегий больше выигрышей при выборе других стратегий.

Равновесие Штакельберга:

Первый ход делает игрок А.

Выбирает свою первую стратегию. Б выбирает первую стратегию. А получает 5.

Выбирает свою вторую стратегию. Б выбирает вторую. А получает 4.

5 > 4 => равновесие по Штакельбергу (5, 5)

Первый ход делает Б.

Выбирает свою первую стратегию. А выбирает первую стратегию. Б получает 5.

Выбирает свою вторую стратегию. А выбирает вторую. Б получает 4.

5 > 4 => равновесие по Штакельбергу (5, 5)

Пример 2. Моделирование дуополии [2].

Рассмотрим существо этой модели:

пусть существует отрасль с двумя фирмами, одна из которых «фирма-лидер», другая — «фирма-последователь». Пусть цена на продукцию является линейной функцией общего объема предложения Q:

P (Q) = abQ.

Предположим также, что издержки фирм на единицу продукции постоянны и равны с 1 и с 2 соответственно. Тогда прибыль первой фирмы будет определяться формулой

Π1 = P (Q 1 + Q 2) * Q 1c 1 Q 1,

а прибыль второй соответственно

Π2 = P (Q 1 + Q 2) * Q 2c 2 Q 2.

В соответствии с моделью Штакельберга, первая фирма - фирма-лидер - на первом шаге назначает свой выпуск Q 1. После этого вторая фирма - фирма-последователь - анализируя действия фирмы-лидера определяет свой выпуск Q 2. Целью обеих фирм является максимизация своих платёжных функций.

Равновесие Нэша в этой игре определяется методом обратной индукции. Рассмотрим предпоследний этап игры - ход второй фирмы. На этом этапе фирма 2 знает объем оптимального выпуска продукции первой фирмой Q 1*. Тогда задача определения оптимального выпуска Q 2* сводится к решению задачи нахождения точки максимума платёжной функции второй фирмы. Максимизируя функцию Π2 по переменной Q 2, считая Q 1 заданным, находим, что оптимальный выпуск второй фирмы

.

Это наилучший ответ фирмы-последователя на выбор фирмой-лидером выпуска Q 1*. Фирма-лидер может максимизировать свою платёжную функцию, учитывая вид функции Q 2*. Точка максимума функции Π1 по переменной Q 1 при подстановке Q 2* будет

.

Подставляя это в выражение для Q 2*, получим

.

Таким образом, в равновесии фирма-лидер производит в два раза большее количество продукции, нежели фирма-последователь.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...