Матрична гра з нульовою сумою
Найповніше розроблені методи розв’язування скінченої парної гри з нульовою сумою, яку й розглянемо далі. Такі ігри описують найпростіші конфліктні ситуації і теоретично більш розроблені. Гру називають грою з нульовою сумою, якщо одна із сторін виграє все те, що програє інша, тобто сума виграшу сторін
де Таким чином, така гра є замкненою системою, оскільки виграш однієї сторони відбувається повністю за рахунок програшу іншої. Величина Якщо стратегії Розглянемо парну гру з нульовою сумою. Нехай маємо т стратегій Усі наслідки гри зобразимо у вигляді платіжної матриці
Величини При розв’язуванні матричної гри з нульовою сумою достатньо знати матрицю Розглянемо простий приклад гри. Підприємство випускає три види продукції
Треба знайти оптимальну поведінку однієї із сторін: при цьому перша сторона – підприємство – максимізує свій виграш, тобто робить спробу продати свій товар найдорожче, друга сторона – покупець – намагається мінімізувати свій програш, тобто купити товар найдешевше. З отриманої матриці очевидно, що коли є попит Розглянемо процес вибору стратегій, коли йдеться про гру з нульовою сумою. Такі задачі розв’язують за принципом мінімаксу. Формалізація принципу мінімаксу така: коли вибрано стратегію
а тому сторона А з можливих значень
Ця величина є гарантованим успіхом (виграшем) сторони А для будь-якої відповіді сторони Отже, коли гравець А дотримується стратегії максиміну, то йому гарантовано успіх не менш ніж величина а. З боку В, за аналогією, проводимо аналіз усіх
а потім для її зменшення вибираємо найменшу величину з множини
Ця величина вказує на найменші збитки з боку В у разі правильної гри, тобто сторона В не повинна програвати більше ніж Узагалі маємо Розглянемо процес вибору стратегії з боку А згідно з матрицею прикладу.
Якщо вибрано стратегію аналогічно для
а для
Значення Такий вибір підсумків гри можна записати у вигляді
За аналогією маємо
Існують ігри, в матриці підсумків Такий елемент називають сідловою точкою матриці, а саму гру – грою із сідловою точкою. Термін „сідлова точка” використовують за аналогією з конфігурацією сідла, яке скривлюється вгору за одним напрямком і вниз – за іншим (рис. 5.2).
Рис.5.2 Гра із сідловою точкою має єдиний розв’язок, який задовольняє обидві сторони. Такий розв’язок є оптимальний, а вибрані стратегії згідно з цим розв’язком є чисті. Отже, якщо обидві сторони відповідають правильно, то розв’язок буде єдиним
Наприклад, нехай задано таку матрицю:
Максимін для неї
а мінімакс
Таким чином,
Мішані стратегії
Якщо немає сідлової точки
у кожній її партії. Такий виграш можна знайти при користуванні мішаною стратегією, за допомогою якої знаходять вибір чистих стратегій. Мішана стратегія – це сукупність імовірностей вибору чистих стратегій, тобто це вектор
де Наведене випливає з того, що чисті стратегії є несумісними подіями, які складають повну групу елементарних подій. Тому тільки одна подія може бути вибрана при створенні конкретної ситуації в процесі гри. Мішану стратегію з боку В можна зобразити аналогічно:
де Зауважимо, що іноді не всі чисті стратегії беруть участь у розв’язуванні задачі. Чисті стратегії, які увійшли в мішану стратегію з відмінними від нуля ймовірностями, називають активними. Оскільки сума ймовірностей чистих стратегій дорівнює одиниці, то будь-яку чисту стратегію можна вважати мішаною з імовірністю одиниця, а інші чисті стратегії прирівняти до нуля. При цьому мішана стратегія
де Розглянемо таку теорему: якщо одна із сторін дотримується оптимальної стратегії, то її виграш ставить не менше ціни гри Формально ця теорема розуміється так. Якщо сторона А використовує мішану стратегію
то в разі будь-якої відповіді з боку В виграш не повинен бути меншим від значення
Аналогічно для сторони В: якщо використовується мішана стратегія
Таким чином, для знаходження оптимальної мішаної стратегії необхідно та достатньо виконати нерівності всіх співвідношень розглянутої теореми. Часто при застосуванні мішаних стратегій користуються механізмом випадкових чисел для вибору чистих стратегій. У складних іграх іноді застосовують засоби, які спрощують ці ігри. Такі засоби дають змогу зменшити розміри матриці (тобто зменшується кількість стратегій): – виключення дублюючих рядків, якщо вони існують; – виключення явно невигідних рядків чи колонок порівняно з іншими домінуючими стратегіями. Рядок вважається невигідною стратегією сторони А, якщо всі його елементи менші за відповідні елементи іншого домінуючого рядка. Колонка є невигідною стратегією сторони В, якщо всі її елементи перевищують відповідні елементи іншої домінуючої колонки.
Замість заданих чистих стратегій уводяться об’єднані стратегії, які дорівнюють середньозваженим значенням чистих стратегій. При цьому припускається, що об’єднані чисті стратегії чергуються випадково з однаковою ймовірністю.
Читайте также: Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|