Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Матричная игра двух лиц с ненулевой постоянной суммой




Конечная игра, в которой сумма выигрышей обоих игроков не равна нулю и постоянна для всех сочетаний их чистых стратегий, называется матричной игрой двух лиц с ненулевой постоянной сум­мой. Пусть — матрица выигрышей игрока 1 и — матрица выигрышей игрока 2. Причем для всех .

Такого рода игра сводится к игре двух лиц с нулевой суммой следующим образом:

1) каждому игроку выплачивается сумма с /2;

2) решается игра с нулевой суммой с матрицей выигрышей игрока 1, где

Действительно, в игре с преобразованной таким способом мат­рицей выигрышей игрок 2 получает сумму с /2 – аij для всех i = 1,..., т; j = 1,..., п, т.е. новая игра является игрой с нулевой суммой. При этом каждый игрок ничего не теряет от того, что каждый из них в игре получает на с /2 меньше, поскольку по с /2 они получили перед игрой.

Примеры

Пример 1. Выбор стратегии. Матрица некоторой игры имеет вид

Найдите оптимальные стратегии игроков.

Решение. В этой игре игрок 1 имеет три возможные страте­гии: а 1, а 2, а 3 из, а игрок 2 — четыре возможные стратегии: b 1, b 2, b 3, b 4.

Рассмотрим процесс принятия игроками решения (предпола­гается, что они действуют рационально). Взглянув на таблицу, можно заметить, что если игрок 1 не знает, как поступит его про­тивник, то, действуя наиболее целесообразно и считая, что про­тивник будет действовать подобным же образом, он выберет стра­тегию а 2, которая гарантирует ему наибольший из трех возмож­ных наименьших выигрышей: 9, 13, 8. Другими словами, игрок 1 руководствуется принципом максиминного выигрыша. Этот выигрыш a = аij есть нижняя цена игры. Для нашего примера a = 13.

Игрок 2 рассуждает аналогично: если он выберет стратегию b 1,,то потеряет самое большее 23, если стратегию b 2, то — 40, и т.д. В результате он выберет стратегию b 3, которая гарантирует ему наименьший из четырех возможных проигрышей: 23, 40, 13, 25. Принято говорить, что игрок 2 руководствуется принципом мини­максного проигрыша. Этот проигрыш b = аij есть верхняя цена игры. Для нашей матрицы b = 13.

Ситуация (a 2, b 3) есть седловая точка, и a = b = 13 есть цена игры.

При наличии седловой точки ни одному из участников игры невыгодно отклоняться от своей минимаксной стратегии: он бу­дет наказан противником тем, что получит меньший выигрыш.

Пример 2. Где строить?

Две конкурирующие крупные торговые фирмы Ф1 и Ф2 пла­нируют построить в одном из четырех небольших городов Г 1, Г 2, Г 3 и Г 4, лежащих вдоль автомагистрали, по одному универсаму. Взаимное расположение городов, расстояние между ними и чис­ленность населения показаны на рис. 1.

Рис. 1

Прибыль каждой фирмы зависит от численности населения городов и степени удаленности универсамов от места жительства потенциальных покупателей. Специально проведенное исследова­ние показало, что прибыль в универсамах будет распределяться между фирмами следующим образом:

Например, если универсам фирмы Ф 1 расположен к городу Г 1ближе универсама фирмы Ф 2, то прибыль от покупок, сделанных жителями данного города, распределится следующим образом: 75% получит Ф 1, остальное — Ф 2.

Представьте описанную ситуацию как игру двух лиц.

В каких городах фирмам целесообразно построить свои уни­версамы?

Решение. Составим платежную матрицу игры, в которой иг­роком 1 будет фирма Ф 1, а игроком 2 — фирма Ф 2. Стратегии обо­их игроков: строить свой универсам в городе Г 1, в городе Г 2 и т.д. Элементы матрицы — прибыль фирмы Ф 1 (в тыс. руб.), которая, как предполагается, пропорциональна (причем с одним и тем же коэффициентом) числу покупателей. Величина указанного коэф­фициента пропорциональности для выбора оптимального места размещения универсамов значения не имеет, поэтому примем его равным единице.

Платежная матрица имеет вид

Рассмотрим примеры расчета значений элементов (Г 1, Г 2) и (Г 3, Г 4) матрицы.

Ситуация (Г 1, Г 2) означает, что фирма Ф 1, строит универсам в городе Г 1, а фирма Ф2 — в городе Г 2. Число покупателей фирмы Ф 1 складывается из покупателей четырех городов. Для ситуации (Г 1, Г 2) число покупателей из Г 1: 0,75×30, из Г 2: 0,45×50, из Г 30,45×40, из Г 4: 0,45×30, т.е. в сумме 76,5 тыс. руб. Для ситуации (Г 3, Г 4) число покупателей из Г1: 0,75×30, из Г 2: 0,75×50, из Г 3: 0,75×40, из Г 4: 0,45×30, т.е. в сумме 103,5 тыс. руб. Элементы мат­рицы выигрышей фирмы Ф 2 — дополнения до числа 150 (общее число жителей в четырех городах). Таким образом, имеет место игра двух лиц с ненулевой постоянной суммой, оптимальные стратегии которой те же, что и для соответствующей игры с ну­левой суммой.

Полученная платежная матрица имеет седловую точку (Г 2, Г 2). Соответствующий элемент матрицы равен 90.

Таким образом, обеим фирмам следует строить свои универ­самы в одном и том же городе Г 2, при этом прибыль фирмы Ф 1составит 90 тыс., а фирмы Ф 2 — 60 тыс. руб.

Пример 3. Двухпальцевая «игра морра».

Каждый игрок показывает один или два пальца и называет число пальцев, которое, по его мнению, показал его противник (ни один из игроков не видит, какое число пальцев на самом деле показывает его противник). Если один из игроков угадывает правильно, он выигрывает сумму, равную сумме числа пальцев, по­казанных им и его противником. В противном случае (если ни­кто не угадывает) — ничья. Если оба угадали, то игроки платят друг другу одинаковую сумму, в результате также ничья.

Вопросы:

1. Существует ли в данной игре седловая точка в чистых стра­тегиях?

2. Кто из игроков в среднем выигрывает и сколько?

3. Как часто игрок 1 должен говорить, что его противник по­казал два пальца?

4. Как часто игрок 2 должен показывать один палец?

Решение. Прежде всего определим стратегии игроков и по­строим платежную матрицу.

Стратегиями игрока 1 (строки таблицы) являются четыре пары чисел. Первое число каждой пары — это число пальцев, показан­ное им, второе — число пальцев, которое, как он предполагает, показал его противник. Такие же стратегии имеет игрок 2.

Платежная матрица размером 4 х 4 и другая информация пред­ставлены в следующей таблице:

Нижняя цена игры a = –2, верхняя цена игры b = 2.

Как видим, a ¹ b, поэтому седловой точки не существует и ре­шение в чистых стратегиях отсутствует. Для решения данной игры построим соответствующую задачу линейного программирования. Для этого сначала преобразуем платежную матрицу таким обра­зом, чтобы все ее элементы были положительными. Максималь­ное по абсолютной величине значение неположительного элемента платежной матрицы равно 4, поэтому к матрице достаточно при­бавить число 5:

Оптимальная стратегия игрока 1 находится решением следу­ющей задачи линейного программирования [см. (1)]:

Используя пакет POMWIN, исходную информацию для реше­ния этой задачи можно представить в виде следующей таблицы:

Получаем следующий результат:

Решение (в нижней строке):

Оптимальное значение целевой функции равно 0,2.

В последнем столбце — двойственные оценки. Переходя к переменным исходной задачи и учитывая, что v = 1/(x 1 + х 2 + х 3 + х 4) = 5 и pi = хi v, получаем:

p 1 = 0, р 2 = 0,5715, p 3 = 0, p 4 = 0,4285.

Это означает, что при многократном повторении игры первая стратегия (1, 1) и третья стратегия (2,1) игроком 1 не должны ис­пользоваться; вторая стратегия (1,2) должна использоваться с ча­стотой 0,5715, четвертая стратегия (2, 2) — с частотой 0,4285.

Аналогично определяем оптимальную стратегию игрока 2:

т.е. игрок 2 должен использовать лишь свою вторую стратегию (1,2) с частотой 0,5715 и третью стратегию (2, 1) с частотой 0,4285.

Так как исходная матрица была увеличена на 5, получаем, что цена первоначальной игры равна 0 (5 — 5). Таким образом, исход игры — ничья.

Ответы: 1. Нет, не существует. 2. Ничья. 3. Всегда. 4. 0,572.

Пример 4. Доминирование стратегий.

Платежная матрица для двух игроков имеет вид

Преобразуйте игру, исключив доминируемые стратегии.

Решение. Для игрока 1: вторая стратегия (строка 2 матрицы) доминирует четвертую и шестую стратегии, поэтому четвертую и шестую строки можно вычеркнуть. Для игрока 2: третья страте­гия (столбец 3) доминирует четвертую, поэтому четвертый стол­бец можно вычеркнуть, и т.д.

Результирующая матрица имеет вид

Пример 5. Как завоевать рынок?

Два конкурирующих друг с другом предприятия, выпускающие стиральные машины, имеют следующие доли общего сбыта своей продукции на местном рынке: 53% — предприятие 1 и 47% — предприятие 2.

Оба предприятия пытаются увеличить объем своих продаж. Для этого у них есть следующие альтернативы: a 1 (b 1) — расширить сеть сбыта; a 2 (b 2) рекламировать свою продукцию; a 3(b 3) увеличить ассортимент (число моделей стиральных машин); a 4 (b 4) — ничего не предпринимать.

Анализ показал, что при осуществлении обоими предприяти­ями указанных мероприятий доля (в %) предприятия 1 на рынке стиральных машин изменится следующим образом:

Сформулируйте данную ситуацию в виде игры.

Вопросы:

1. Какое из мероприятий предприятия 1 наиболее эффективно?

2. Какую долю на рынке будет иметь предприятие 1?

3. Какое из мероприятий предприятия 2 наиболее эффективно?

4. С какой частотой следует предприятию 2 использовать стра­тегию «реклама»?

Решение. Приведенную выше таблицу можно рассматривать как платежную матрицу игры двух лиц с нулевой суммой. Альтер­нативы, имеющиеся в распоряжении предприятий, — стратегии игроков. Прежде всего следует исключить доминируемые страте­гии игроков: 04 игрока 1 и 64 игрока 2. В результате получим

Увеличив все элементы матрицы на 6, решим следующую за­дачу линейного программирования:

Используя пакет POMWIN, получаем следующий результат:

Переходя к переменным исходной задачи и учитывая, что v = 1/(x 1 + x 2 + х 3) = 3,85 и pi = xi v, получаем: р 1 = 0,4, р 2 = 0,6, p 3 = 0, p 4 = 0. Цена игры, соответствующая первоначальной мат­рице, равна –2,15 (3,85 – 6). Таким образом, предприятие 1 при многократном повторении игры должно использовать с частотой 0,4 стратегию а 1 (расширить сеть сбыта), с частотой 0,6 — страте­гию a 2 (рекламировать свою продукцию), а стратегии a 3 (увели­чить ассортимент) и a 4 (ничего не предпринимать) не использо­вать вовсе. При этом доля сбыта предприятия на рынке уменьшит­ся на 2,15%. Оптимальная смешанная стратегия предприятия 2: с частотой 0,4 использовать стратегию b 1 (расширить сеть сбыта) и с частотой 0,6 — стратегию b 3 (увеличить ассортимент). Страте­гии a 2 (рекламировать свою продукцию) и a 4 (ничего не делать) не применять вовсе. Доля предприятия 2 на рынке увеличится на 2,15%. Казалось бы, поскольку в результате осуществления своих мероприятий предприятие 1 «теряет рынок», ему не следует ни­чего предпринимать, однако в этом случае оно потеряет еще боль­ше (в соответствии со стратегией a 4) из-за действий предприятия 2, которому они выгодны.

Ответы: 1. Реклама. 2. 50,85%. 3. Увеличение ассортимента. 4. С нулевой частотой, т.е. стратегия «реклама» пред­приятием 2 вообще не должна применяться.

Вопросы

Вопрос 1. Нижняя цена матричной игры { aij } m,n определяется следующей формулой:

Вопрос 2. Верхняя цена матричной игры { aij } m,n определяется следующей формулой:

Вопрос 3. Какова верхняя цена следующей игры?

Варианты ответов:

1) 1; 2) 3; 3) 4; 4) 5; 5) 6.

Вопрос 4. Какова нижняя и верхняя цена игры для нижепри­веденной матрицы?

Варианты ответов:

1) (-4, 10); 2) (0, 5); 3) (2, 4); 4) (3, 5); 5) (2, 8).

Вопрос 5. Чему равно значение элемента матрицы игры в седловой точке?

Варианты ответов:

1) 6; 2) 8; 3) 15; 4) 25; 5) седловая точка отсутствует.

Вопрос 6. Используя свойство доминирования стратегий игро­ков, максимально редуцируйте следующую матрицу игры:

Какова размерность результирующей матрицы?

Варианты ответов:

1)1х2; 2)2х1; 3)2х2; 4)3х2; 5)3х3.

Вопрос 7. Найдите цену следующей игры (без использования пакета POMWIN):

Варианты ответов:

1) 1; 2) 1,5; 3) 2; 4) 2,5; 5) 3.

Вопрос 8. Два игрока одновременно и независимо показывают О, 1, 2 или 3 пальца. Игрок, показавший большее число пальцев, платит другому игроку сумму, равную разности чисел пальцев, показанных им и его соперником. Какова цена такой игры?

Варианты ответов:

1) 3; 2) 2; 3) 1; 4) 0; 5) –1.

Вопрос 9. Два игрока одновременно и независимо показывают 1, 2 или 3 пальца. Пусть s — сумма чисел пальцев, показанных обо­ими противниками. Если s — нечетное, то игрок 1 платит друго­му игроку сумму s, если же s — четное, эту сумму выплачивает иг­рок 2. Чему равна цена такой игры?

Варианты ответов:

1) –1; 2) 0; 3) 1; 4) 1,3; 5) 1,7.

Вопрос 10. Постройте платежную матрицу следующей игры.

Игрок 2 прячет в одном из п мест предмет стоимостью сj (j = 1,.... n). Игрок 1 ищет этот предмет в одном из п мест, и если находит, то получает сj, в противном случае получает 0. Пусть п = 4 и вектор стоимости предметов с = (5, 7, 3, 12). Чему равна цена игры?

Варианты ответов:

1) 1,75; 2) 1,57; 3) 1,32; 4) 1,23; 5) 1,12.

Задачи

Задача 1. По требованию рабочих некоторой компании проф­союз ведет с ее руководством переговоры об организации горячих обедов за счет компании. Профсоюз, представляющий интересы рабочих, добивается того, чтобы обед был как можно более качест­венным и, следовательно, более дорогим. Руководство компании имеет противоположные интересы. В конце концов стороны до­говорились о следующем. Профсоюз выбирает одну из шести фирм (Ф 1 ¸ Ф 6), поставляющих горячее питание, а руководство компании — набор блюд из семи возможных вариантов (B 1¸ B 7). После подпи­сания соглашения профсоюз формирует следующую платежную матрицу, элементы которой представляют стоимость набора блюд:

Определите оптимальные стратегии игроков и цену игры.

Вопросы:

1. Чему равна цена игры?

2. Какая фирма наиболее предпочтительна для профсоюза?

3. Какой набор руководство компании считает наиболее «вы­годным»?

4. Чему равна нижняя цена игры?

Задача 2. Известный актер обдумывает, где бы ему провести в текущем году отпуск. Он рассматривает шесть возможных вари­антов: Монте-Карло (МК), Гавайские острова (Г), Багамские ос­трова (Б), Канарские острова (К), Сочи (С), озеро Байкал (ОБ). Единственный критерий для выбора места отдыха — это стрем­ление избежать встречи с журналистами, которые могут испортить ему отпуск. Если они «выследят» актера, отдых будет испорчен (полезность равна 0). В противном случае все будет, как заплани­ровано (полезность равна 1). Журналисты могут обнаружить ак­тера с такой вероятностью: в Монте-Карло — 0,34; на Гавайских островах — 0,12; на Багамских островах — 0,16; на Канарских ост­ровах — 0,4; в Сочи — 0,5; на озере Байкал — 0,2.

Опишите данную ситуацию как игру двух лиц с нулевой сум­мой (актер — игрок 1). Вычислите цену игры и определите мини­максные стратегии обоих игроков.

Вопросы:

1. Чему равна максимальная ожидаемая полезность отпуска актера?

2. С какой вероятностью актер поедет в отпуск на Байкал?

3. Чему равна верхняя цена игры?

4. В каком из мест наиболее вероятно будет отдыхать актер?

Задача 3. На «Диком Западе» имела место следующая ситуация. Группа из пяти индейцев взяла в осаду лагерь, охраняемый че­тырьмя белыми. У лагеря два входа: E 1 и Е 2. Разведчик белых установил, что перед входом Е 1 находится как минимум один ин­деец, а перед входом Е 2 как минимум два индейца. Остальное распределение неизвестно. Командир осажденных может себя и остальных трех человек распределить по E 1 и Е 2, причем у каж­дого входа должен быть как минимум один человек. Предполага­ется, что численно превосходящая (у каждого входа) группа бе­рет в плен всю группу противника без собственных потерь, в то время как при равенстве сил перед каким-либо входом потерь нет с обеих сторон. В качестве платежа (выигрыша) выступает раз­ность числа пленных.

Определите все чистые стратегии обоих противников. Построй­те платежную матрицу, считая игроком 1 обороняющуюся сторо­ну. Редуцируйте матрицу, насколько это возможно, и найдите оп­тимальные стратегии сторон.

Вопросы:

1. С какой частотой белым следует использовать стратегию: рас­положить по два человека у каждого входа?

2. Кто больше в среднем захватит пленных — белые или индейцы?

3. Какова абсолютная величина разности числа захваченных обеими сторонами пленных?

4. С какой частотой белым следует использовать стратегию:

расположить у первого входа одного, а у второго — трех че­ловек?

5. С какой частотой индейцам следует использовать стратегию:

расположить у первого входа трех, а у второго — двух воинов?

Задача 4. Имеются два предприятия, которые в дополнение к основной продукции могут выпускать побочную продукцию од­ного и того же назначения — пластмассовые игрушки. Известно, что они могут продавать ее в одном и том же городе. Игрушки немного отличаются по конструкции, оформлению, удобству и т.д. Первое предприятие может выпускать игрушки типа А 1, А 2 ,..., Аm; второе — типа B 1, В 2 ,..., Bn. Себестоимость и цена игрушек у всех предприятий одинаковы. Всего в течение года продается N игру­шек. Если первое предприятие выпускает игрушки типа Аi, а вто­рое — типа Вj, то первое предприятие продаст rijN игрушек, а второе — (NrijN). Каждое предприятие стремится получить максимальный доход от продажи игрушек.

Пусть т = 4, п = 5, N= 300 000, цена (равновесная) одной иг­рушки составляет 20 руб., элементы матрицы { rij }4,5 представле­ны в таблице:

Сформулируйте игру двух лиц, считая игроком 1 первое пред­приятие. Определите выигрыш (доход от продажи) каждого пред­приятия.

Вопросы:

1. Каков общий средний доход первого предприятия?

2. Каков общий средний доход второго предприятия?

3. Какое изделие следует выпускать первому предприятию с наибольшей вероятностью?

4. Какое изделие следует выпускать второму предприятию с наибольшей вероятностью?

5. Какова частота применения стратегии «Выпускать изделие B 2»?

Задача 5. Сторона В посылает подводную лодку в один из п регионов. Сторона А, располагая т противолодочными корабля­ми, стремится обнаружить лодку противника. Сторона B стремит­ся этого избежать. Вероятность обнаружения подводной лодки в j -м регионе одним противолодочным кораблем равна рj (j = 1,..., n).

Предполагается, что обнаружение лодки каждым кораблем яв­ляется независимым событием. Сторона А может посылать в различные регионы разное количество кораблей (распределение т кораблей по регионам и есть ее стратегия).

Пусть т = 3, п = 2, р 1 = 0,4, р 2 = 0,6.

Считая сторону А игроком 1, построите игру и найдите опти­мальное распределение противолодочных кораблей по регионам.

Вопросы:

1. Каков средний выигрыш стороны А?

2. С какой частотой стороне А следует посылать в регион 2 три противолодочных корабля?

3. С какой частотой стороне А следует посылать в регион 1 один противолодочный корабль?

4. С какой частотой стороне В следует посылать подводную лодку в регион 2?

Ответы и решения

Ответы на вопросы: 1 —4, 2 — 5, 3 —2, 4 — 4, 5 —2, 6 —3, 7 — 3, 8 —4, 9 —2, 10 —2.

Задача 1. Решение.

Модель линейного программирования и решение представлены в следующей таблице:

Цена игры v = 1/(0,196 + 0,131) = 3,06.

Вероятности выбора фирм Р = (0,6; 0,4; 0; 0; 0; 0).

Вероятности выбора наборов Q = (0,24; 0; 0,76; 0; 0; 0; 0).

Ответы: 1. 3,06. 2. Ф 1. 3. B 3 4. 2,3.

Задача 2. Решение.

Матрица игры и решение задачи линейного программирования представле­ны в следующей таблице:

Цена игры равна 0,96. Частоты использования игроком 1 своих стратегий Р = (0,11; 0,32; 0,24; 0,096; 0,077; 0,19).

Ответы: 1. 0,96. 2. 0,19. 3. 1. 4. На Гавайских островах.

Задача 3. Решение.

Матрица игры имеет вид

После исключения доминируемых стратегий матрица примет вид

После приведения данной матрицы к положительно определенной, решив задачу, получаем: цена исходной игры равна 0, т.е. белые, даже применяя опти­мальную стратегию, теряют на одного человека больше (здесь имеет смысл округлить цену игры до ближайшего целого). Другими словами, индейцы берут в плен на одного человека больше.

Оптимальная смешанная стратегия белых: с частотой 0,2 применять страте­гию (1, 3) и с частотой 0,8 — стратегию (3, 1). Оптимальная смешанная страте­гия индейцев: с частотой 0,4 применять стратегию (1, 4) и с частотой 0,6 — стра­тегию (3, 2).

Ответы: 1.0. 2. Индейцы. 3.1. 4.0,2. 5.0,6.

Задача 4. Решение.

Данная игра — это игра двух лиц с ненулевой постоянной суммой. Сумма выигрышей обоих игроков при любых сочетаниях стратегий предприятий равна 6 (все числа в матрице выигрышей даны в миллионах). Сведем ее к игре двух лиц с нулевой суммой. Для этого до игры каждому предприятию выплачивается поло­вина постоянной суммы, т.е. 3, а из выигрыша каждого предприятия (из элемен­тов матрицы) вычитается 3. Полученная матрица соответствует игре с нулевой суммой, поэтому достаточно указать в ней только выигрыши одного (первого) предприятия. После необходимых расчетов матрица игры имеет вид

Прибавим к матрице число 3, чтобы все ее элементы были положительными. Матрица задачи и решение показаны в следующей таблице:

Цена преобразованной игры равна 1/0,34 = 2,94.

Оптимальная смешанная стратегия игрока 1 (частоты использования игроком 1 своих стратегий) Р = (0,23; 0,36; 0,41; 0).

Для игрока 2 оптимальная смешанная стратегия Q = (0,43; 0; 0,1; 0,47; 0). Цена исходной игры с нулевой суммой равна —0,06. Поскольку оба иг­рока получили по 3 млн руб., общий доход первого предприятия составляет 2,94 млн руб., доход второго предприятия равен 3,06 млн руб.

Ответы: 1. 2,94 млн руб. 2. 3,06 млн руб. 3. Изделие А 3 4. Изделие B 4 5. Частота применения стратегии «Выпускать изделие B 2» равна нулю.

Задача 5. Решение.

Стратегии игрока 2: I — послать подводную лодку в регион 1; II — послать подводную лодку в регион 2. Множество стратегий игрока 1: {(0, 3), (1, 2), (2,1), (3, 0)}. Числа в скобках — это количество противолодочных кораблей, посыла­емых в каждый из двух регионов.

Вероятность обнаружить подводную лодку в регионе j с помощью k противо­лодочных кораблей равна (1 – (1 – рj) k). Предположим, что выигрыш игрока 1 равен единице в случае обнаружения подводной лодки и нулю — в противном слу­чае. Тогда матрица игры имеет вид

Элементы матрицы — средние выигрыши игрока 1 в соответствующих ситу­ациях.

Модель линейного программирования и решение (элементы матрицы увели­чены на 1):

Цена игры равна 1/0,62 = 1,61. Цена первоначальной игры равна 1,61 – 1 = =0,61.

Частоты применения стороной А своих стратегий Р = (0; 0,92; 0,08; 0). Сторона В посылает подводную лодку в оба региона с равной вероятностью (0,31×1,61 = 0,5).

Ответы: 1. 0,61, т.е. средний выигрыш равен цене игры.

2. Стороне А не следует посылать в регион 2 три противолодочных корабля.

3. С частотой 0,92.

4. С частотой 0,5.

Глава 11. Нелинейное программирование

Цели

В данной главе описываются оптимизационные задачи нелиней­ного программирования (НЛП), математические модели которых содержат нелинейные зависимости от переменных. Источники не­линейности относятся в основном к одной из двух категорий:

1) реально существующие и эмпирически наблюдаемые нели­нейные соотношения, например: непропорциональные зависимо­сти между объемом производства и затратами; между количеством используемого в производстве компонента и некоторыми показа­телями качества готовой продукции; между затратами сырья и физическими параметрами (давление, температура и т.п.) соответ­ствующего производственного процесса; между выручкой и объ­емом реализации и др.;

2) установленные (постулируемые) руководством правила поведения или задаваемые зависимости, например: формулы или правила расчета с потребителями энергии или других видов услуг; эвристические правила определения страховых уровней за­паса продукции; гипотезы о характере вероятностного распреде­ления рассматриваемых в модели случайных величин; различного рода договорные условия взаимодействия между партнерами по бизнесу и др.

Решать линейные задачи значительно проще, чем нелинейные, и если линейная модель обеспечивает адекватность реальным си­туациям, то ее и следует использовать. В практике экономичес­кого управления модели линейного программирования успешно применялись даже в условиях нелинейности. В одних случаях нелинейность была несущественной и ею можно было пренебречь, в других — производилась линеаризация нелинейных соотноше­ний или применялись специальные приемы, например строились так называемые линейные аппроксимационные модели, благода­ря чему достигалась требуемая адекватность. Тем не менее име­ется большое число ситуаций, где нелинейность является сущест­венной и ее нужно учитывать в явном виде.

Далее приводятся общая модель задачи нелинейного програм­мирования и классы задач НЛП, а также описываются условия оптимальности решения.

После того как вы выполните задания, предлагаемые в этой главе, вы будете уметь определять и использовать для экономи­ческого анализа:

• целевую функцию;

• ограничения;

• допустимый план;

• множество допустимых планов;

• модель нелинейного программирования;

• оптимальный план.

Вы сможете также:

• определять, является ли функция выпуклой;

• строить функцию Лагранжа задачиНЛП;

• проверять оптимальность полученных решений.

Модели

В общем виде задача НЛП описывается с помощью следующей модели нелинейного программирования:

где х = (x 1, х 2 ,..., хn) вектор переменных задачи.

Задача (1)—(3) называется задачей нелинейного программирова­ния в стандартной форме на максимум.

Может быть сформулирована также задача НЛП на минимум.

Вектор х = (x 1, х 2 ,..., хn), компоненты хj которого удовлетво­ряют ограничениям (2) и (3), называется допустимым решением или допустимым планом задачиНЛП.

Совокупность всех допустимых планов называется множеством допустимых планов.

Допустимое решение задачи НЛП, на котором целевая функ­ция (1) достигает максимального значения, называется оптималь­ным решением задачи НЛП.

Возможное местонахождение максимального значения функ­ции F( x ) при наличии ограничений (2) и (3) определяется следующим общим принципом. Максимальное значение F( x ), если оно существует, может достигаться в одной или более точках, кото­рые могут принадлежать следующим множествам:

— внутренняя точка множества допус­тимых планов, в которой все первые частные производные

— точка границы множества допус­тимых планов};

— точка множества допустимых планов, в которой функция F (x) недифференцируема}.

В отличие от задач линейного программирования, любая из ко­торых может быть решена симплекс-методом, не существует одного или нескольких алгоритмов, эффективных для решения любых нелинейных задач. Какой-то алгоритм может оказаться чрезвычай­но эффективным для решения задач одного типа и неудачным для задач другого типа.

Эффективность алгоритма может даже существенно зависеть от постановки задачи, например от изменения масштабов измерения тех или иных переменных. Поэтому алгоритмы разрабатываются для каждого класса (типа) задач. Программы, ориентированные на решение определенного класса задач, как правило, не гаран­тируют правильность решения любых задач данного класса, и оптимальность решения рекомендуется проверять в каждом кон­кретном случае.

В экономических приложениях рассматриваются следующие классы задач НЛП.

1. Оптимизация нелинейной функции с ограничениями на неотри­цательность значений переменных:

F (х) ® mах,

x ³ 0,

где х = (х 1, х 2 ,..., хn) — вектор переменных задачи.

Пусть F (x) — дифференцируемая функция.

Необходимые условия того, что в точке х 0 достигается макси­мум функции F (x):

Это означает, что:

и

Если F( x ) вогнутая функция (для задачи минимизации — выпуклая), то эти условия являются также достаточными.

Функция F( x ) с числовыми значениями, определенная на вы­пуклом множестве точек К, называется вогнутой, если для любой пары точек х 1, х 2 и для всех чисел l, 0 £ l £ 1, выполняется нера­венство

Если то функция F (x) называется выпуклой. Если имеют место строгие неравенства, то говорят, что функция строго вогнута или строго выпукла.

Данное определение вогнутости (выпуклости) годится для лю­бого типа функции. Практически, однако, применять его трудно.

Для дважды дифференцируемой функции F (x) имеет место следующий критерий. Дифференцируемая функция F (x) строго вогнута в некоторой окрестности точки если выполняются следующие условия:

т.е. если знаки этих определителей чередуются указанным образом.

Здесь — частная производная второго порядка, вычис­ленная в точке х 0.

Матрица размера п ´ п, составленная из элементов , на­зывается матрицей Хессе (Hesse). По значениям ее главных миноров можно судить о выпуклости или вогнутости функции. Функ­ция F (x) строго выпукла в малой окрестности точки х 0, если все главные миноры ее матрицы Хессе строго положительны. Если имеют место нестрогие неравенства (³), то функция в окрестно­сти точки х 0 выпукла. Если при этом главные миноры матрицы Хессе от х не зависят, то функция всюду (строго) выпукла.

Весьма распространены относящиеся к данному типу модели квадратичного программирования, в которых целевая функция F (x)является квадратичной функцией переменных х 1, х 2 ,..., хn. Су­ществует большое число алгоритмов решения такого типа задач, в которых функция F (x) вогнутая (для задач минимизации — выпуклая).

2. Модели выпуклого программирования. К такого рода моделям относятся задачи НЛП (1)—(3), в которых F (x) вогнутая (выпук­лая) функция, a gi (x) выпуклые функции. При данных услови­ях локальный максимум (минимум) является и глобальным.

Пусть F (x) и gi (x), i= 1,..., т, — дифференцируемые функции.

Необходимые и достаточные условия оптимальности решения — выполнение условий Куна — Таккера.

Рассмотрим задачу НЛП (1)—(3) и функцию Лагранжа L (х, l) =

Условия Куна — Таккера оптимальности решения х 0 для зада­чи максимизации F (x) имеют вид

где — частная производная функции Лагранжа по пе­ременной хj при х = х 0 и l = l 0. Пусть максимальное значение F (x) равно F (x 0) = F 0. Числа связаны с F 0 следующими соотношениями:

Из этих соотношений видно, что числа характеризуют ре­акцию значения F 0

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...