Связь матричных игр с линейным программированием (основная теорема теории игр). Пример решения задачи
⇐ ПредыдущаяСтр 25 из 25 Первоначально развитие теории стратегических матричных игр осуществлялось параллельно и независимо от линейного программирования. Позже было установлено, что стратегическая матричная игра может быть сведена к паре двойственных задач линейного программирования. Решив одну из них, получаем оптимальные стратегии игрока 1; решив другую, получаем оптимальные стратегии игрока 2. Математическое соответствие между стратегическими матричными играми и линейным программированием было установлено Дж. Б. Данцигом, сформулировавшим и доказавшим в 1951 г. основную теорему теории игр [23]. Теорема. Каждая матричная игра с нулевой суммой всегда имеет решение в смешанных стратегиях, т.е. существуют такое число v и такие стратегии U* и W* игроков 1 и 2 соответственно, что выполняются неравенства: Поясним смысл доказываемых неравенств: если игрок 1 отклоняется от своей оптимальной стратегии, то его выигрыш не увеличивается по сравнению с ценой игры; если от своей оптимальной стратегии отклоняется игрок 2, то по сравнению с ценой игры его проигрыш не уменьшается. Доказательство. Пусть матрица игры равна A = . Всегда можно считать, что все коэффициенты аij > 0. Если это не так, то предположим, что наименьший из всех отрицательных коэффициентов есть а0 < 0. Тогда увеличим все элементы платежной матрицы на произвольное положительное число а > – а0. Функция выигрыша при этом окажется равной Из этого следует, что от увеличения всех элементов матрицы A = на величину a цена игры увеличивается на эту величину, причем оптимальные смешанные стратегии не изменяются. Для определения среднего оптимального выигрыша игрока 1, соответствующего первоначальной платежной матрице, необходимо из найденной цены игры вычесть величину а.
Рассмотрим теперь пару двойственных задач линейного программирования с матрицей условий A = (aij > 0), совпадающей с платежной матрицей игры. Введем вектор ограничений прямой задачи В = (1, 1,..., 1) T, состоящий из т единиц (это вектор-столбец, для удобства записи представленный в виде транспонированной строки. Т - символ транспонирования матрицы), и вектор-строку коэффициентов линейной формы или функционала С = (1, 1,..., 1), состоящий из п элементов. Тогда в векторно-матричной форме соответствующая задача линейного программирования может быть записана следующим образом: где Х- вектор искомых переменных задачи (П1). То же в скалярной форме: Двойственная задача к задаче линейного программирования (П1) может быть записана следующим образом: где Y - вектор искомых переменных задачи (П2). То же в скалярной форме: Все элементы матрицы А по предположению положительны, поэтому многогранные множества задач (П1) и (П2) ограничены. Многогранник задачи (П1) не пуст, так как Х = 0 является допустимым планом. Следовательно, задача (П1), а с ней (по первой теореме двойственности) и задача (П2) разрешимы, и их функционалы в оптимальных планах совпадают (вторая теорема двойственности): (С, X*) = (У* В). С учетом выбранных единичных векторов С и В получаем следующее соотношение: Из условия YA ³ С следует, что Y*¹ 0, поэтому Положительность значения v обеспечивается положительностью всех значений элементов платежной матрицы А. Обозначим U* = vY*, W* = vX*. Поскольку v, X*, Y* неотрицательны, то U* ³ 0, W* ³ 0. Кроме того, , , так как по определению это частоты использования смешанных стратегии, а сумма частот равна единице. По условиям прямой и двойственной задач АХ £ В и YA ³ С. Оптимальные планы этих задач обозначим X* и Y *, причем по предположению X* = W*/v, Y*= U*/v. Поэтому
или Умножим обе части неравенства (ПЗ) слева на произвольный w-мерный вектор U ³0, для которого справедливо где В - единичный вектор. Получим: UAM* ³ v(U,B) = v, т.е. имеет место неравенство UAM* ³ v. (П5) Также умножим обе части неравенства (П4) справа на произвольный n -мерный вектор W > 0, для которого справедливо где С - единичный вектор. Получим: U * AM ³ v (C,W) = v, т.е. справедливо неравенство U*AM ³ v. (П6) Сравнивая неравенства (П5) и (П6), приходим к соотношению UAW* £ v £ U*AW, т.е. U* и W* - оптимальные стратегии, а v - цена игры с платежной матрицей А, что и требовалось доказать. Следствие (С1). В процессе доказательства основной теоремы теории игр с платежной матрицей A = (aij > 0) игре приведена в соответствие следующая пара задач линейного программирования: Составляющие оптимальных стратегий и игры связаны с компонентами и оптимальных планов двойственных задач линейного программирования (П7) формулами: Цена игры Следствие (С2). Вместо приведенной выше пары двойственных задач линейного программирования (П7) иногда удобнее рассматривать другую пару задач, имеющих более ясный содержательный экономический смысл: 1. Прямая задача. Игрок 1 стремится увеличить цену игры: v ® mах (П8) при условиях: т. е. игрок 1 действует так, чтобы его средний выигрыш при использовании его стратегий с частотами ui для любой j -й стратегии игрока 2 был не меньше величины v, которую он стремится увеличить; т. е. сумма частот применения стратегий игрока 1 равна единице. 2. Двойственная задача. Игрок 2 стремится уменьшить свой проигрыш: v ® min (П9) при условиях: т. е. игрок 2 действует так, чтобы его средний проигрыш при использовании его стратегий с частотами wj для любой i -й стратегии игрока 1 не превышал величины v, которую он стремится уменьшить; т. е. сумма частот применения стратегий игрока 2 равна единице. В такой постановке каждая из задач (П8) и (П9) содержит на одно переменное (v) и на одно ограничение ( или ) больше, т.е. размерности прямой и двойственной задач соответственно увеличиваются, что может сыграть определенную роль при ручном решении задач линейного программирования, но не имеет практического значения при решении задач линейного программирования на ЭВМ.
Пример решения задачи. Решить аналитически (используя мажорирование) игру с платежной матрицей
Решение. Если для первых двух строк матрицы взять весовые коэффициенты соответственно 0,25 и 0,75, то получим: 0,25 * 24 + 0,75 * 0 + 6 > 4; 0,25 * 0 + 0,75 * 8 = 6 > 4. В итоге третья строка матрицы мажорируется выпуклой линейной комбинацией первой и второй строк, поэтому третья строка вычеркивается, а матрица преобразуется к следующему виду: В матрице есть два нуля. Для того чтобы все элементы матрицы стали больше нуля, прибавим к каждому элементу по единице. Матрица примет вид: Далее ставим и решаем пару задач (двойственных) линейного программирования: Для первой задачи (игрока 2) из условия угловой точки следует: 25 x1 + x2 = 1; х1 + 9 x2 = 1, откуда получаем оптимальное решение: Находим оптимальные смешанные стратегии игрока 2: Для второй задачи (игрока 1) из условия угловой точки следует: 25 y1 + y2 = 1; y1 + 9 y2 = 1, откуда оптимальное решение равно: Оптимальными смешанными стратегиями игрока 1 будут: Цена игры рассчитывается с учетом ее поправки на единицу: v = 1:0,1427-1=6,008. Ознакомившись теперь с основной теоремой теории игр, методом их сведения к паре двойственных задач линейного программирования, мы видим, что, если в исходной матрице игры А в силу любых причин не произведены все возможные мажорирования строк и столбцов, это не скажется на результатах решения игры, но задачи линейного программирования получатся большей размерности, чем потенциально они могли быть. Соответственно в составе оптимальных смешанных стратегий игроков окажутся неактивные чистые стратегии. КРАТКИЙ СЛОВАРЬ ТЕРМИНОВ Вероятность случайного события - основная категория в теории вероятностей - положительное число, заключенное между нулем и единицей: 0 < Р(А) < 1, где Р - обозначение вероятности, А - случайное событие. Дискретные и непрерывные случайные величины - основные числовые показатели в теории вероятностей. Дискретная случайная величина может принимать конечное или бесконечное счетное множество значений. Возможные значения непрерывной случайной величины занимают некоторый интервал числовой оси (конечный или бесконечный).
Дисперсия - числовая характеристика степени разброса значений случайной величины. Дисперсия постоянной величины равна нулю. Постоянный множитель можно выносить за знак дисперсии, возведя его в квадрат: D(CX) = C2D(X), где D - знак дисперсии; С — постоянная величина. Дисперсия суммы двух независимых случайных величин равна сумме дисперсий этих величин: D(X + Y) = D (X) + D(Y). Дисперсия суммы нескольких взаимно независимых случайных величин равна сумме дисперсий этих величин. Сумма постоянной и случайной величин равна дисперсии случайной величины. Дисперсия разности двух независимых величин равна сумме их дисперсий. Достоверное событие - событие, в котором каждый элементарный исход испытания благоприятствует событию. Вероятность достоверного события равна 1. Закон распределения случайной величины - соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями. Простейшей формой задания закона распределения дискретной случайной величины Х является таблица, в которой перечислены возможные значения случайной величины и соответствующие им вероятности (ряд распределения). Для непрерывной случайной величины нельзя построить ряд распределения, так как она содержит бесконечное множество возможных значений, которые сплошь заполняют некоторый промежуток. Эти значения нельзя перечислить в какой-либо таблице. Каждое отдельное значение непрерывной случайной величины не обладает никакой отличной от нуля вероятностью. Линейное программирование - раздел прикладной математики, изучающий задачу отыскания минимума (максимума) линейной функции многих переменных при линейных ограничениях в виде равенств или неравенств. Общую задачу линейного программирования формулируют так: найти минимум функции п переменных при ограничениях: Задача максимизации линейной функции сводится к задаче ее минимизации заменой знаков всех коэффициентов сj на противоположные. Математическое ожидание - числовая характеристика случайной величины, определяющая ее среднее значение. Свойства: математическое ожидание постоянной величины равно самой постоянной; постоянный множитель можно выносить за знак математического ожидания; математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий: M(ХY) = M(X)M(Y); математическое ожидание суммы (разности) двух случайных величин равно сумме математических ожиданий слагаемых: М(Х+ Y) = М(Х) + M(Y), где М - знак математического ожидания; М(Х) - математическое ожидание случайной величины X.
Невозможное событие - событие, которое не может произойти в результате испытания. Вероятность невозможного события равна 0. Независимое событие - событие В не зависит от А, если появление события А не изменяет вероятность события В, т.е. условная вероятность события В равна его безусловной вероятности: РA(В) = Р(В). Если событие В не зависит от события А, то и событие А не зависит от события В. Это означает, что свойство независимости событий взаимно. Попарно-независимые события - несколько событий, каждые два из которых независимы. Пусть А, В, С попарно независимы, тогда независимы А и В, А и С, В и С. Вероятность совместного появления нескольких событий, независимых в совокупности (АВС), равна произведению вероятностей этих событий: Р(АВС) = Р(А)Р(В)Р(С). Практически достоверное событие - событие, вероятность которого не в точности равна единице, но очень близка к ней: Р(А)» 1. Практически невозможное событие - событие, вероятность которого не в точности равна нулю, но очень близка к нему: Р(А)» 0. Например, если парашют не раскрывается с вероятностью 0,01, - это недопустимо, а если поезд дальнего следования опоздает на 0,01 мин, можно считать, что поезд пришел вовремя. Предмет теории вероятностей - изучение вероятностных закономерностей массовых однородных случайных событий. Противоположное событие — событие А (не А), состоящее в непоявлении события А. Теорема умножения вероятностей - инструмент для вычисления вероятности совместного события: Р(АВ) = Р(А)РA(В), где Р(АВ) — вероятность совместного события; Р(А) - вероятность появления события А; РA(В) - вероятность появления события В при условии, что событие А уже наступило. Вероятность совместного появления нескольких событий равна произведению вероятностей одного из них на условные вероятности всех остальных, причем вероятность каждого последующего события вычисляется в предположении, что все предыдущие события уже появились. В частности, для трех событий: Р(АВС) = Р(А)РA(В) РAB(С). Порядок, в котором расположены события, может быть любым. Теорема умножения независимых событий - частный случай теоремы умножения вероятностей. Вероятность совместного наступления независимых событий А и В равна произведению вероятностей этих событий: Р(АВ) = Р(А)Р(В). Функция распределения (или интегральный закон распределения) - функция F(x), определяющая для каждого значения х вероятность того, что случайная величина Х примет значение, меньшее х, т.е. F(x) = Р(Х < х). Эта функция распределения существует как для дискретных, так и для непрерывных случайных величин. ЛИТЕРАТУРА 1. Вальд А. Последовательный анализ: Пер. с англ. - М.: Физмат-гиз, 1960. 2. Вентцель Е. С., Овчаров А. А. Теория вероятностей и ее инженерные приложения. - М.: Наука, 1988. 3. Гольштейн Е. Г., ЮдинД. Б. Новые направления в линейном программировании. - М.: Сов. радио, 1966. 4. Дубров А. М. Последовательный анализ в статистической обработке информации. - М.: Статистика, 1976. 5. Дубров А. М. Математико-статистическая оценка эффективности в экономических задачах. - М.: Финансы и статистика, 1982. 6. Дубров А. М. Статистические методы в инвестиционной деятельности // Рубин Ю. Б., Солдаткин В. И., Петраков Н. Я. Общая редакция. Инвестиционно-финансовый портфель. - М.: Совинтэк, 1993. - С. 163-176. 7. Замков О. О., Толстопятенко А. В., Черемных Ю. Н. Математические методы в экономике. - М.: ДИС, 1997. - С. 245-267. 8. Клейнер Г. Б. Риски промышленных предприятий // Российский экономический журнал. - 1994. - № 5-6. - С. 85-92. 9. Клейнер Г. Б., Тамбовцев В. Л., Качалов Р. М. Предприятие в нестабильной экономической среде: риски, стратегии, безопасность. -М.: Экономика, 1997. 10. Комарова Н. В., Гаврилова Л. В. Фирма: стратегия и тактика управления рисками // Вестник Санкт-Петербургского университета. Сер. 5. Экономика. - 1993. - Вып. 2 (12). - С. 92-95. 11. Лагоша Б. А. Об оценке эффективности инвестиционных проектов //Тез. докл. научной конференции «Организационные науки и проблемы государственного регулирования рыночной экономики». - М.: ЦЭМИ РАН, Международная академия организационных наук, 1996. -С. 75-77. 12. Мак Кинси Дж. Введение в теорию игр: Пер. с англ. - М.: Физматгиз, 1960. 13. Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение: Пер. с англ. - М.: Наука, 1970. 14. Основные методические положения оптимизации развития и размещения производства / Под. ред. академиков А. Г. Аганбегяна и Н. П. Федоренко. - М.: Наука, 1978. 15. Ожегов С. И. Словарь русского языка. - М.: Русский язык, 1981. 16. Первозванский А. А., Первозванская Т.Н. Финансовый рынок: расчет и риск. - М.: Инфра-М, 1992. 17. Самуэльсон П. Экономика. Т. 1. - М.: МГП «Алгон», ВНИИСИ, 1992. 18. Соколинская Н. Э. Экономический риск в деятельности коммерческого банка. (Методы оценки и практика регулирования). - М.: Общество «Знание» РСФСР, 1991. 19. Уилкс С. Математическая статистика. - М.: Наука, 1967. 20. Хозяйственный риск и методы его измерения: Пер. с венг. / Т. Бочкаи, Д. Месена, Д. Мико, Е. Сеп, Э. Хусти. — М.: Экономика, 1979. 21. Gren J. Ocena jacosej wyrobow obiektow ze wzgledn na wielle wymagan. - Warszawa, 1970. 22. Gren J. Statystyczne i ich Zastosowania. Panstwowe Wydawnictwo Ekonomiczne. - Warszawa, 1972. 23. Dantzig G. B. A proof of the equivalence of the programming and the game problem. Activity Analysis of Production and Allocation, ed. By Koopmans T. C., Cowles Commission Monograph, № 13, New York, Wiley, 1951. -P.330-335. ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Безразличие к риску 73, 74 Безусловный денежный" эквивалент (БДЭ) 50, 67 Величина страхования оптимальная 78, 80 Вероятность 13, 15, 25, 33, 57, 62, 65, 72, 81, 101, 112, 117, 157 Дерево решений 47, 48, 53 Дисперсия 13, 58 Задача линейного программирования 19, 30, 36, 86, 90,158, 162 Игра антагонистическая 18, 108, 113 одношаговая 19 многошаговая 19 с природой 20, 38, 45, 64 с седловой точкой 22, 24, 26, 33, 37 статистическая 20, 108, 110, 111, 114, 123, 129, 136, 149, 153 стратегическая 16, 20, 38, 42, 113, 114, 123, 129, 153 Инвестиции 86, 88, 92, 99, 104 Индекс риска 86 Комбинация стратегий линейная выпуклая 33, 34 Коэффициент дисконтирования 93, 94, 97, 99, 103, 106 Критерий максимакса 42, 45 минимаксного риска (Сэвиджа) 43, 45 пессимизма-оптимизма (Гурвица) 43, 44, 45 Мажорирование (доминирование) стратегий 32, 35, 39, 41, 164 Максимин 21, 22 Математическое ожидание 13, 26, 58, 101, 111, 113 Матрица выигрышей 41, 43, 47 платежная 17, 29, 32, 38, 40, 47, 51, 56, 60, 64 рисков 40, 43, 47 Минимакс 21, 22 Неопределенность 40, 42 Несклонность к риску 73, 74 Ожидаемая денежная оценка (ОДО)50, 52, 55,65, 67, 71, 74, 77 Полезность по Нейману - Моргенштерну 70, 71, 73, 76, 80 Планирование финансовое 86 Рандомизация 109, 112 Риск 10, 38, 40, 46, 59, 68, 71, 74, 76, 89, 109, 114, 115 Склонность к риску 44, 59, 73, 74, 76 Спрос на страхование 80, 82 Среднее квадратичное отклонение 13, 59, 61 Стратегия активная 27, 29 игрока 17, 20, 158 оптимальная 24, 27, 29, 108 смешанная оптимальная 26, 27, 29, 30 чистая оптимальная 23 Стоимость проекта чистая приведенная 93, 96, 97,99 Теорема основная теории игр 158, 165 Теория игр 16 статистических решений 46 Точка седловая 20, 23 Функция рандомизированная 110, 136, 141 нерандомизированная 110, 124, 136, 140, 144, 149 потерь 111 решения байесовская 112, 114 риска 111, 112, 141 Цена игры 22, 26, 27, 29 чистая верхняя 21, 24 чистая нижняя 21, 24 Ценность ожидаемая точной информации 55, 56 фирмы 96
Учебное пособие Дубров Абрам Моисеевич Лагоша Борис Александрович Хрусталев Евгений Юрьевич МОДЕЛИРОВАНИЕ РИСКОВЫХ СИТУАЦИЙ В ЭКОНОМИКЕ И БИЗНЕСЕ Ведущий редактор Л.А. Табакова Редактор А.М. Мжтормка Художественный редактор Ю.И. Артюхов Технический редактор Е.В. Кузьмина Корректоры Т.М. Колоакова, Т.М. Васильева Обложка художника Н.М. Биксеитеевж Компьютерная верстка О.Е. Хрусталева ИБ№3965 Лицензия ЛР № 010156 от 29.01.97 Подписано в печать 17.01.2000. Формат 60х88/16 Гарнитура «Таймс». Печать офсетная усл.п.л. 10,8. Уч.-изд. л. 8.23 Тираж 4000экз. Заказ 325 «С» 031 Издательство «Финансы и статистика» 101000, Москва, ул. Покровка, 7 Телефон (095) 925-35-02, факс (095) 925-09-57 E-mail: mail@finstat.ru http://www. finstat.ru Великолукская городская типография Комитета по средствам массовой информации и связям с общественностью администрации Псковской области, 182100, г. Великие Луки, ул. Полиграфистов, 78/12 Тел./факс: (811-53) 3-62-95 E-mail: VTL@MART.RU
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|