Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Детерминистский случай. Метод Беллмана




Многостадийные задачи принятия решений

Постановка задачи

Дерево решений

Примеры, которые мы рассматривали до сих пор, включали в себя единственное решение. Однако на практике результат одного решения заставляет нас принимать следующее и т.д. Эту последовательность нельзя выразить матрицей решений, поэтому нужно использовать какой-то другой способ описания и решения задачи.

Понятие многостадийной (многоэтапной, многошаговой) задачи приня­тия решений весьма многогранно. Поэтому могут рассматриваться со­вершенно различные модели многостадийности от простых до достаточ­но сложных. Мы здесь остановимся на обсуждении некоторых тради­ционных подходов к проблеме, позволяющих уяснить главные черты и особенности многостадийных задач принятия решений в условиях неоп­ределенности. В частности, будем предполагать, что решаемая проблема является одноцелевой. Например, весьма часто цель всей операции за­ключается в максимизации "доходов" (прибыли, полезности) или мини­мизации "затрат". Предполагается, что получение "доходов" реализуется на каждом этапе процесса принятия решений, а затем эти "доходы" сум­мируются (принцип аддитивности).

Рассматриваемая далее модель многостадийной задачи принятия реше­ний предполагает наличие некоторого графа, называемого деревом реше­ний и, по существу, описывающего то, как можно попадать из заданного множества его начальных вершин в заданное множество его конечных вершин.

Схема дерево решений очень похожа на граф связей альтернатив с исходами. Ее используют, когда нужно принять несколько решений, когда каждое решение зависит от исхода предыдущего или множества исходов. Дерево решений, отображает структуру проблемы. Располагаются деревья слева направо.

 

На схеме используются два типа узлов: квадратные узлы обозначают точки, где принимается решение, круглые узлы – множество альтернатив и множество исходов.

Ветви показывают, какие из альтернативных решения могут быть приняты в решающей вершине, и возможные исходы, возни­кающие в результате этих решений. На схеме используется два вида ветвей: первый – пунктирные линии, соединяющие квадраты с узлами возможных решений, второй – сплош­ные линии, соединяющие кружки возможных альтернатив и множества исходов.

На рис. 4.1 дан пример так называемого детерминистского дерева решений, описывающего процесс принятия решений в условиях определенности.

В этом случае граф содержит только «решающие» вершины. С каждой из решающих вершин ассоциируется некоторое состояние в котором находится объект принятия решений. Наличие нескольких дуг, входящих в вершину, показывает, что в нее можно попасть различными способами. Дуги вы­ходящие из вершины соответствуют возможным переходам из данного состояния в другое в зависимости от принимаемых решений. Все расходы, вызван­ные решением, проставляются на соответствующей ветви: каждая ветвь графа имеет свой вес – вещественное число, означающее соответствую­щие локальные «затраты» на переход в другое состояние.

Предполагается, что процесс разворачивается во времени, чему соответствует движение по графу слева направо. Допустимые началь­ные и конечные вершины заштрихованы.

Рис. 4.1. Дерево решений в условиях определенности

 

Задача состоит в оптимальном выборе начальной вершины (из множества допустимых) и пути из нее в любую из допустимых конечных вершин. Оптимальность понимается в смысле построения допустимого пути реализующего минимальные суммарные затраты (задача выбора минималь­ного пути на графе). В частном случае множества допустимых начальных и конечных вершин могут быть одноэлементными.

Более сложная ситуация возникает в ситуации принятия решений в условиях риска, когда выбор конкретного решения определяет не новое состояние системы, а задает некоторую лотерею на множестве возможных новых состояний (плотность распределения веро­ятности) (рис. 4.3).

Фактически в конечномерном случае (который и рассматривается) это означает, что выбор альтернативы приведет к одному из возможных исходов в соответствии с заданными ве­роятностями (рис. 4.3), где .

В случае полной неопределенности структура дерева сохраняется, но ветви, исходящие из вершин соответствующих множеству альтернатив, уже не будут иметь весов (распределение вероятности не известно).

Заметим, что вершины промежуточных исходов в приведенных примерах совпадают с решающими вершинами, поэтому с каждой из них связывается определенный доход (оценка исхода) заданный условиями задачи или полученный в результате расчетов.

Детерминистский случай. Метод Беллмана

Основная схема и главная идея метода динамического программирования (метода Беллмана) применительно к рассматриваемой проблематике достаточно проста и естественна. Рассмотрим конкретный пример де­терминистского дерева решений (рис. 4.4).

Рис. 4.4. Дерево решений с заданными локальными затратами

 

На рис. 4.4 одна начальная и одна конечная вершина. Легко видеть, что, по существу, конечными являются, все четыре вершины, соответствую­щие моменту времени . Однако с помощью введения фиктивной верши­ны для удалось свести задачу к графу с одной конечной вершиной. Точно так же можно поступать и с начальными вершинами, если их несколько. Числа у дуг графа означают трудоемкости (затраты), обеспечивающие переход от одной "решающей" вершины к другой. Дуги на промежутке имеют нулевые веса, что и означает, что все вершины отвечающие , являются, по существу, конечными. Главная задача заключается в выборе оптимального в смысле суммарных затрат пути, соединяющего начальную и конечную вершины.

Основная вычислительная идея метода Беллмана базируется на двух положениях:

· Задача поиска оптимального пути начинает решаться с конца.

· Исходная задача погружается в множество аналогичных задач с различными начальными вершинами и одной и той же конечной вершиной. При этом предполагается, что в качестве начальной вершины последовательно выступают все без исключения вершины графа.

Реализуем метод Беллмана для приведенного примера. Будем продвигаться по графу справа налево, выставляя определенные числа внутри каждой из вершин (помечая вершины) и указывая оптимальные направления движения из каждой вершины с помощью одной или нескольких стрелок. При этом числа внутри квадратиков-вершин будут означать всегда одно и то же — это суммарные затраты, которые получаются при движении из данной вершины, выбранной в качестве начальной, по оптимальному пути (т. е. это наименьшие из возможных затрат). Например, если мы имеем ситуацию, изображенную на рис. 4.5, а, где вершины 2,3,4 уже помечены, и надо пометить вершину 1, то будем рассуждать следующим образом (все вершины на рис. 4.5 для удобства объяснения пронумерованы в правом верхнем углу).

Рис. 4.5. Метод динамического программирования Беллмана

 

Если в качестве начальной взять вершину 1, то поиск оптимального пути из нее сводится к сравнению трех чисел: 5+10=15, 4+10=14, 4 + 9= 13. Наименьшее из этих чисел – 13, и, следовательно, именно число 13 мы запишем в вершине 1, а стрелочкой соединим вершины 1 и 4 (рис. 4.5, б). Действительно, по построению число 9 (полученное на пре­дыдущем этапе) означает минимальные возможные потери при движении из вершины 4 в фиксированную конечную вершину. Затраты в 4 единицы необходимы для перехода из вершины 1 в вершину 4. В итоге мы и получаем число 13. В двух других возможных случаях мы имеем большие затраты и, следовательно, оптимальный маршрут из вершины 1 лежит через вершину 4.

Продвигаясь справа налево, мы, обрабатывая последовательно верти­кальные слои вершин, разметим весь граф (рис. 4.6).

Рис. 4.6. Размеченный граф

Для восстановления искомого оптимального пути достаточно пройти теперь уже слева направо в направлении стрелок, начиная из уже поме­ченной начальной вершины (оптимальный путь на рис. 4.6 выделен). Число 20 означает минимальные возможные затраты и само оно получа­ется уже на первом этапе разметки графа. Оптимальный путь, очевидно, может быть и не единственным.

Согласно методу Беллмана одновременно находятся все возможные оп­тимальные пути. Проведенная процедура позволяет находить абсо­лютный глобальный минимум. Предыдущие рассуждения легко преобра­зуются к строгому доказательству данного утверждения. В то же время важно понимать, что глобально оптимальная стратегия не есть суперпо­зиция локально оптимальных стратегий. Скажем, при попытке построе­ния оптимального пути на графе рис. 4.6 при движении слева направо и выборе каждый раз стрелок с наименьшим весом мы, конечно, терпим неудачу и получаем результат:

3 + 8+ 10 = 21, что больше 20.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...