Главная | Обратная связь | Поможем написать вашу работу!

Детерминистский случай. Метод Беллмана

Многостадийные задачи принятия решений

Постановка задачи

Дерево решений

Примеры, которые мы рассматривали до сих пор, включали в себя единственное решение. Однако на практике результат одного решения заставляет нас принимать следующее и т.д. Эту последовательность нельзя выразить матрицей решений, поэтому нужно использовать какой-то другой способ описания и решения задачи.

Понятие многостадийной (многоэтапной, многошаговой) задачи принятия решений весьма многогранно. Поэтому могут рассматриваться совершенно различные модели многостадийности от простых до достаточно сложных. Мы здесь остановимся на обсуждении некоторых традиционных подходов к проблеме, позволяющих уяснить главные черты и особенности многостадийных задач принятия решений в условиях неопределенности. В частности, будем предполагать, что решаемая проблема является одноцелевой. Например, весьма часто цель всей операции заключается в максимизации "доходов" (прибыли, полезности) или минимизации "затрат". Предполагается, что получение "доходов" реализуется на каждом этапе процесса принятия решений, а затем эти "доходы" суммируются (принцип аддитивности).

Рассматриваемая далее модель многостадийной задачи принятия решений предполагает наличие некоторого графа, называемого деревом решений и, по существу, описывающего то, как можно попадать из заданного множества его начальных вершин в заданное множество его конечных вершин.

Схема дерево решений очень похожа на граф связей альтернатив с исходами. Ее используют, когда нужно принять несколько решений, когда каждое решение зависит от исхода предыдущего или множества исходов. Дерево решений, отображает структуру проблемы. Располагаются деревья слева направо.

На схеме используются два типа узлов: квадратные узлы обозначают точки, где принимается решение, круглые узлы – множество альтернатив и множество исходов.

Ветви показывают, какие из альтернативных решения могут быть приняты в решающей вершине, и возможные исходы, возникающие в результате этих решений. На схеме используется два вида ветвей: первый – пунктирные линии, соединяющие квадраты с узлами возможных решений, второй – сплошные линии, соединяющие кружки возможных альтернатив и множества исходов.

На рис. 4.1 дан пример так называемого детерминистского дерева решений, описывающего процесс принятия решений в условиях определенности.

В этом случае граф содержит только «решающие» вершины. С каждой из решающих вершин ассоциируется некоторое состояние в котором находится объект принятия решений. Наличие нескольких дуг, входящих в вершину, показывает, что в нее можно попасть различными способами. Дуги выходящие из вершины соответствуют возможным переходам из данного состояния в другое в зависимости от принимаемых решений. Все расходы, вызванные решением, проставляются на соответствующей ветви: каждая ветвь графа имеет свой вес – вещественное число, означающее соответствующие локальные «затраты» на переход в другое состояние.

Предполагается, что процесс разворачивается во времени, чему соответствует движение по графу слева направо. Допустимые начальные и конечные вершины заштрихованы.

Рис. 4.1. Дерево решений в условиях определенности

Задача состоит в оптимальном выборе начальной вершины (из множества допустимых) и пути из нее в любую из допустимых конечных вершин. Оптимальность понимается в смысле построения допустимого пути реализующего минимальные суммарные затраты (задача выбора минимального пути на графе). В частном случае множества допустимых начальных и конечных вершин могут быть одноэлементными.

Более сложная ситуация возникает в ситуации принятия решений в условиях риска, когда выбор конкретного решения определяет не новое состояние системы, а задает некоторую лотерею на множестве возможных новых состояний (плотность распределения вероятности) (рис. 4.3).

Фактически в конечномерном случае (который и рассматривается) это означает, что выбор альтернативы приведет к одному из возможных исходов в соответствии с заданными вероятностями (рис. 4.3), где .

В случае полной неопределенности структура дерева сохраняется, но ветви, исходящие из вершин соответствующих множеству альтернатив, уже не будут иметь весов (распределение вероятности не известно).

Заметим, что вершины промежуточных исходов в приведенных примерах совпадают с решающими вершинами, поэтому с каждой из них связывается определенный доход (оценка исхода) заданный условиями задачи или полученный в результате расчетов.

Детерминистский случай. Метод Беллмана

Основная схема и главная идея метода динамического программирования (метода Беллмана) применительно к рассматриваемой проблематике достаточно проста и естественна. Рассмотрим конкретный пример детерминистского дерева решений (рис. 4.4).

Рис. 4.4. Дерево решений с заданными локальными затратами

На рис. 4.4 одна начальная и одна конечная вершина. Легко видеть, что, по существу, конечными являются, все четыре вершины, соответствующие моменту времени . Однако с помощью введения фиктивной вершины для удалось свести задачу к графу с одной конечной вершиной. Точно так же можно поступать и с начальными вершинами, если их несколько. Числа у дуг графа означают трудоемкости (затраты), обеспечивающие переход от одной "решающей" вершины к другой. Дуги на промежутке имеют нулевые веса, что и означает, что все вершины отвечающие , являются, по существу, конечными. Главная задача заключается в выборе оптимального в смысле суммарных затрат пути, соединяющего начальную и конечную вершины.

Основная вычислительная идея метода Беллмана базируется на двух положениях:

· Задача поиска оптимального пути начинает решаться с конца.

· Исходная задача погружается в множество аналогичных задач с различными начальными вершинами и одной и той же конечной вершиной. При этом предполагается, что в качестве начальной вершины последовательно выступают все без исключения вершины графа.

Реализуем метод Беллмана для приведенного примера. Будем продвигаться по графу справа налево, выставляя определенные числа внутри каждой из вершин (помечая вершины) и указывая оптимальные направления движения из каждой вершины с помощью одной или нескольких стрелок. При этом числа внутри квадратиков-вершин будут означать всегда одно и то же — это суммарные затраты, которые получаются при движении из данной вершины, выбранной в качестве начальной, по оптимальному пути (т. е. это наименьшие из возможных затрат). Например, если мы имеем ситуацию, изображенную на рис. 4.5, а, где вершины 2,3,4 уже помечены, и надо пометить вершину 1, то будем рассуждать следующим образом (все вершины на рис. 4.5 для удобства объяснения пронумерованы в правом верхнем углу).

Рис. 4.5. Метод динамического программирования Беллмана

Если в качестве начальной взять вершину 1, то поиск оптимального пути из нее сводится к сравнению трех чисел: 5+10=15, 4+10=14, 4 + 9= 13. Наименьшее из этих чисел – 13, и, следовательно, именно число 13 мы запишем в вершине 1, а стрелочкой соединим вершины 1 и 4 (рис. 4.5, б). Действительно, по построению число 9 (полученное на предыдущем этапе) означает минимальные возможные потери при движении из вершины 4 в фиксированную конечную вершину. Затраты в 4 единицы необходимы для перехода из вершины 1 в вершину 4. В итоге мы и получаем число 13. В двух других возможных случаях мы имеем большие затраты и, следовательно, оптимальный маршрут из вершины 1 лежит через вершину 4.

Продвигаясь справа налево, мы, обрабатывая последовательно вертикальные слои вершин, разметим весь граф (рис. 4.6).

Рис. 4.6. Размеченный граф

Для восстановления искомого оптимального пути достаточно пройти теперь уже слева направо в направлении стрелок, начиная из уже помеченной начальной вершины (оптимальный путь на рис. 4.6 выделен). Число 20 означает минимальные возможные затраты и само оно получается уже на первом этапе разметки графа. Оптимальный путь, очевидно, может быть и не единственным.

Согласно методу Беллмана одновременно находятся все возможные оптимальные пути. Проведенная процедура позволяет находить абсолютный глобальный минимум. Предыдущие рассуждения легко преобразуются к строгому доказательству данного утверждения. В то же время важно понимать, что глобально оптимальная стратегия не есть суперпозиция локально оптимальных стратегий. Скажем, при попытке построения оптимального пути на графе рис. 4.6 при движении слева направо и выборе каждый раз стрелок с наименьшим весом мы, конечно, терпим неудачу и получаем результат:

3 + 8+ 10 = 21, что больше 20.

12 3 Следующая ⇒

Воспользуйтесь поиском по сайту: