Субъективный байесовский метод
Дуда, Харт и Нильсон видоизменили формулы Байеса для выводов в инженерии знаний и предложили метод выводов, названный субъективным байесовским методом. При этом методе связи И, ИЛИ, специально не оговариваются, а каждый член в предпосылке представляется минимальным или максимальным значением байесовской вероятности. После этого вывода с помощью правил, которые содержат степени надежности, и выводы в случае связи КОМБ независимых доказательств, заменяются следующим образом. Прежде всего из формул Байеса следуют соотношения: (**)
(здесь A - дополнительное множество А). Кроме того, если Х и Y взаимно независимые относительно А, то справедливо соотношение:
(***)
Таким образом, используя Р(А), определим априорные шансы А:
и апостериорные шансы А при получении доказательства Х.
При этом вероятность Р и шансы О связаны отношением Р=О/(О+1), Если определены шансы, то можно получить вероятность. Пусть λx = P(X|A)/P(X|A)
отношение правдоподобия при получении доказательства Х, тогда из формулы (**) следует
O(A|X) = λx*O(А)
Аналогично, если определить отношение правдоподобия λ y относительно доказательства Y, то из формулы (***) получим апостериорные шансы А при выводе из независимых доказательств X и Y. O(A|X,Y) = λx* λy*O(A)
Априорную вероятность Р(А) гипотезы А (или априорные шансы О(А)) и правдоподобные отношения λ x, λ y, приписанные правилами, задаются на основе знаний эксперта. Если одно из доказательств Х или Y, либо оба подтверждаются с вероятностью 1, то из формул выше (расчета апостериорных шансов) соответственно можно определить апостериорные шансы и апостериорную вероятность А, но если доказательства включают ненадежные данные, то применяют следующий приближенный метод.
Пусть известно (из предыдущих выводов), что доказательство Х справедливо с вероятностью Р(Х|*) со значением в отрезке [0,1]. Тогда апостериорную вероятность P(A|(X|*)) гипотезы А можно задать, например, как функцию, указанную на рисунке.
То есть если доказательство подтверждается с вероятностью, меньшей априорной вероятности Р(Х), то соответствующее правило ничего существенно не дает и не влияет на дальнейшие выводы, но если вероятность больше Р(Х), то влияние задается линейной функцией. При этом эффективное отношение правдоподобия определяется следующим образом:
Для доказательства Y можно определить аналогичное эффективное соотношение правдоподобия λy '. Из сказанного выше следует, что при выводах в случае ненадежных доказательств, можно руководствоваться следующими правилами. Если есть только доказательство Х, то λ x в формуле O(A|X) = λx*O(А) заменяется на λx': O(A(X|*)) = λx'*O(A) а если одновременно существует независимое доказательство Y, то λy в аналогичной формуле O(A|X,Y) = λx* λy*O(A) заменяется на λ'y: O(A|(X|*),(Y|*)) = λx'*λy'*O(A)
Это и есть субъективный байесовский метод. Здесь возникает проблема: что делать, когда сумма вероятностей подмножеств, для некоторой подцели взаимно опровергающих друг друга, не равна 1. Впрочем, в этом случае можно нормировать вероятности. Но кроме этой проблемы существует проблема необходимости заранее устанавливать априорные вероятности каждого условия, проблема соответствия действительности функции апостериорной вероятности гипотезы (на рисунке) и другие проблемы. Пример. Условная вероятность – это вероятность наступления какого-то события s при условии, что уже наступило другое событие l. Условная вероятность обозначается P(s/l). Вероятность наступления двух событий вычисляется следующим образом.
P(l и s)=P(s/l)P(l) В экспертных системах используется еще одно уравнение условной вероятности: P(s) = P(s/l)·P(l)+P(s/~l)·P(~l)
Рассмотрим использование условной вероятности на примере правил, описывающих экспертную систему фондовой биржи. 1. ЕСЛИ ПРОЦЕННЫЕ СТАВКИ = ПАДАЮТ ТО УРОВЕНЬ ЦЕН = РАСТЕТ 2. ЕСЛИ ПРОЦЕНТНЫЕ СТАВКИ = РАСТУТ ТО УРОВЕНЬ ЦЕН = ПАДАЕТ 3. ЕСЛИ ВАЛЮТНЫЙ КУРС ДОЛЛАРА = ПАДАЕТ ТО ПРОЦЕНТНЫЕ СТАВКИ РАСТУТ 4. ЕСЛИ ВАЛЮТНЫЙ КУРС ДОЛЛАРА = РАСТЕТ ТО ПРОЦЕНТНЫЕ СТАВКИ = ПАДАЮТ Надо определить вероятность повышения уровня цен. Цель примера не в описании реальной ситуации, а в иллюстрации подхода к решению задачи. Пусть система реализует обратные рассуждения. В части ТО правил, будем искать вывод УРОВЕНЬ ЦЕН = РАСТЕТ. Подойдет правило 1: УРОВЕНЬ ЦЕН = РАСТЕТ при условии, что ПРОЦЕНТНЫЕ СТАВКИ = ПАДАЮТ. Используя уравнение 1 условной вероятности, можно оценить эти условия. Прейдем к переменным и заменим s на STOCK = РАСТЕТ и l на INT = ПАДАЮТ, в результате получим уравнение 2:
P(STOCK=РАСТЕТ)=Р(STOCK=РАСТЕТ/INT=ПАДАЮТ)· ·P(INT=ПАДАЮТ)+P(STOCK=РАСТЕТ/INT=НЕ ПАДАЮТ)· P(INT=НЕ ПАДАЮТ) Для того чтобы определить, присвоено ли переменной INT значение ПАДАЮТ, надо вернуться к правилу 4: 4. ЕСЛИ DOLLAR=РАСТЕТ, ТО INT=ПАДАЮТ Правило 4 преобразуется в уравнение 3: P(INT=ПАДАЮТ)=P(INT=ПАДАЮТ/DOLLAR=РАСТЕТ)· ·P(DOLLAR=РАСТЕТ)+P(INT=ПАДАЮТ/DOLLAR=НЕ РАСТЕТ)· ·P(DOLLAR=НЕ РАСТЕТ) (3) Поскольку ни в одной из правил в части ТО нет переменной DOLLAR, т. е. значение вероятности для нее определить нельзя, это значение должно быть введено пользователем. По этой же причине условную вероятность так же должен задать пользователь (она не входит в часть ТО правил). Давайте установим вероятности появления некоторых событий, исходя из собственных обоснованных соображений: P(DOLLAR=РАСТЕТ)=0,6. Согласно теории вероятностей, сумма вероятностей появления и непоявления какого-либо события равна 1. В дальнейшем это свойство вероятностей будет часто использоваться. Исходя из сказанного, можно записать: P(DOLLAR=НЕ РАСТЕТ)=1-P(DOLLAR=РАСТЕТ)=1-0,6=0,4. Присвоим значения всем условным вероятностям: P(INT=ПАДАЕТ/DOLLAR=РАСТЕТ)=0,8. P(INT=ПАДАЕТ/DOLLAR=НЕ РАСТЕТ)=0,1. Отметим, что сумма условных вероятностей для противоположных событий не равняется 1. Противоположными в условной вероятности будут события DOLLAR=РАСТЕТ и DOLLAR=НЕ РАСТЕТ. Подставив присвоенные значения в уравнение 3, получим:
P(INT=ПАДАЕТ)=0,8·0,6+0,1·0,4=0,52. Из основного свойства вероятности находим: P(INT=НЕ ПАДАЕТ)=1-0,52=0,48. Для того чтобы найти P(STOCK=РАСТЕТ) пользователь должен задать значения условных вероятностей: P(STOCK=РАСТЕТ/INT=ПАДАЕТ)=0,85. P(STOCK=РАСТЕТ/INT=НЕ ПАДАЕТ)=0,1. Вероятность P(STOCK=РАСТЕТ) можно вычислить по уравнению 2: P(STOCK=РАСТЕТ)=0,85·0,52+0,1·0,48=0,49 или 49%. Получив все значения вероятностей, пользователь может определить свою политику на бирже.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|