Методы принятия статистических решений
Эти методы также относятся к вероятностным методам. Они отличаются от Байесовского подхода, в первую очередь, правилами принятия решения. Если в методе Байеса предпочтение отдается диагнозу, имеющему максимальную величину условной вероятности появления при полученной в ходе обследования объекта диагностики реализации комплекса диагностических признаков, то в этих методах решающее правило определяется с наложением некоторого условия оптимальности, которое позволяет сократить необходимый для решения диагностической задачи объем статистической информации. Кроме того, эти методы эффективны в случаях, когда имеются затруднения в формировании диагностического признака, поскольку не определено пороговое значение параметра, по которому принимается решение о нахождении объекта в том или ином диагнозе, т.е. отсутствует критерий, необходимый для принятия решения. Первоначально рассмотрим простейший случай, когда при решении диагностической задачи объект описывается только одним диагностическим параметром (одномерный случай). При таком рассмотрении задача распознавания диагнозов формулируется следующим образом. Пусть диагностируется объект, который может находиться в исправном (диагноз D 1) или в неисправном (диагноз D 2) состояниях. Диагностика объекта производится с использованием выходного диагностического параметра «у», который является случайной величиной и для каждого из этих состояний описывается своим законом распределения. Обозначим распределение плотности вероятности этого параметра для исправного состояния f (y / D 1), а для неисправного – f (y / D 2). Примем, что при переходе объекта в неисправное состояние величина параметра возрастает. Ставится задача – выбрать некоторое пороговое значение (порог) этого параметра у 0. После выбора этого порога решающее правило формулируется таким образом: при превышении порогового значения диагностическим параметром объект следует относить к неисправному состоянию и, наоборот, при значениях диагностического параметра ниже порога будем относить объект к исправному состоянию. В символьном виде это условие запишется следующим образом:
если у > у 0, то у Î D 2; если у < у 0, то у Î D 1. (5.3) Существенным в этой постановке является то, что непрерывные распределения диагностического параметра «у» для исправного и неисправного состояний пересекаются (рис. 5.2).
Рис. 5.2 Плотности вероятности параметра у для исправного и неисправного состояний
Поскольку распределения f (y / D 1) и f (y / D 2) пересекаются, следовательно, принципиально невозможно выбрать у 0, которое не давало бы ошибочных решений. Поэтому выбор порогового значения параметра у 0 осуществляется на основе заданного условия оптимальности, которое базируется на понятиях ошибки типа «ложная тревога» и «пропуск дефекта». Определим эти понятия. Ложная тревога. После выбора порога у 0 может возникнуть ситуация, когда у > у 0 и, в соответствии с условием (5.3), принимается, что объект относится к неисправному состоянию (к диагнозу D 2). На самом деле объект исправен, т.е. принадлежит диагнозу D 1. Такое событие вполне возможно из-за того, что непрерывные распределения f (y / D 1) и f (y / D 2) пересекаются (рис. 5.2). Такое событие называется «ложная тревога» и обозначается Н 21, где индекс «2» обозначает тот диагноз, который мы приняли, а индекс «1» – тот диагноз, который есть на самом деле. Пропуск дефекта. Пропуск дефекта – это событие, заключающееся в том, что неисправный объект принимается за исправный. Оно возникает тогда (рис. 5.2), когда измеренная величина диагностического параметра меньше выбранного порога (у < у 0), но принадлежит распределению f (y / D 2). Будем обозначать это событие H 12. Как и в предыдущем случае, первый индекс соответствует принятому диагнозу, а второй – действительному.
Поскольку события «ложная тревога» и «пропуск дефекта» случайные, то для их характеристики следует определить вероятность их появления при некотором пороговом значении диагностического параметра у 0. Вероятность появления события «ложная тревога» Р (Н 21) эт.е. вероятность одновременного появления двух простых событий: нахождение объекта диагностики в диагнозе D 1 и появление значения диагностического параметра больше порогового у > y 0 для исправного состояния (т.е. из распределения f (y / D 1)). В соответствии с положениями теории вероятностей P (H 21) = P (D 1) P (y > y 0 / D 1) = ,(5.4) где P (D 1) = P 1 – априорная вероятность нахождения объекта в диагнозе D 1; P (y > y 0 / D 1) = – вероятность события у > y 0 для исправного изделия. Последняя вероятность соответствует площади под кривой f (y / D 1) при у > у 0 (рис. 5.2). Вероятность появления сложного события «пропуск дефекта» P (H 12) – это есть вероятность одновременного появления двух простых событий: нахождения объекта диагностики в диагнозе D 2 и появления значения диагностического параметра меньше порогового у < у 0 для неисправного состояния (т.е. из распределения f (y / D 2)). Аналогично предыдущему эту вероятность определим следующим соотношением: P (H 12) = P (D 2) P (y < y 0 / D 2) = , (5.5) где P (D 2) = P 2 – априорная вероятность нахождения объекта в диагнозе D 2; P (y < y 0 / D 2) = – вероятность события у < y 0 для исправного изделия. Полная вероятность принятия ошибочного решения складывается из вероятностей событий «ложная тревога» и «пропуск дефекта». Учитывая, что в различных ситуациях затраты на ликвидацию ошибок по ложной тревоге и пропуску дефекта различны, то им устанавливают «цены» (весовые коэффициенты): С 21 – цена ложной тревоги и С 12 – цена пропуска дефекта. Разумеется, цены ошибок имеют условное значение, но они должны учесть предполагаемые последствия ложной тревоги и пропуска дефекта. С учетом заданных цен и определяют суммарную ошибку: R = C 21 + C 12 . (5.6) Выражение, определенное соотношением (5.6), называется функцией риска.
Основная идея методов принятия статистических решений заключается в следующем. В зависимости от наличия и объема исходных статистических данных, по которым определяются цены ошибок C 21 и С 12, априорные вероятности диагнозов Р 1 и Р 2, плотности вероятностей f (y / D 1) и f (y / D 2), задается условие минимизация функции риска R и далее определяется пороговое значение у 0 для этого условия. Метод минимального риска Этот метод применим тогда, когда имеется полная информация о ценах С 12 и С 21, о вероятностях нахождения объектов в исправном D 1 и неисправном D 2 диагнозах, о функциях f (y / D 1) и f (y / D 2). Задача ставится таким образом, чтобы пороговое значение у 0 соответствовало минимальному значению функции риска R. Для нахождения экстремума функции риска продифференцируем ее по у0и приравняем полученное выражение к нулю: dR / dy 0 = – C 21· P 1· f (y 0 / D 1) + C 12· P 2· f (y 0 / D 2) = 0. После преобразования получим C 12· P 2· f (y 0 / D 2) = C 21· P 1· f (y 0 / D 1). Откуда отношение плотностей вероятностей, называемое отношением правдоподобия, для исправного и неисправного состояний при граничном значении диагностического параметра равно . (5.7) Пользуясь выражением (5.7), при известных ценах С 12 и С 21, вероятностях Р 1 и Р 2 и функциях f (y / D 1) и f (y / D 2) можно вычислить пороговое значение диагностического параметра у 0. В дальнейшем это пороговое значение следует использовать для проверки выполнения условий соотношения (5.3) и отнесения объекта к одному из диагнозов. Метод минимального числа ошибочных решений Этот метод применяется тогда, когда стоимости ошибок «ложной тревоги» С 21 и «пропуска дефектов» С 12 точно не известны, но из практических соображений можно принять, что они примерно одинаковы, т.е. С 21» С 12. С учетом этого допущения определяют полную вероятность принятия ошибочного решения как сумму вероятностей ошибок ложной тревоги и пропуска дефекта в виде Р ош = + . (5.8) Выражение (5.8) определяет так называемую функцию суммарной ошибки. Метод максимального правдоподобия
Это метод также опирается на формулу (5.6), определяющую функцию риска. Идея этого метода вытекает из следующих соображений. В практических задачах вероятность неисправного состояния мала, т.е. С 12 · Р 2» С 21 · Р 1. Тогда выражение (5.6) можно представить в виде R min = + . (5.9) В данном методе условием оптимизации является нахождение порогового значения у 0, удовлетворяющего минимуму выражения (5.9). Метод минимакса Метод предназначен для ситуации, когда отсутствуют предварительные статистические сведения о вероятностях появления диагнозов D 1 и D 2, т.е. о Р 1 и Р 2. Решение ведется для «наихудшего случая». Рассматривается ситуация, когда Р 1 и Р 2 имеют наименее благоприятные значения, приводящие к максимальному значению функции риска R. Значение порога у 0 ищут такое, которое минимизирует функцию риска R при этих неблагоприятных значениях Р 1 и Р 2. Отсюда и название метода – метод минимакса. В такой постановке функция риска становится функцией двух параметров у 0 и Р 1 (т.к. Р 2 = 1 – Р 1): R (y 0, Р 1) = C 21 · + C 12·(1 – . (5.10) Следует помнить, что методы принятия статических решений рекомендуется использовать тогда, когда размерность задачи не превышает 2–3 (т.е. когда объект описывается не более чем двумя или тремя параметрами) и когда число распознаваемых диагнозов не превышает трех. Для решения задачи диагностирования в случае описания объекта большим числом параметров более приемлемы так называемые методы распознавания в пространстве признаков (параметров).
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|