Измерительные информационные технологии
По мере своего развития измерительные информационные системы все в большей степени приобретают черты информационных аналитических систем специализированного направления, широко использующие для решения поставленных перед ними задач методы анализа данных (Data Analysis), машинного обучения (Machine Learning) и искусственного интеллекта (Artificial Intelligence) (рис. 1).
Признаки, характеризующие объект или процесс наблюдения (из генеральной совокупности объектов или процессов) или состояние объекта или процесса (из множества возможных состояний) воспринимаются полем сенсоров, образующих систему до̀бычи данных (Data Mining). Полученные данные подвергаются статистическому анализу (Data Analysis), результатом чего становятся знания об объекте (состоянии объекта) или процессе (состоянии процесса) наблюдения. Блок управления полем сенсоров активизируется по команде системы анализа данных и осуществляет сканирование объекта сенсорами в пространстве (перемещением сенсоров или изменением направления их чувствительности) и во времени (изменением частоты опроса сенсоров и скорости дискретизации). Полученные знания проверяются на достоверность (Analysis of Validity) и при недостаточной достоверности по-своему активизируют блок управления сенсорной системы. В качестве объектов исследования может выступать: - технологический или природный объект при осуществлении наблюдения и контроля над ними, - производственная система или ее отдельные элементы при идентификации их математических моделей, - организм человека или животного при диагностировании заболеваний, - изделия или партии изделий при их контроле или сортировке, - сигналы и сообщения при их идентификации,
- подлежащие распознаванию летательные объекты или скопления живой силы и техники, - средства измерений при их первичной или периодической поверке. Полученные знания представляются в форме некоторых классификаций. Технологический или природный объект может оказаться принадлежащим одному из классов состояний (работоспособный, предаварийный, аварийный, катастрофически размножились некоторые вредители лесных угодий, пересохли водоёмы и так далее). Производственная система или технологический процесс может находиться в удовлетворительном состоянии и выдавать годную продукцию, уровень настройки может приблизиться к критическому значению, технологическое рассеивание может находиться в предписанных нормах или достигать неприемлемых значений. Человек может быть здоровым или его организм претерпевает те или иные изменения и наступает опасность возникновения различных нарушений. Производимые или покупаемые изделия могут быть годными или дефектными по одному или нескольким признакам качества. Партии изделий могут иметь удовлетворительное качество или быть дефектными по некоторым признакам качества. Сигналы могут быть просто шумами или сигналами, несущими осмысленные сообщения, сообщения, предназначенные для всех или только для того или иного потребителя. В любом случае мы имеем объект Результатом когнитивной деятельности системы становится отнесении исследуемого объекта
Классы объектов могут задаваться нормами на значения признаков объектов или формироваться по заранее задаваемым критериям в процессе обучения или самообучения системы (Machine Learning). Погрешности измерения признаков объектов, недостатки алгоритмов анализа данных и нечеткости определения границ между классами объектов приводят к возникновению ошибок реализации классификаций, заключающихся в том, что объекты, действительно относящиеся к одному классу, после проведения классификации оказываются в другом классе объектов. Это ограничивает достоверность (Validity) классификаций, задаваемых информационной системой. В результате проведения измерений сенсорная система преобразует вектор признаков в вектор результатов измерений – случайных величин, отягощенных погрешностями измерений:
Погрешности измерений
Распределение этого вектора можно охарактеризовать совместной плотностью распределения:
где Следует, однако, помнить, что и сами признаки на множестве наблюдаемых объектов или состояний объектов являются случайными величинами со своей совместной плотностью распределения: и условными плотностями признаков объектов, классифицированных по классам объектов:
Совместная плотность распределения результатов измерения признаков определяется как результат многомерной свертки плотностей распределения самих признаков и погрешностей их измерения: так что Достоверность процедуры (контроля, диагностики, идентификации моделей, распознавания образов) характеризуется вектором оперативных характеристик, соответствующих классам объектов: Каждый элемент этого вектора - оперативная характеристика
Пример Контролю подлежат изделия типа роликов по диаметру (признак
Будем считать погрешности измерения признака со стандартным отклонением
Для погрешности
Здесь Результаты измерений
где Теперь имеются все необходимые данные для вычисления всех шести оперативных характеристик для всех шести установленных классов. Для класса Если задаться следующими данными: то получим оперативную характеристику для класса
Рис. 2 Рис. 2 наглядно показывает, что далеко не все объекты, действительно принадлежащие к классу
На рис. 3 показаны те же характеристики, но для класса
Рис. 3
Таким образом, аппаратная реализация классификации сопровождается появлением ошибок классификации, связанных с погрешностями измерения признаков объектов.. С одной стороны, в каждый класс попадают не все объекты, действительно принадлежащие данному классу. С вероятностями
которые зависят от действительных значений признаков Так на рис. 4 показано распределение вероятности ошибки первого рода для области
Рис. 4
Но в соответствии с оперативной характеристикой каждого данного класса в число элементов класса будут приняты объекты других классов, будут приняты с вероятностями, зависящими от действительных значений их признаков. Это ошибки второго рода. Эти вероятности различны для различных классов, из которых объекты просачиваются в рассматриваемый класс. Их число равно
Здесь На рис. 5 представлены графики зависимостей вероятностей ошибок второго рода:
Рис. 5 Графики построены по данным рассмотренного выше примера в обычном 3d-представлении и в контурном изображении Аналогичные картины могут быть построены и для всех других классов объектов. Таким образом, вероятности ошибок при реализации классификации можно представить в виде единой матрицы вероятностей ошибок: На главной диагонали здесь находятся вероятности ошибок первого рода для
Полученные зависимости позволяют проследить процесс формирования ошибок первого и второго рода в зависимости от конкретных значений признаков вблизи границ разбиения признакового пространства. Иллюстрации, представленные на рисунках, дают наглядную картину распределения ошибок только в случае использования двух признаков. При произвольном числе признаков приходится отказываться от наглядности геометрического представления. Для практических целей, связанных, например, с выбором элементов сенсорной системы, анализом брака или оценкой эффективности системы, реализующей те или иные измерительные информационные технологии, важно знать усредненные характеристики достоверности результатов машинной классификации. Предположим, что признаки
где Если признаки являются независимыми случайными величинами, то совместная плотность их распределения распадается на произведение одномерных плотностей распределения признаков:
Знание плотности распределения признаков делает возможным определение следующих характеристик достоверности проводимой классификации. 1. Плотности распределения значений признаков объектов, отнесенных к тем или иным классам объектов:
В рассматриваемом нами примере примем для диаметра изделия (признак
Для отклонения от круглости (признак с параметрами Плотность совместного распределения признаков графически представлена на рис. 6 и 7. Распределение захватывает практически все выделенные области в пространстве признаков. Теперь посмотрим, как будет выглядеть распределение признаков для объектов, попавших по результатам классификации в класс при ранее определенной оперативной характеристики
Рис. 7
Результаты расчетов, проведенные в программе Math Cad, дают результаты, представленные на рис. 8. Сравнение графиков на рис. 6, 7 и 8 наглядно показывают процесс выделения класса Для сравнения построим распределение признаков объектов из той же совокупности, но отнесенных системой к классу Результаты расчетов приведены на второй паре рис. 8 и 9.
Рис. 8 и 9 2. Средние по классам вероятности ошибок первого рода: . 3. Средние по классам вероятности ошибок второго рода – вероятности проникновения в данный класс
4. Суммарная доля чужеродных объектов в классах объектов после проведения классификации – суммарная вероятность ошибки второго рода:
5. Каждый класса объектов
Матрица имеет размеры Всего можно построить 6. Расстояния между совокупностями объектов, порожденных ошибками их классификации в класс
либо как вектор расстояний между центрами группирования по осям координат пространства признаков: 7. Матрица дисперсий. 8. доверительные расстояния и вектор доверительных расстояний.
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|