Вредоносное программное обеспечение
⇐ ПредыдущаяСтр 38 из 38 Понятие ошибки первого рода также используется, когда антивирусное программное обеспечение ошибочно классифицирует безвредный файл как вирус. Неверное обнаружение может быть вызвано особенностями эвристики, либо неправильной сигнатурой вируса в базе данных. Подобные проблемы могут происходить также и с антитроянскими и анти-шпионскими программами. Поиск в компьютерных базах данных При поиске в базе данных, к ошибкам первого рода можно отнести документы, которые выдаются поиском, несмотря на их иррелевантность (несоответствие) поисковому запросу. Ошибочные срабатывания характерны для полнотекстового поиска, когда поисковый алгоритм анализирует полные тексты всех хранимых в базе данных документов и пытается найти соответствия одному или нескольким терминам, заданным пользователем в запросе. Большинство ложных срабатываний обусловлены сложностью естественных языков, многозначностью слов: например, «home» может обозначать как «место проживания человека», так и «корневую страницу веб-сайта». Число подобных ошибок может быть снижено за счёт использования специального словаря. Однако, это решение относительно дорогое, поскольку подобный словарь и разметка документов (индексирование) должны создаваться экспертом. Оптическое распознавание текстов (OCR) Разнообразные детектирующие алгоритмы нередко выдают ошибки первого рода. Программное обеспечение оптического распознавания текстов может распознать букву «a» в ситуации, когда на самом деле изображены несколько точек, которые используемый алгоритм расценил как «a». Досмотр пассажиров и багажа Ошибки первого рода регулярно встречаются каждый день в компьютерных системах предварительного досмотра пассажиров в аэропортах. Установленные в них детекторы предназначены для предотвращения проноса оружия на борт самолёта; тем не менее, уровень чувствительности в них зачастую настраивается настолько высоко, что много раз за день они срабатывают на незначительные предметы, такие как ключи, пряжки ремней, монеты, мобильные телефоны, гвозди в подошвах обуви и т. п.
Таким образом, соотношение числа ложных тревог (идентифицикация благопристойного пассажира как террориста) к числу правильных срабатываний (обнаружение действительно запрещённых предметов) очень велико. Биометрия Ошибки первого и второго рода являются большой проблемой в системах биометрического сканирования, использующих распознавание радужной оболочки или сетчатки глаза, черт лица и т. д. Такие сканирующие системы могут ошибочно отождествить кого-то с другим, «известным» системе человеком, информация о котором хранится в базе данных (к примеру, это может быть лицо, имеющее право входа в систему, или подозреваемый преступник и т. п.). Противоположной ошибкой будет неспособность системы распознать легитимного зарегистрированного пользователя, или опознать подозреваемого в преступлении.
Проверка гипотезы. Статистическая гипотеза называется простой, если она однозначно определяет распределение случайной величины
Часто распределение величины
Проверяемая гипотеза называется нулевой и обозначается
Правило, по которому принимается решение принять или отклонить гипотезу
Проверка статистической гипотезы основывается на принципе, в соответствии с которым маловероятные события считаются невозможными, а события, имеющие большую вероятность, — достоверными; Этот принцип можно реализовать следующим образом. Перед анализом выборки фиксируется некоторая малая вероятность
Обозначим
Уровень значимости
Расположение критической области
Проверку параметрической статистической гипотезы с помощью критерия значимости можно разбить на этапы:
1) сформулировать проверяемую
2) назначить уровень значимости
3) выбрать статистику
4) определить выборочное распределение статистики
5) в зависимости от формулировки альтернативной гипотезы определить критическую область
6) получить выборку наблюдений и вычислить выборочные значения
7) принять статистическое решение: если
Обычно при выполнении пп. 4-7 используют статистику с нормальным распределением, статистику Стьюдента, Фишера.
Пример 1. По паспортным данным автомобильного двигателя расход топлива на 100 км пробега составляет 10 л. В результате изменения конструкции двигателя ожидается, что расход топлива уменьшится. Для проверки проводятся испытания 25 случайно отобранных автомобилей с модернизированным двигателем, причем выборочное среднее расходов топлива на 100 км пробега по результатам испытаний составило 9,3 л. Предположим, что выборка расходов топлива получена из нормально распределенной генеральной совокупности со средним Решение. Проверим гипотезу о среднем 1) проверяемая гипотеза 2) уровень значимости 3) в качестве статистики критерия используем статистику математического ожидания — выборочное среднее; 4) так как выборка получена из нормально распределенной генеральной совокупности, выборочное среднее также имеет нормальное распределение с дисперсией
5) альтернативная гипотеза б) выборочное значение нормированной статистики критерия
7) статистическое решение: так как выборочное значение статистики критерия принадлежит критической области, гипотеза Решение, принимаемое на основе критерия значимости, может быть ошибочным. Пусть выборочное значение статистики критерия попадает в критическую область, и гипотеза Ошибка второго рода происходит тогда, когда гипотеза
Пример 2. В условиях примера 1 предположим, что наряду с гипотезой Решение. Найдем вероятность ошибки первого рода. Статистика
Следовательно, в соответствии с принятым критерием 13,6% автомобилей, имеющих расход топлива 9 л на 100 км пробега, классифицируются как автомобили, имеющие расход топлива 10 л.
Вопросы для самоконтроля: 1. Относительные величины распределения 2. Относительные величины интенсивности 3. Анализ вариационных рядов 4. Понятие статистических взаимосвязей и причинности 5. Измерение связей между качественными признаками 6. Парная линейная корреляция 7. Иные способы установления взаимосвязей 8. Понятие статистического анализа 9. Характер, функции, методы статистического анализа 10. Понятие связи явлений и ее виды. 11. Статистические методы выявления связей между двумя признаками социально-правовых явлений. 12. Виды информации и их характеристика. 13. Этапы статистического анализа. 14. Закон больших чисел и его роль в исследовании социально-правовых явлений. 15. Основные задачи анализа данных уголовно-правовой статистики. 16. Основные направления автоматизированной системы обработки данных правовой статистики. Статистический анализ-основа изучения преступности. 17. Анализ оценка деятельности правоохранительных органов. 18. Анализ показаний гражданско-правовой статистики. Роль статистики в оценке деятельности судов по рассмотрению гражданских дел.
Рекомендуемая литература: основная: [1,2]; дополнительная:[1, 2, 4]. РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА Основная 1. Правовая статистика: учебник под ред. В.С. Лялина, А.В. Симоненко. – М.: ЮНИТИ-ДАНА, 2010.-255с. 2. Правовая статистика: учебник учебник под ред. С.Я.Казанцева, С.Я. Лебедева, С.М. Иншакова – М.: ЮНИТИ-ДАНА: закон и право, 2012.-271с.
Дополнительная: 1. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. - М.: Высшая школа, 2004. 2. Гмурман В.Е. Теория вероятностей и математическая статистика. - М.:Высшая школа, 2004. 3. Решение математических задач средствами Excel: Практикум/ В.Я. Гельман. – СПб.: Питер, 2003. – 237с. 4. Кремер Н.Ш. Теория вероятностей и математическая статистика: учебник.- М.: ЮНИТИ-ДАНА, 2007. 551с. 5. Статистика: учебник / под ред. И.И. Елисеевой. – М.: Высшее образование, 2008.-566 с 6. Материалы официального сайта Федеральной службы государственной статистики http://www.gks.ru/
Нормативные правовые акты*
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|