Часть 2. Сравнение характеристик двух генеральных совокупностей
Допустим, что требуется на основании выборочных обследований сравнить два города по среднему возрасту и «вариабельности» (дисперсии) возраста гражданина, впервые нарушившего уголовное законодательство (или сравнить названные характеристики в одном городе до и после проведения соответствующих профилактических мероприятий). Введем обозначения: X, MX, DX — возраст случайно выбранного нарушителя, средний возраст и дисперсия возраста нарушителя в первом городе соответственно; Y, MY, DY — аналогичные характеристики для второго города. Не имея возможности собрать сведения о возрасте всех нарушителей городов, а располагая лишь выборочными обследованиями: в первом городе собраны данные о возрасте nX нарушителей, а во втором - n Y, требуется проверить гипотезы Н0: MX = MY и Н0: DX = DY о том, что средний возраст нарушителя в городах одинаков и вариабельность (дисперсия) возраста одинакова. Алгоритмы проверки гипотез Н0: MX = MY и Н0: DX = DY реализуются с помощью надстроек Excel «Двухвыборочный F -тест для дисперсий», «Парный двухвыборочный t -тест для средних», «Двухвыборочный t -тест с одинаковыми дисперсиями», «Двухвыборочный t -тест с различными дисперсиями», «Двухвыборочный z -тест для средних». Эти алгоритмы предполагают, что: · nX наблюдений СВ X (nY наблюдений СВ Y) проведены в типичных условиях; · все n X + n Y наблюдений независимы; · СВ Х (СВ Y) — нормально распределенная СВ. «Двухвыборочный F-тест для дисперсий» используется для проверки гипотезы Исходные данные - введенные в рабочий лист наблюдения переменной 1 (СВ X) и наблюдения переменной 2 (СВ Y), а также уровень значимости α - вероятность отвергнуть верную гипотезу Н0. По этим данным программа рассчитывает: средние и , дисперсии и и ряд других величин, необходимых для проверки гипотезы Н0: DX = DY. Среди этих величин: dƒ — число степеней свободы, которое равно: n X - 1 для переменной 1 и n Y - 1 для переменной 2; ; вероятность «P одностороннее», называемая «рассчитанным уровнем значимости»: если «Р одностороннее»>α, гипотезу Н0: DX - DY принимают; если «Р одностороннее»<α, то Н0 не принимают; принимают альтернативную гипотезу Н1, которая может быть двух видов:
Н1: DX > DY, если > , и Н1: DX < DY, если < . При альтернативе Н1: DX ≠ DY в диалоговое окно следует вместо α ввести α/2; если «p одностороннее» > α/2, принимают Н0, в противном — Н1.
ПРИМЕР 3. Выборочные данные о возрасте (полное число лет) граждан, впервые совершивших уголовные преступления, таковы: 15, 17, 15, 21, 21, 18, 20 — в первом микрорайоне; 25, 16, 19, 24, 19, 20, 21, 23, 23 — во втором.
Результат программы «Двухвыборочный F -тест для дисперсий» при α = 0,05 приведен в таблице:
Вероятность «Р одностороннее» = 0,413 > α, поэтому гипотезу Н0: DX = DY (при альтернативе Н1: DX < DY, ведь дисперсия первой выборки меньше дисперсии второй выборки) принимаем: генеральная «вариабельность» возраста нарушителя в обоих микрорайонах одинакова, или различие выборочных дисперсий = 6,81 и = 8,361 незначимо, несущественно, связано со случайными ошибками выборки. Программы «Парный двухвыборочный t -тест для средних», «Двухвыборочный t -тест с одинаковыми дисперсиями», «Двухвыборочный t -тест с различными дисперсиями», «Двухвыборочный z -тест для средних» используются для проверки гипотезы Н0: MX - MY = а (разность генеральных средних равна числу а). Число а названо гипотетической разностью средних; по умолчанию а = 0 и тогда проверяемая гипотеза Н0: MX = MY.
«Двухвыборочный t-mecm с одинаковыми дисперсиями» используется для проверки гипотезы только в том случае, когда есть основание считать равными генеральные дисперсии, DX = DY, хотя числовые значения этих дисперсий и неизвестны. В качестве альтернативы к гипотезе Н0: MX - MY = а при а = 0 может быть: Н1: MX > MY; Н1: MX < MY; Н1: MX ≠ MY. Исходные данные программы - наблюдения величин X и Y и вероятность α. По данным примера была принята гипотеза Н0: DX = DY (принятие Н0 служит основанием считать дисперсии равными, но не означает, что равенство дисперсий – абсолютная истина). Результат программы «Двухвыборочный t-mecm с одинаковыми дисперсиями» при
В таблице «Объединенная дисперсия» - это оценка генеральной дисперсии обеих совокупностей, равная: ; число степеней свободы dƒ = n X + n Y – 2 = 14, статистика . Альтернативой гипотезе Н0: MX = MY (средний возраст преступника для микрорайонов одинаков) может быть: · гипотеза Н1: MX < MY (ведь =18,143 < =21,111); в этом случае Н0 принимают, если рассчитанный «Односторонний уровень значимости», или вероятность «P одностороннее» > α, в противном – принимают Н1 («P одностороннее» = 0,026 < α = 0,05, поэтому принимаем Н1); · гипотеза Н1: MX ≠ MY; в этом случае Н0 принимают, если «P двухстороннее» > α, в противном случае принимают Н1 («P двухстороннее» = 0,052 > α = 0,05, принимаем гипотезу Н0). Пример показывает, что при неизменной вероятности α отвергнуть верную гипотезу Н0 ответ на вопрос о том, принять или не принять гипотезу Н0, зависит и от вида альтернативы Н1.
«Парный двухвыборочный t-тест для средних» используется для проверки гипотезы Н0: MX - MY = а, когда СВ X и СВ Y одноименные и наблюдаются «в паре»; в этом случае число nX наблюдений СВ X равно числу nY наблюдений СВ Y, n X = n Y. «Двухвыборочный t-тест с различными дисперсиями» используется для проверки гипотезы Н0: MX - MY = а, когда есть основание считать генеральные дисперсии неравными: DX ≠ DY, хотя числовые значения этих дисперсий и неизвестны. «Двухвыборочный z -тест для средних» используется для проверки гипотезы В данных программах вопрос о том, принять или не принять гипотезу
Задания для самостоятельного выполнения: Выполните самостоятельно действия, описанные в примерах 1-3. Результаты проделанной работы представьте в отчете по практической работе.
Контрольные вопросы: 1. Что понимается под статистической информацией? 2. Что такое средняя величина и каково ее значение в изучении материалов юридической статистики? 3. Для каких целей в статистике используются мода и медиана? 4. Назовите примеры задач правоприменительной деятельности, решаемых с использованием пакета «Анализ данных».
Литература: 1. Информатика и математика для юристов: учебник для студентов вузов, обучающихся по юридическим специальностям / [С.Я Казанцев и др.]; под ред. С.Я.Казанцева, Н.М.Дубининой. – 2-е изд., перераб. и доп. – М.: ЮНИТИ-ДАНА, 2008. – 560с. 2. Абдулазар, Л. Лучшие методики применения Excel в бизнесе. – Пер. с англ. / Л. Абдулазар. – М.: Издательский дом «Вильямс», 2006. – 464 с.: ил. 3. Гмурман, В.Е. Теория вероятностей и математическая статистика: учеб. пособие для вузов: 9-е изд., стер. / В.Е. Гмурман – М.: Высшая школа, 2003. – 479 с. 6. Минько, А.А. Сводные таблицы и диаграммы в Excel. Просто как дважды два / 7. Макарова, Н.В. Статистика в Excel: Учеб. пособие / Н.В. Макарова, В.Я. Трофимец. – М.:Финансы и статистика, 2006. – 368 с.: ил.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|