Подбор подходящего закона распределения вероятностей
Далее рассмотрим некоторые известные распределения, такие как равномерное, нормальное и гамма-распределение, с целью проверки подчиняется ли наше распределение вероятностей заданному. Проверка на соответствие данных испытаний распределению производится перебором трех распределений, указанных выше, включая заданное, а именно равномерное. Чтобы иметь полную информацию о распределении случайной величины, надо знать параметры этого распределения. Таким образом, математическое ожидание случайной величины t равно выборочной средней, а среднее квадратическое отклонение случайной величины t – выборочному среднему квадратическому отклонению. Указанные характеристики находятся в ячейках F12 и F14 соответственно. Поместим эти значения в ячейки А2 и В2 соответственно (таблица 11). Определим параметры равномерного (a и b), нормального (m – математическое отклонение и σ – среднее квадратическое отклонение), экспоненциального и гамма-распределения (α и β) в соответствии с формулами:
, , , , B5 = 1/A2; B8 = A2-В2*КОРЕНЬ(3); B9 = А2+В2*КОРЕНЬ(3); B12 = (A2/B2)^2; B13 = B2^2/A2; B16 = (A2/B2)^2; B17 = B2^2/A2.
Таблица 11 – Значения плотностей распределения
В ячейках В20:В29 вычислим плотности относительных частот как частное от деления относительных частот (ячейки F25:F34) на шаг (ячейка $F$22) из таблицы 10. Плотности равномерного, нормального, экспоненциального и гамма-распределений рассчитываются в соответствии с формулами: С20 = ЭКСПРАСП (А20;$B$5;ЛОЖЬ); D20 = НОРМРАСП (А20; $B$12; $B$13; ЛОЖЬ); E20 = ГАММАРАСП (А20; $B$16; $B$17; ЛОЖЬ). F20 = ЕСЛИ(А20<$B$8; 0; ЕСЛИ(A20>=$B$9; 1/($B$9-$B$8); 0)); Затем копируем их в блок ячеек С21:F21. После чего строим гистограмму частот, совмещенную с плотностью каждого из указанных ранее распределений. Графическое изображение гистограммы кривых различных распределений приведены на рисунках 11- 13.
Рисунок 11 – Сглаживание гистограммы плотностью равномерного распределения Рисунок 12 – Сглаживание гистограммы плотностью нормального распределения
Рисунок 13 – Сглаживание гистограммы плотностью гамма-распределения
Рисунок 14 – Сглаживание гистограммы плотностью экспоненциального распределения
Используя критерий χ2, установим, верна ли принятая гипотеза о том, что статистические данные подчиняются равномерному распределению, так, чтобы ошибка не превышала заданного уровня значимости α (вероятность того, что будет отвергнута правильная гипотеза).
Для применения критерия χ2 необходимо, чтобы частоты ni, соответствующие каждому интервалу, были не меньше 5. Для этого при необходимости объединим рядом стоящие интервалы, а их частоты суммируем. Далее вычислим следующую сумму:
,
где pi – теоретическая вероятность того, что случайная величина Х примет значение из интервала [ai-1,ai]. Предположим, что случайная величина t имеет функцию распределения F(t), поэтому pi = F(ai) – F(ai-1). Образец расчетов по предыдущей формуле для трех распределений представлен в таблице 6. В колонке А содержатся левые, а в колонке В – праве границы интервалов. В колонке С находятся соответствующие частоты. В колонке D рассчитываются теоретические вероятности в зависимости от вида распределения. Для экспоненциального распределения: D35 = ЭКСПРАСП (B35; $B$5; ИСТИНА) – ЭКСПРАСП (А35; $B$5; ИСТИНА); Для равномерного распределения: D65 = ЕСЛИ (B65<$B$8; 0; ЕСЛИ (B65<=$B$9; (B24-$B$8) / ($B$6-$B$9); 1)) – ЕСЛИ (A24<$B$8; 0; ЕСЛИ (A24<=$B$9; (A24-$B$8) / ($B$6-$B$9); 1)); Для нормального распределения: D45 = НОРМРАСП (В45; $B$12; $B$13; ИСТИНА) – НОРМРАСП (А45; $B$12; $B$13; ИСТИНА); Для гамма-распределения: D55 = ГАММАРАСП (В55; $B$16; $B$17; ИСТИНА) – ГАММАРАСП (А55; $B$16; $B$17; ИСТИНА). В колонке Е рассчитываются слагаемые соотношения по формуле: Е35 = (С35-56*D35)^2/(56*D35), которая копируется в другие ячейки колонки Е. После чего для каждого рассмотренного распределения определим итоговые суммы: Е43 = СУММ(E35:E42); Е53 = СУММ(E45:E52); Е63 = СУММ(Е55:Е62); Е73 = СУММ(Е65:Е72). Которые равны соответственно 349,8344; 14,8995; 15,1459; 16,7324. Гипотеза о виде закона распределения должна быть принята, если вычисленное значение χ2выч достаточно мало, а именно не превосходит критического значения χ2кр, которое определяется по распределению χ2 в зависимости от заданного уровня значимости α и числа степеней свободы r=k’ – s – 1. где k’ – количество интервалов после объединения; s – число неизвестных параметров распределения, которые были определены по выборке. В данном примере r = 7 – 2 – 1 = 5 Критическое значение рассчитывается по формуле:
Е74 = ХИ2ОБР(0,05;5), из таблицы 12 видно, оно равно 16,7496. Поскольку 16,7324<16,7496, то принимается гипотеза о том, что статистические данные имеют равномерное распределение с параметрами a = 82,7050 и b = 117,4735 соответственно.
Таблица 12 – Подбор распределения на основе критерия χ2
Воспользуйтесь поиском по сайту: ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|