Одномерной статистической модели
2.3.1. Точечная оценка погрешности среднего значения Среднее значение d2 = s2/ n или Величину d можно рассматривать как абсолютную среднеквадратичную случайную погрешность среднего значения Если разделить обе части равенства (2.46) на среднее значение
где V – коэффициент вариации. Относительная погрешность может быть выражена в долях единицы или в процентах. Формулы (2.46) и (2.47) играют большую роль: они показывают, что погрешность среднего значения прямо пропорциональна изменчивости случайной величины и обратно пропорциональна корню квадратному из числа измерений. Это позволяет решать две задачи: 1) оценивать абсолютную d или относительную t погрешность среднего значения при известном числе наблюдений n; 2) находить необходимое число измерений n для достижения заданной погрешности среднего значения.
8 Пример 2.6. В результате анализа 16 проб гранита рассчитано среднее содержание кремнезема Абсолютная среднеквадратичная случайная погрешность d = = 3,20/ Продолжим задачу. Если t = 1 % = 0,01, то из формулы (2.47) получим
2.3.2. Интервальная оценка математического ожидания случайной величины Обычно среднее значение случайной величины
Данный интервал называется доверительным интервалом или интервальной оценкой математического ожидания. Каждому значению вероятности q соответствует определенный коэффициент вероятности t (табл.2.6 и 2.7) и размер доверительного интервала:
Используя данные примера 2.6, в котором известно среднее содержание кремнезема в граните
Какую из вероятностей q принять за основу, нельзя решить математическим путем, так как ответ лежит в области принятия решений и должен опираться на какое-то логическое или экономическое обоснование. Практически в менее ответственных случаях принимают t = 2 и q = 0,954, в более ответственных случаях t = 3 и q = 0,997. При наличии достаточного обоснования могут приниматься и дробные значения t. Если среднее значение
2.3.3. Выделение аномальных значений Статистические характеристики и получаемые на их основе выводы имеют смысл лишь для однородных совокупностей. При объединении двух и более однородных совокупностей с различными статистическими характеристиками расчеты по объединенной совокупности обычно не имеют смысла. Искажение статистических характеристик происходит и в том случае, когда в однородную совокупность попадают единичные значения, значительно отличающиеся от среднего, называемые аномальными или ураганными. Поэтому актуальной является задача о разделении неоднородной совокупности на однородные, о выделении из неоднородных совокупностей аномальных значений. Данная задача имеет несколько способов решения при условии, что известен или задан закон распределения случайной величины. Распространенный способ выделения аномальных значений называется правилом «трех сигм» и основан на том, что случайная величина при нормальном законе распределения практически полностью (на 99,7 %) заключена в пределах от
8 Пример 2.7. Средняя зольность угля
Найдем нормированное значение t = (15 – 6,5)/2,1 = 4,05. Поскольку t > 3, проба является аномальной и относится к другой совокупности. На основе приведенных данных можно определить, какие вообще значения зольности являются аномальными. Так как
Если распределение случайной величины логнормальное, то правило «трех сигм» применяется к логарифмам значений, что используется при геохимическом методе поисков месторождений для выделения геохимических аномалий.
8 Пример 2.8. Среднее (фоновое) содержание меди Используя формулы подраздела 2.2.3, найдем σ z =
Наряду с правилом «трех сигм» существуют и другие правила выявления аномальных значений. Более общее правило состоит в том, что задается либо вероятность q, либо соответствующая ей предельная величина критерия t. Если нормированное значение превышает предельное значение t, то значение случайной величины является аномальным. Следует учесть, что при исключении аномальных значений происходит искажение (смещение) статистических характеристик оставшейся совокупности. Так, если из нормально распределенной совокупности исключить одно или несколько максимальных значений, то уменьшатся среднее значение и дисперсия – возникает усеченное нормальной распределение. Это обстоятельство рекомендуется учитывать при выделении аномальных значений.
Обозначим смещенные характеристики усеченного распределения: среднее значение
где у – нормированное смещение среднего; n – число исключенных значений; N – общее число значений случайной величины; f (t) – функция плотности вероятности (2.25); t – квантиль нормального распределения, соответствующая вероятности p = 1 – n / N, т.е. t = F –1(1 – n / N). Поскольку статистические характеристики изменяются, происходит и смещение критерия t: Из приведенных формул следует, что величины t, f (t), y, t смещ зависят только от отношения n / N.
8 Пример 2.9. Необходимо проверить аномальность максимальных значений табл.2.15. Таблица 2.15
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|