Достоинства маломощных критериев
Стр 1 из 17Следующая ⇒ Уровни значимости 1. 1-й уровень значимости: р ≤ 0,05. Это 5%-ный уровень значимости. До 5% составляет вероятность того, что мы ошибочно сделали вывод о том, что различия достоверны, в то время как они недостоверны на самом деле. Можно сказать и по-другому: мы лишь на 95% уверены в том, что различия действительно достоверны. В данном случае можно написать и так: P>0,95. Общий смысл критерия останется тем же. 2. 2-й уровень значимости: р ≤ 0,01. Это 1%-ный уровень значимости. Вероятность ошибочного вывода о том, что различия достоверны, составляет не более 1%. Можно сказать и по-другому: мы на 99% уверены в том, что различия действительно достоверны. В данном случае можно написать и так: P>0,99. Смысл останется тем же. 3. 3-й уровень значимости: р ≤ 0,001. Это 0,1%-ный уровень значимости. Всего 0,1% составляет вероятность того, что мы сделали ошибочный вывод о том, что различия достоверны. Это — самый надёжный вариант вывода о достоверности различий. Можно сказать и по-другому: мы на 99,9% уверены в том, что различия действительно достоверны. В данном случае можно написать и так:P>0,999. Смысл опять-таки останется тем же. Уровень значимости – это вероятность ошибочного отклонения (отвержения) гипотезы, в то время как она на самом деле верна. Речь идёт об отклонении нулевой гипотезы Но. Уровень значимости – это допустимая ошибка в нашем утверждении, в нашем выводе. Ошибки Возможны ошибки двух родов: первого рода (α) и второго рода (β). Ошибка I рода – мы отклонили нулевую гипотезу, в то время как она верна. α – ошибка I рода. р ≤ 0,05, уровень ошибки α ≤ 0,05 Вероятность того, что принято правильное решение: 1 – α = 0,95, или 95%.
Уровни значимости для ошибок I рода 1. α ≤ 0,05 – низший уровень Низший уровень значимости – позволяет отклонять нулевую гипотезу, но еще не разрешает принять альтернативную. 2. α ≤ 0,01 – достаточный уровень Достаточный уровень – позволяет отклонять нулевую гипотезу и принимать альтернативную. Исключение: G – критерий знаков T – критерий Вилкоксона U – критерий Манна – Уитни. Для них обратное соотношение. 3. α ≤ 0,001 – высший уровень значимости.
На практике различия считают достоверными при р ≤ 0,05. Для ненаправленной статистической гипотезы используется двусторонний критерий значимости. Он более строгий, так как проверяет различия в обе стороны: в сторону нулевой гипотезы и в сторону альтернативной. Поэтому для него используется критерий значимости 0,01.
Мощность критерия – его способность выявлять даже мелкие различия если они есть. Чем мощнее критерий, тем лучше он отвергает нулевую гипотезу и подтверждает альтернативную.
Здесь появляется понятие: ошибка II рода. Ошибка II рода – это принятие нулевой гипотезы, хотя она не верна. Мощность критерия: 1 – β Чем мощнее критерий, тем он привлекательнее для исследователя. Он лучше отвергает нулевую гипотезу.
Чем привлекательны маломощные критерии?
Достоинства маломощных критериев
Самый популярный статистический критерий в России - Т-критерий Стьюдента. Но всего в 30% статей его используют правильно, а в 70% - неправильно, т.к. не проверяют предварительно выборку на нормальность распределения. Второй по популярности — критерий хи-квадрат, χ2
За рубежом: Т-критерий Вилкоксона U-критерий Манна – Уитни χ2 - хи-квадрат. Т-критерий Стьюдента – это частный случай дисперсионного анализа для более маленькой по объёму выборки.
Правило отклонения H0 И принятия H1 Если эмпирическое значение критерия равняется критическому значению, соответствующему р< 0,05 или превышает его, то H0 отклоняется, но мы еще не можем определенно принять H1. Если эмпирическое значение критерия равняется критическому значению, соответствующему р< 0,01 или превышает его, то H0 отклоняется и принимается H1. Исключения: критерий знаков G, критерий-Т Вилкоксона и критерий-U Манна-Уитни. Для них устанавливаются обратные соотношения. Для облегчения процесса принятия решения можно всякий раз вычерчивать "ось значимости". Критические значения критерия обозначены как Q0,05 и Q0,01, эмпирическое значение критерия как Qэмп. Оно заключено в эллипс. Вправо от критического значения Q0,01 простирается "зона значимости" - сюда попадают эмпирические значения, превышающие Q0,01 и, следовательно, безусловно значимые. Влево от критического значения Q0,05 простирается "зона незначимости", - сюда попадают эмпирические значения Q, которые ниже Q0,05, и, следовательно, безусловно незначимы. Мы видим, что Q0,05=6; Q0,01=9; Qэмп =8 Эмпирическое значение критерия попадает в область между Q0,05 и Q0,01- Это зона "неопределенности": мы уже можем отклонить гипотезу о недостоверности различий (H0), но еще не можем принять гипотезы об их достоверности (H1). Практически, однако, исследователь может считать достоверными уже те различия, которые не попадают в зону незначимости, заявив, что они достоверны при р< 0,05, или указав точный уровень значимости полученного эмпирического значения критерия, например: р= 0,02. С помощью таблиц Приложения 1 это можно сделать по отношению к критериям Н-Крускала-Уоллиса, χ2, Фридмана, L-Пейджа, φ* Фишера, А, Колмогорова. Уровень статистической значимости или критические значения критериев определяются поразному при проверке направленных и ненаправленных статистических гипотез. При направленной статистической гипотезе используется односторонний критерий, при ненаправленной гипотезе - двусторонний критерий. Двусторонний критерий более строг, поскольку он проверяет различия в обе стороны, и поэтому то эмпирическое значение критерия, которое ранее соответствовало уровню значимости р< 0,05, теперь соответствует лишь уровню р< 0,10.
В данном руководстве исследователю не придется всякий раз самостоятельно решать, использует ли он односторонний или двухсторонний критерий. Таблицы критических значений критериев подобраны таким образом, что направленным гипотезам соответствует односторонний, а ненаправленным - двусторонний критерий, и приведенные значения удовлетворяют тем требованиям, которые предъявляются к каждому из них. Исследователю необходимо лишь следить за тем, чтобы его гипотезы совпадали по смыслу и по форме с гипотезами, предлагаемыми в описании каждого из критериев.
Т-критерий Вилкоксона — непараметрический статистический тест (критерий), используемый для проверки различий между двумя выборками парных измерений. Впервые предложен Фрэнком Уилкоксоном[1]. Другие названия — W-критерий Вилкоксона [2], критерий знаковых рангов Вилкоксона, критерий Уилкоксона для связных выборок. Критерий предназначен для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность, то есть способен определить, является ли сдвиг показателей в одном направлении более интенсивным, чем в другом. ритерий применим в тех случаях, когда признаки измерены, по крайней мере, в порядковой шкале. Целесообразно применять данный критерий, когда величина самих сдвигов варьирует в некотором диапазоне (10—15 % от их величины). Это объясняется тем, что разброс значений сдвигов должен быть таким, чтобы появлялась возможность их ранжирования. В случае если сдвиги незначительно различаются между собой и принимают какие-то конечные значения (например. +1, -1 и 0), формальных препятствий к применению критерия нет, но, ввиду большого числа одинаковых рангов, ранжирование утрачивает смысл, и те же результаты проще было бы получить с помощью критерия знаков.
Суть метода состоит в том, что сопоставляются абсолютные величины выраженности сдвигов в том или ином направлении. Для этого сначала все абсолютные величины сдвигов ранжируются, а потом суммируются ранги. Если сдвиги в ту или иную сторону происходят случайно, то и суммы их рангов окажутся примерно равны. Если же интенсивность сдвигов в одну сторону больше, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях. Минимальное значение величины: {\displaystyle W=n(n+1)/2} , где n — объём второй выборки. Максимальное значение величины {\displaystyle W=n(n+1)/2+mn} , где n — объём второй выборки, m — объём первой выборки.
Ограничения критерия Объем выборки — от 5 до 50 элементов[ источник не указан 1895 дней ]. Нулевые сдвиги исключаются из рассмотрения. (Это требование можно обойти, переформулировав вид гипотезы. Например: сдвиг в сторону увеличения значений превышает сдвиг в сторону их уменьшения и тенденцию к сохранению на прежнем уровне.) Сдвиг в более часто встречающемся направлении принято считать «типичным», и наоборот. Есть также урезанный вариант для сравнения одной выборки с известным значением медианы.
Алгоритм
Фактически оцениваются знаки значений, полученных вычитанием ряда значений одного измерения из другого. Если в результате количество снизившихся значений примерно равно количеству увеличившихся, то гипотеза о нулевой медиане подтверждается.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|