Процентные точки распределения серий
ВВЕДЕНИЕ
На практике при анализе случайных данных часто возникает ситуации, когда необходимо установить, являются ли полученные оценки параметров статистически независимыми или же они подвержены тренду. Так как имеющиеся данные могут иметь различные функции распределения, то целесообразно принимать решение о наличии тренда на основе использования свободных от распределений или непараметрических методов, в которых относительно функции распределения полученных данных не делается никаких предположений. Или же данных настолько мало, что корректно проверить гипотезу о наличии конкретного распределения невозможно. Наиболее известными не зависящих от формы распределения методами, которые применяются для оценки наличия тренда в совокупности данных, являются: критерий серий и критерий инверсий.
1. КРИТЕРИЙ СЕРИЙ
Рассмотрим последовательность N значений случайной величины x(k) и каждое значение отнесем к одной из двух взаимно исключающих категорий, которые обозначим знаками плюс (+) и минус (-). В качестве примера рассмотрим последовательность измеренных значений величины xi при i = 1, 2, 3,..., N, среднее значение которых равно . Каждое наблюденное значение Полученная последовательность наблюдений, имеющих знак плюс или минус, может выглядеть следующим образом: + + - + + - + + + - + - - + - - + - - - 1 2 3 4 5 6 7 8 9 10 11 12 Серией называется последовательность одинаковых значений, перед которыми или после которых расположены значения другой категории или наблюдения отсутствуют вообще. В рассмотренном примере имеется r = 12 серий в последовательности из N = 20 наблюдений. Число серий, которое встречается в последовательности наблюдений, позволяет определить, являются ли результаты независимыми случайными наблюдениями над одной и той же случайной величиной. Если после-довательность N наблюдений представляет собой независимые наблюденные значения одной и той же случайной величины, т. е. вероятность знаков (+) и (-) не меняется от одного наблюдения к другому, то выборочное распределение числа серий в последовательности есть случайная величина r(k) со средним значением
(1) и дисперсией (2) где N1 - число наблюдений со знаком (+), N2 - число наблюдений со знаком (-). В частном случае, когда N1 = N2 =N/2, соотношения (1) и (2) перепишутся в виде (3) (4) В приложении 1 приведена таблица, содержащая данные о 100a-про-центных точках функции распределения r(k). Если последовательность значений содержит тренд, то это означает, что вероятность знаков (+) или (-) меняется от одного наблюденного значения к другому. Наличие тренда можно проверить следующим образом. Рассмотрим гипотезу об отсутствии тренда, т. е. предположим, что полученные данные представляет собой независимые значения одной и той же случайной величины. Полагая, что число наблюденных значений со знаком (+) равно числу значений со знаком (-), можно считать, что число серий в последовательности будет иметь выборочное распределение, представленное в приложении 1. Гипотезу можно подвергнуть проверке при любом уровне значимости a путем сопоставления фактического числа серий с граничными значениями rn; 1-a/2 и rn; a/2, где n=N/2. Если фактическое число серий выходит за границы этого интервала, гипотезу следует отвергнуть при выбранном уровне значимости. В противном случае ее можно принять. Например, имеется последовательность из N=20 чисел: 5,5; 5,1; 5,7; 5,2; 4,8; 5,7; 5,0; 6,5; 5,4; 5,8; 6,8; 6,6; 4,9; 5,4; 5,9; 5,4; 6,8; 5,8; 6,9; 5,5. Определим, являются ли независимыми наблюденные значения, путем проверки числа серий, которые встречаются, если отсчитывать наблюденные значения от их медианы. Выполним проверку при уровне значимости a = 0,05.
Просматривая выборку, можно убедиться, что медианой данного ряда является значение x = 5,6. Примем, что числа более 5,6 имеют знак (+), а менее 5,6 - знак (-). В результате получаем последовательность - - + - - + - + - + + + - - + - + + + - 1 2 3 4 5 6 7 8 9 10 11 12 13 Таким образом, имеется 13 серий, представляющих последовательность 20 наблюденных значений. Рассмотрим гипотезу о независимости наблюденных значений. Область принятия этой гипотезы определяется интервалом [r10; 1-a/2 < r £ r10; a/2].
2. КРИТЕРИЙ ИНВЕРСИЙ Рассмотрим последовательность N значений случайной величины x(k). Обозначим эти значения символом xi, где i == 1, 2, 3,..., N. Подсчитаем теперь число случаев, когда xi > xj, при i < j. Каждое такое неравенство называется инверсией. Общее число инверсий обозначается символом А, которое формально определяется так. По ряду значений x1, x2 …, xN определим величину . Тогда где Например, и т.д. Для примера рассмотрим последовательность N = 8 значений: x1=5, x2=3, x3=8, x4=9, x5=4, x6=1, x7=7, x8=5. В этой последовательности x1 > x2, x1 > x5 и Если последовательность N наблюдений содержит независимые значения одной и той же случайной величины, то число инверсий есть случайная величина А(k) со средним значением (5) и дисперсией (6) В приложении 2 содержатся данные о 100a-процентных точках функции распределения величины А(k).
Критерий инверсий вообще говоря, имеет большую мощность, чем критерий серий, при выявлении монотонного тренда в последовательности наблюдений. Однако критерий инверсий обладает малой мощностью при выявлении колебательного тренда.
Например, проверим последовательность N = 20 значений, рассмотренных ранее, на наличие тренда при уровне значимости a = 0,05. Число инверсий в этом случае таково:
Общее число инверсий А = 62. Рассмотрим гипотезу о том, что наблюдения представляют независимые значения случайной величины х(k), не содержащей тренда. Область принятия гипотезы определяется неравенством A20; 1-a/2 < A £ A20; a/2. По данным приложения 2 при a = 0,05 находим A20;1-a/2=A20;0,975 = 64 и A20;a/2=A20;0,025= 125. Следовательно, гипотезу отвергают при 5%-ном уровне значимости, так как значение А = 62 не попадает в интервал между 64 и 125. Заметим, что гипотеза о независимости этой же последовательности значений при использовании критерия серий была принята. Этот факт иллюстрирует разницу в чувствительности двух методов проверки.
3. ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ
В соответствии с вариантом проверить гипотезу о наличии тренда, используя критерии серий и инверсий при уровнях значимости a = 5% и a=1%.
Приложение 1 Процентные точки распределения серий
Приложение 2
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|