Общая схема проверки гипотез.
Ø Исходя из экономических соображений и содержания проблемы, формулируют нулевую гипотезу H0. Ø Задаются величиной уровня значимости критерия α, т.е. вероятностью отвергнуть правильную гипотезу H0. Чем более правдоподобна гипотеза, тем меньше должно быть α: 0,05; 0,01; 0,005 и меньше. При наличии столь же правдоподобной альтернативной гипотезы H1 уровень значимости следует выбирать равным вероятности ошибки второго рода (отвергнуть альтернативную гипотезу, когда она верна). Ø Выбирают некоторую функцию – статистику ψ, зависящую от результатов наблюдений x1,x2, …, xn, и находят законы ее распределения Fψ(x) при обеих гипотезах H0 и H1. Это самый сложный этап с математической точки зрения. Ø С помощью закона распределения Fψ(x) на основе выбранного уровня значимости α область возможных значений статистики разбивают на области неправдоподобно малых и больших значений статистики ψ и область правдоподобных значений ψ. Ø Вычисляют значение статистики ψ по статистическим данным выборки. Выясняют, в какую область попадает значение ψ(x1,x2, …, xn) и принимают решение: если величина ψ попадает в область правдоподобия гипотезы H0, то считают, что статистические данные не противоречат гипотезе H0 и она принимается. Этому выводу всегда соответствуют вероятности ошибок α и β. Причем α = β, если две гипотезы априори одинаково правдоподобны. В качестве статистик используют: U или Z для нормально распределенных случайных величин; F или V2 дляраспределения по закону Фишера – Снедекора; T для распределения Стьюдента; χ2 для распределения по закону χ2 («хи квадрат»). Проверку статистических данных на наличие «выбросов» осуществляют при большом объеме выборки с помощью статистики
S = (x* - ) / σ В качестве нулевой гипотезы H0 выдвигается предположение: x* – выброс. Значение Sкр определяется по таблице в зависимости от значений параметров: уровня значимости α и объема выборки n. Если Sнабл > Sкр, гипотеза H0 принимается, т.е. x* – выброс. В противном случае гипотеза H0 отвергается.
Тесты для самоконтроля Составьте краткие ответы на следующие вопросы
Характеристика тестов
· Всего вопросов – 26; · Количество вопросов уровня 1 – 11; уровня 2 – 11; уровня 3 – 4. · Количество баллов за вопрос § уровня 1 – 1; § уровня 2 – 2; § уровня 3 – 3. Количество баллов за раздел 1 – 45.
II. Корреляционный и регрессионный анализ Система случайных величин
Случайные величины, возможные значения которых определяются двумя и более числами, называются двумерными, трехмерными,…, n - мерными. Двумерная случайная величина обозначается (X, Y), а величины X и Y называют составляющими (компонентами). Обе величины X и Y, рассматриваемые одновременно, образуют систему двух случайных величин. И, по аналогии, n – мерную величину можно рассматривать как систему n случайных величин. Различают дискретные и непрерывные многомерные случайные величины. Законом распределения дискретной двумерной случайной величины называется перечень возможных значений этой величины, т.е. пар чисел (xi,yj), и их вероятностей p(xi,yj) (I = 1,2,…, n; j = 1,2,…,m). Обычно закон распределения задают в виде таблицы с двумя входами, в которой по строкам располагают значения Y, а по столбцам значения X, а в клетке, соответствующей (xi,yj), указывается вероятность p(xi,yj). Очевидно, что P(xi) = ; P(yj) = ; =1 Функцией распределения двумерной случайной величины (X,Y) называют функцию F(x,y), определяющую вероятность того, что X примет значение, меньшее x, и при этом Y примет значение, меньшее y: F (x, y) = P (X < x, Y < y) Функция распределения есть неубывающая функция по обоим аргументам, значения которой меняются в пределах от 0 до 1. Плотностью совместного распределения вероятностей f (x, y) двумерной непрерывной случайной величины (X, Y) называют вторую смешанную частную производную от функции распределения Плотность распределения одной из составляющих двумерной случайной величины находится по формуле: f1(x) = ; f2(y) = Для характеристики зависимости между составляющими двумерной дискретной случайной величины вводится понятие условного распределения. Если, допустим, в результате испытания величина Y приняла значение Y = yj, при этом X примет одно из своих возможных значений x1, x2, …, xn. Условная вероятность того, что X примет значение xi при условии, что Y приняло значение yj, обозначается так: p (xi | yj). Условным распределением составляющей X при Y = yj называют совокупность условных вероятностей p(xi | yj)(i = 1,2,…,n), вычисленных в предположении, что событие
Y = yj уже наступило. Аналогично определяется условное распределение составляющей Y. Зная закон распределения двумерной случайной величины, можно найти условные законы распределения составляющих: p (xi | yj) = p(xi,yj) / p (yj); p (yj | xi) = p(xi, yj) / p (xi) Сумма вероятностей условного распределения равна 1: . Условной плотностью φ (x | y) распределения составляющих X при данном значении Y = y называют отношение плотности совместного распределения f (x, y) системы (X, Y) к плотности распределения f2 (y) составляющей Y: f(x | y) = f(x, y) / f2 (y) и аналогично определяется условная плотность распределения составляющей Y при данном значении X = x: f(y | x) = f(x, y) / f1 (x) Отличие условной плотности f(x | y) от безусловной плотности f1(x) состоит в том, что функция f(x | y) дает распределение X при условии, что составляющая Y приняла значение Y = y; функция f1(x) дает распределение X независимо от того, какие из возможных значений приняла составляющая Y. Аналогичные рассуждения справедливы и для условной и безусловной плотности f(y | x) и f2 (y). Условным математическим ожиданием дискретной случайной величины Y при X = x, где x – определенное возможное значение X, называют сумму произведений возможных значений Y на их условные вероятности: M (Y | X = x) = Для непрерывной случайной величины M (Y | X = x) = , где f(y | x) – условная плотность случайной величины Y при X = x. Аналогично определяется условное математическое ожидание X при Y=y. Условное математическое ожидание M(Y | x) является функцией от x: M (Y | x) = f (x), которую называют функцией регрессии Y на X. Аналогично определяется условное математическое ожидание случайной величины X и функция регрессии X на Y: M (X | y) = φ (y).
Для описания системы двух случайных величин, кроме числовых характеристик составляющих, используют корреляционный момент и коэффициент корреляции.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|