Проверка гипотез о значимости коэффициентов линейного уравнения регрессии
Стр 1 из 3Следующая ⇒
Эмпирическое уравнение регрессии определяется на основе конечного числа статистических данных. Поэтому коэффициенты эмпирического уравнения регрессии являются случайными величинами, изменяющимися от выборки к выборке. При проведении статистического анализа перед исследователем зачастую возникает необходимость сравнения эмпирических коэффициентов регрессии b0 и b1 с некоторыми теоретически ожидаемыми (истинными по генеральной совокупности) значениями b0 и b1 этих коэффициентов. Данный анализ осуществляется по схеме статистической проверки гипотез, которая подробно проанализирована в пунктах 2.3–2.4. Для проверки гипотезы Н0: b1 = b1, H1: b1 ≠ b1 используется статистика , (8.8) которая при справедливости гипотезы Н0 имеет распределение Стьюдента с числом степеней свободы n = n–2, где n – объем выборки. Следовательно, Н0: b1 = b1 отклоняется на основании данного критерия, если , (8.9) где a — требуемый уровень значимости. При невыполнении (8.9) считается, что нет оснований для отклонения H0. Наиболее важной на начальном этапе статистического анализа построенной модели все же является задача установления наличия линейной зависимости между Y и X. Эта проблема может быть решена по той же схеме: Н0: b1 = 0, H1: b1 ≠ 0. Гипотеза в такой постановке обычно называется гипотезой о статистической значимости коэффициента регрессии. При этом, если Н0 принимается, то есть основания считать, что величина Y не зависит от X. В этом случае говорят, что коэффициент b1 статистически незначим (он слишком близок к нулю). При отклонении Н0 коэффициент b1 считается статистически значимым, что указывает на наличие определенной линейной зависимости между Y и X. В данном случае рассматривается двусторонняя критическая область, так как важным является именно отличие от нуля коэффициента регрессии, и он может быть как положительным, так и отрицательным.
Поскольку полагается, что b1 = 0, то формально значимость оцененного коэффициента регрессии b1 проверяется с помощью анализа отношения его величины к его стандартной ошибке . При выполнении исходных предпосылок модели эта дробь имеет распределение Стьюдента с числом степеней свободы n = n-2, где n – число наблюдений. Данное отношение называется t–статистикой: . (8.10) Для t-статистики проверяется нулевая гипотеза о равенстве ее нулю. Очевидно, t = 0 равнозначно b1 = 0, поскольку t пропорциональна b1. Фактически это свидетельствует об отсутствии линейной связи между X и У. По аналогичной схеме на основе t-статистики проверяется гипотеза о статистической значимости коэффициента b0: (8.11) Отметим, что для парной регрессии более важным является анализ статистической значимости коэффициента b1, так как именно в нем скрыто влияние объясняющей переменной X на зависимую переменную Y. Рассмотрим все сказанное выше на примере из главы 3. Пример 3.1. Пусть имеются статистические данные об объёме выпуска некоторой продукции (X, тыс. единиц) и соответствующих затратах на производство (Y, млн. руб.). Требуется построить линейную регрессионную зависимость затрат от объёма выпуска.
10,36857. 3,220027. 10,10087. Критическое значение при уровне значимости a = 0,05 равно 2,571. Сравним модуль наблюдаемого значения = 10,10086 с критическим значением t0,025;5=2,571. Поскольку =10,10086> 2,571 = tкр, то нулевая гипотеза {t = 0} должна быть отвергнута в пользу альтернативной при выбранном уровне значимости. Это подтверждает статистическую значимость коэффициента регрессии b1. Аналогично проверяется статистическая значимость коэффициента b0: 10,36856×19,3471 = = 200,6021. 14,16341. -0,54908. Так как = 0,54908 < 2,571 = tкр, то гипотеза о статистической незначимости коэффициента b0 не отклоняется. Это означает, что в данном случае свободным членом уравнения можно пренебречь в смысле значимости. При оценке значимости коэффициента линейной регрессии на начальном этапе можно использовать следующее «грубое» правило, позволяющее не прибегать к таблицам. Если стандартная ошибка коэффициента больше его модуля (ïtï£ 1), то коэффициент не может быть признан значимым, так как доверительная вероятность при двусторонней альтернативной гипотезе составит менее чем 0,7. Если 1 <ïtï£ 2, то найденная оценка может рассматриваться как относительно (слабо) значимая. Доверительная вероятность в этом случае лежит между значениями 0,7 и 0,97. Если 2 <ïtï£ 3 то это свидетельствует о значимой линейной связи между X и Y. В этом случае доверительная вероятность колеблется от 0,95 до 0,99. Наконец, если ïtï> 3, то это почти гарантия наличия линейной связи. Конечно, в каждом конкретном случае имеет значение число наблюдений. Чем их больше, тем надежнее при прочих равных условиях выводы о значимости коэффициента. Однако для n>10 предложенное «грубое» правило практически всегда работает [3].
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|