Главная | Обратная связь | Поможем написать вашу работу!

Проверка гипотез о значимости коэффициентов линейного уравнения регрессии

Эмпирическое уравнение регрессии определяется на основе конечного числа статистических данных. Поэтому коэффициенты эмпирического уравнения регрессии являются случайными величинами, изменяющимися от выборки к выборке. При проведении статистического анализа перед исследователем зачастую возникает необходимость сравнения эмпирических коэффициентов регрессии b₀ и b₁ с некоторыми теоретически ожидаемыми (истинными по генеральной совокупности) значениями b₀ и b₁ этих коэффициентов. Данный анализ осуществляется по схеме статистической проверки гипотез, которая подробно проанализирована в пунктах 2.3–2.4.

Для проверки гипотезы

Н₀: b₁ = b₁,

H₁: b₁ ≠ b₁

используется статистика

, (8.8)

которая при справедливости гипотезы Н₀ имеет распределение Стьюдента с числом степеней свободы n = n–2, где n – объем выборки. Следовательно, Н₀: b₁ = b₁ отклоняется на основании данного критерия, если

, (8.9)

где a — требуемый уровень значимости. При невыполнении (8.9) считается, что нет оснований для отклонения H₀.

Наиболее важной на начальном этапе статистического анализа построенной модели все же является задача установления наличия линейной зависимости между Y и X. Эта проблема может быть решена по той же схеме:

Н₀: b₁ = 0,

H₁: b₁ ≠ 0.

Гипотеза в такой постановке обычно называется гипотезой о статистической значимости коэффициента регрессии. При этом, если Н₀ принимается, то есть основания считать, что величина Y не зависит от X. В этом случае говорят, что коэффициент b₁ статистически незначим (он слишком близок к нулю). При отклонении Н₀ коэффициент b₁ считается статистически значимым, что указывает на наличие определенной линейной зависимости между Y и X. В данном случае рассматривается двусторонняя критическая область, так как важным является именно отличие от нуля коэффициента регрессии, и он может быть как положительным, так и отрицательным.

Поскольку полагается, что b₁ = 0, то формально значимость оцененного коэффициента регрессии b₁ проверяется с помощью анализа отношения его величины к его стандартной ошибке . При выполнении исходных предпосылок модели эта дробь имеет распределение Стьюдента с числом степеней свободы n = n-2, где n – число наблюдений. Данное отношение называется t–статистикой:

. (8.10)

Для t-статистики проверяется нулевая гипотеза о равенстве ее нулю. Очевидно, t = 0 равнозначно b₁ = 0, поскольку t пропорциональна b₁. Фактически это свидетельствует об отсутствии линейной связи между X и У.

По аналогичной схеме на основе t-статистики проверяется гипотеза о статистической значимости коэффициента b₀:

(8.11)

Отметим, что для парной регрессии более важным является анализ статистической значимости коэффициента b₁, так как именно в нем скрыто влияние объясняющей переменной X на зависимую переменную Y. Рассмотрим все сказанное выше на примере из главы 3.

Пример 3.1. Пусть имеются статистические данные об объёме выпуска некоторой продукции (X, тыс. единиц) и соответствующих затратах на производство (Y, млн. руб.). Требуется построить линейную регрессионную зависимость затрат от объёма выпуска.

i - номер измерения	Объём выпуска продукции, X_i, тыс. ед.	Затраты на выпуск продукции, Y_i, млн руб.	Затраты на выпуск прод. теор, Y_teor(x_i), млн руб.	e_i^2=(Y_i–Y_teor(x_i))^2	x_i^2
			24,7481	27,582216
	1,5		41,0106	1,0213898	2,25
			89,7981	104,07702
	4,5		138,585	345,42944	20,25
	5,2		161,353	128,89638	27,04
	5,8		180,868	118,11935	33,64
	6,5		203,635	695,07132	42,25
x_cp.=	3,92857			1420,1971	135,43
				(xi^2)cp.=	19,3471
			(x_i^2)_cp.-(x_cp.)^2=	3,91346

10,36857.

3,220027.

10,10087.

Критическое значение при уровне значимости a = 0,05 равно 2,571.

Сравним модуль наблюдаемого значения = 10,10086 с критическим значением t_0,025;5=2,571. Поскольку =10,10086> 2,571 = t_кр, то нулевая гипотеза {t = 0} должна быть отвергнута в пользу альтернативной при выбранном уровне значимости. Это подтверждает статистическую значимость коэффициента регрессии b₁.

Аналогично проверяется статистическая значимость коэффициента b₀:

10,36856×19,3471 =

= 200,6021.

14,16341.

-0,54908.

Так как = 0,54908 < 2,571 = t_кр, то гипотеза о статистической незначимости коэффициента b₀ не отклоняется. Это означает, что в данном случае свободным членом уравнения можно пренебречь в смысле значимости.

При оценке значимости коэффициента линейной регрессии на начальном этапе можно использовать следующее «грубое» правило, позволяющее не прибегать к таблицам.

Если стандартная ошибка коэффициента больше его модуля (ïtï£ 1), то коэффициент не может быть признан значимым, так как доверительная вероятность при двусторонней альтернативной гипотезе составит менее чем 0,7.

Если 1 <ïtï£ 2, то найденная оценка может рассматриваться как относительно (слабо) значимая. Доверительная вероятность в этом случае лежит между значениями 0,7 и 0,97.

Если 2 <ïtï£ 3 то это свидетельствует о значимой линейной связи между X и Y. В этом случае доверительная вероятность колеблется от 0,95 до 0,99.

Наконец, если ïtï> 3, то это почти гарантия наличия линейной связи.

Конечно, в каждом конкретном случае имеет значение число наблюдений. Чем их больше, тем надежнее при прочих равных условиях выводы о значимости коэффициента. Однако для n>10 предложенное «грубое» правило практически всегда работает [3].

12 3 Следующая ⇒

Воспользуйтесь поиском по сайту: