3.4. Выборочные оценки и доверительные интервалы
3. 4. Выборочные оценки и доверительные интервалы
В многомерном регрессионном анализе матричным аналогом дисперсии одной переменной является ковариационная матрица å b вектора оценок параметров b: , где sij = M[(bi-M(bi))× (bj-M(bj))] - ковариации (корреляционные моменты) оценок параметров bi и bj. На главной диагонали этой матрицы находятся дисперсии оценок параметров регрессии:
sii = M[(bi-M(bi))× (bi-M(bi))] = sbi2.
Путем преобразований (см. [5, с. 92]) получаем ковариационную матрицу:
Таким образом, с помощью обратной матрицы (Х’X)-1 определяется как сам вектор оценок b, так и дисперсии-ковариации его компонент. Выше мы показали, что оценка b вектора b по МНК является несмещенной и обладает наименьшей дисперсией, т. е. является эффективной (“наилучшей”). Рассмотрим оценку дисперсии s2 возмущений e=Y – Xb (подробный вывод см. [5, с. 95]). Соответствующее выражение для несмещенной выборочной оценки s2 параметра s2 возмущений e:
Оценим значимость коэффициентов bj множественной регрессии, а затем и доверительного интервала для них. Нулевая гипотеза Но: b= 0 отвергается с уровнем значимости a, если:
Поэтому доверительный интервал для параметра bj:
Аналогично доверительному интервалу (2. 26) для Мх(Y) парной регрессии построим доверительный интервал для условного МО Мх(Y) множественной регрессии:
где - групповая средняя, определяемая по уравнению регрессии;
На основе выражения (3. 14) можно оценивать ошибку (конус) прогноза в среднем. Однако индивидуальное значение прогноза имеет больший доверительный интервал. Ранее мы рассмотрели его для парной регрессии (см. формулу (2. 28)). Аналогичный интервал для индивидуальных значений зависимой переменной множественной регрессии:
Аналогично доверительному интервалу для s2 парной регрессии (2. 31) строится доверительный интервал и для множественной регрессии с соответствующим изменением числа степеней свободы для c2:
3. 5. Оценка значимости и адекватности множественной регрессии
Как и в случае парной регрессии оценить значимость множественной регрессионной модели - значит подтвердить или опровергнуть суждение о том, что эта модель соответствует наблюденным данным. Для решения задачи также используется дисперсионный анализ, согласно которому для сумм квадратов отклонений справедливо равенство: Q = QR + Qe. Для этих сумм квадратов нетрудно записать матричные выражения:
Гипотеза Но о равенстве нулю всех параметров модели (b1=b2=... = bр = 0) отвергается, если фактическое значение статистики Фишера-Снедекора больше ее табличного значения:
Ранее в выражении (2. 36) для оценки адекватности, прогностической силы парной регрессионной модели вводился коэффициент детерминации: R2 = QR / Q = 1 - Qe / Q. Для множественной регрессии коэффициент R2 может быть рассчитан по формулам:
Несмотря на достоинства коэффициента детерминации R2, судить только по нему о качестве - адекватности - модели некорректно. Дело в том, что R2 растет с увеличением числа объясняющих переменных, включаемых в модель, что не всегда верно. Поэтому применяют скорректированный (адаптированный) коэффициент детерминации :
или
Как видно, чем больше объясняющих переменных р, тем меньше в сравнении с R2 при прочих равных условиях. Таким образом, в модель должны включаться только те объясняющие переменные, которые действительно информативны и существенно влияют на объясняемую переменную Y.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|