3.4. Выборочные оценки и доверительные интервалы
3. 4. Выборочные оценки и доверительные интервалы
В многомерном регрессионном анализе матричным аналогом дисперсии одной переменной является ковариационная матрица å b вектора оценок параметров b:
где sij = M[(bi-M(bi))× (bj-M(bj))] - ковариации (корреляционные моменты) оценок параметров bi и bj. На главной диагонали этой матрицы находятся дисперсии оценок параметров регрессии:
sii = M[(bi-M(bi))× (bi-M(bi))] = sbi2.
Путем преобразований (см. [5, с. 92]) получаем ковариационную матрицу:
Таким образом, с помощью обратной матрицы (Х’X)-1 определяется как сам вектор оценок b, так и дисперсии-ковариации его компонент. Выше мы показали, что оценка b вектора b по МНК является несмещенной и обладает наименьшей дисперсией, т. е. является эффективной (“наилучшей”). Рассмотрим оценку дисперсии s2 возмущений e=Y – Xb (подробный вывод см. [5, с. 95]). Соответствующее выражение для несмещенной выборочной оценки s2 параметра s2 возмущений e:
Оценим значимость коэффициентов bj множественной регрессии, а затем и доверительного интервала для них. Нулевая гипотеза Но: b= 0 отвергается с уровнем значимости a, если:
Поэтому доверительный интервал для параметра bj:
Аналогично доверительному интервалу (2. 26) для Мх(Y) парной регрессии построим доверительный интервал для условного МО Мх(Y) множественной регрессии:
где
На основе выражения (3. 14) можно оценивать ошибку (конус) прогноза в среднем. Однако индивидуальное значение прогноза имеет больший доверительный интервал. Ранее мы рассмотрели его для парной регрессии (см. формулу (2. 28)). Аналогичный интервал для индивидуальных значений зависимой переменной
Аналогично доверительному интервалу для s2 парной регрессии (2. 31) строится доверительный интервал и для множественной регрессии с соответствующим изменением числа степеней свободы для c2:
3. 5. Оценка значимости и адекватности множественной регрессии
Как и в случае парной регрессии оценить значимость множественной регрессионной модели - значит подтвердить или опровергнуть суждение о том, что эта модель соответствует наблюденным данным. Для решения задачи также используется дисперсионный анализ, согласно которому для сумм квадратов отклонений справедливо равенство: Q = QR + Qe. Для этих сумм квадратов нетрудно записать матричные выражения:
Гипотеза Но о равенстве нулю всех параметров модели (b1=b2=... = bр = 0) отвергается, если фактическое значение статистики Фишера-Снедекора больше ее табличного значения:
Ранее в выражении (2. 36) для оценки адекватности, прогностической силы парной регрессионной модели вводился коэффициент детерминации: R2 = QR / Q = 1 - Qe / Q. Для множественной регрессии коэффициент R2 может быть рассчитан по формулам:
Несмотря на достоинства коэффициента детерминации R2, судить только по нему о качестве - адекватности - модели некорректно. Дело в том, что R2 растет с увеличением числа объясняющих переменных, включаемых в модель, что не всегда верно. Поэтому применяют скорректированный (адаптированный) коэффициент детерминации
или
Как видно, чем больше объясняющих переменных р, тем меньше
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|