Оценка качества модели множественной регрессии: F-критерий Фишера, t-критерий Стьюдента. Мультиколлинеарность. Методы устранения мультиколлинеарности.
Значимость уравнения множественной регрессий в целом, так же как и в парной регрессии, оценивается с помощью F-критерия Фишера: (3.32) Где - факторная сумма квадратов на одну степень свободы; - остаточная сумма квадратов на одну степень свободы; - коэффициент (индекс) множественной детерминации; m - число параметров при переменных х (в линейной регрессии совпадает с числом включенных в модель факторов); n - число наблюдений. Оценивается значимость не толь ко уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший вариации в модель, может существенно увеличивать долю объясненной вариации результативного признака. Кроме того, при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частный F- критерий, т.е. . (3.33) Где - коэффициент множественной детерминации для модели с полным набором факторов; - тот же показатель, но без включения в модель фактора ; - число наблюдений; - число параметров в модели (без свободного члена). Если оцениваем значимость влияния фактора , то формула частного F –критерия примет вид: (3.34) В общем виде для фактора частный -критерий определится как В числителе – прирост доли вариации у за счет дополнительный включается в модель соотношения фактура, в значении доля остаточных вариации для полной модели
Рассмотреть зависимость объема продукции у от затрат труда х, и технической оснащенности производства . Известны: .
Дисперсионный анализ
Частный F-критерий оценивает значимость коэффициентов чистой регрессии. Зная величину Fxi, можно определить и t-критерий для коэффициента регрессии при i-м факторе, tbi, а именно:
Если уравнение содержит больше двух факторов, то соответствующая программа РС дает таблицу дисперсионного анализа, показывая значимость последовательного добавления к уравнению регрессии соответствующего фактора. Так, если рассматривается уравнение:
то определяются последовательно F-критерий для уравнения с одним фактором х1, далее F-критерий для дополнительного включения в модель фактора х2, т.е. для перехода от однофакторного уравнения регрессии к двухфакторному, и наконец, F-критерий для дополнительного включения в модель фактора х3, т.е дается оценка значимости фактора х3 после включения в модель факторов х1 и х2. В этом случае F-критерий для дополнительного включения фактора х2 после х1 является последовательным в отличие от F-критерия для дополнительного включения фактора х3, который является частным F-критерием, ибо оценивает значимость фактора в предположении, что он включен в модель последним. С t-критерием Стьюдента связан именно частный F-критерий. Последовательный F-критерий может интересовать исследователя на стадии формирования модели. Оценка значимости коэффициентов чистой регрессии по t-критерию Стьюдента может быть проведена и без расчета частных F-критериев. В этом случае, как и в парной регрессии, для каждого фактора используется формула:
где bi - коэффициент чистой регрессии при факторе хi mbi – стандартная ошибка коэффициента регрессии bi . Для уравнения множественной регрессии:
стандартная ошибка коэффициента регрессии может быть определена по следующей формуле:
- среднеквадратическое отклонение для признака у; - среднеквадратическое отклонение для признака хi - коэффициент детерминации для уравнения множественнаой регрессии. - коэффициент детерминации для значимости фактора хi со всеми другими факторами уравнения множественной регрессии. n – m – 1 - число степеней свободы для остаточной суммы квадратов отклонений. Как видим, чтобы воспользоваться данной формулой, необходимы матрица межфакторной корреляции и расчет по ней соответствующих коэффициентов детерминации . Так, для уравнения оценка значимости коэффициентов регрессии b1, b2, b3 предполагает расчет трех межфакторных коэффициентов детерминации, а именно: , , . Вместе с тем, если учесть, что
то можно убедиться, что
На основе соотношения bi и mbi получим Аналогично можно оценивать и существенность частных показателей корреляции. Фактическое значение частного коэффициента корреляции сравнивается с табличным значением при или и числе степеней свободы k=n-h-2, где n - число наблюдений, h - число исключенных переменных. Так, если n =30 и оценивается существенность частного коэффициента корреляции второго порядка (например, ), то h=2 и k=26. Если h является наивысшим порядком расчета частных коэффициентов корреляции для уравнения регрессии, то практически величина k совпадает с числом степеней свободы для остаточной вариации с n-m-1. Так, в уравнении , рассчитанном при n=30, n-m-1 =26. Если же уравнение регрессии дополняется расчетом частных коэффициентов корреляции разных порядков (второго, третьего и т.п.), то k=n-h-2 Если величина частного F-критерия выше табличного значения, то это означает одновременного не только значимость рассматриваемого коэффициента регрессии, но и значимость частного коэффициента корреляции. Существует взаимосвязь между квадратом частного коэффициента корреляции и частным F-критерием, а именно:
Где - частный коэффициент детерминации фактора с y при неизменном уровне всех других факторов. - доля остаточной вариации уравнения регрессии, включающего все факторы, кроме фактора - доля остаточной вариации для уравнения регрессии с полным набором факторов. Пример. Для рассматриваемой регрессии ; ; Тогда что соответствует ранее определенной величине . Взаимосвязь показателей частного коэффициента корреляции, частного F-критерия и t- критерия Стьюдента для коэффициентов чистой регрессии может использоваться в процедуре отбора факторов. Отсев факторов при построении уравнения регрессии методом исключения практически можно осуществлять не только по частным коэффициентам корреляции, исключая на каждом шаге фактор с наименьшим незначимым значением частного коэффициента корреляции, но и по величинам tbi и Fxi. Частный F-критерий широко используется и при построении модели методом включения переменных и шаговым регрессионным методом.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|