Каким образом определяется модель множественной линейной регрессии?
модель множественной линейной регрессии. Теоретическое линейное уравнение регрессии имеет вид: или для индивидуальных наблюдений i, i = 1, 2,…, n, Здесь После выбора линейной функции в качестве модели зависимости необходимо оценить параметры регрессии. Пусть имеется n наблюдений вектора объясняющих переменных X = (X1, X2,..., Хт) и зависимой переменной У:
Для того чтобы однозначно можно было бы решить задачу отыскания параметров Например, для однозначного определения оценок параметров уравнения регрессии
Таким образом, вполне логичен следующий вывод: если число наблюдений больше минимально необходимого, т.е. n > m+1, то уже нельзя подобрать линейную форму, в точности удовлетворяющую всем наблюдениям, и возникает необходимость оптимизации, т.е. оценивания параметров В данном случае число Самым распространенным методом оценки параметров уравнения множественной линейной регрессии является метод наименьших квадратов (МНК). Напомним, что его суть состоит в минимизации суммы квадратов отклонений наблюдаемых значений зависимой переменной У от ее значений У, получаемых по уравнению регрессии.
Предпосылки МНК. Каковы последствия их невыполнимости? Предпосылки МНК 1°. Математическое ожидание случайного отклонения M( 2°.Гомоскедастичностъ (постоянство дисперсии отклонений). Дисперсия случайных отклонений 3°. Отсутствие автокорреляции. Случайные отклонения
4°. Случайное отклонение должно быть независимо от объясняющих переменных. 5°. Модель является линейной относительно параметров.. Для случая ножественной линейной регрессии существенными являются еще две предпосылки. 6°. Отсутствие мультиколлинеарности. Между объясняющими переменными отсутствует строгая (сильная) линейная зависимость. 7°. Ошибки Выполнимость данной предпосылки важна для проверки статистических гипотез и построения интервальных оценок. При невыполнимости данной предпосылки (при гетероскедастичности) последствия применения МНК будут следующими. Оценки коэффициентов по-прежнему останутся несмещенными и 1. Оценки не будут эффективными (т.е. они не будут иметь наименьшую дисперсию по сравнению с другими оценками данного параметра). Они не будут даже асимптотически эффективными. Увеличение дисперсии оценок снижает вероятность получения максимально точных оценок. 2. Дисперсии оценок будут рассчитываться со смещением. Смещенность появляется вследствие того, что не объясненная уравнением регрессии дисперсия 4. Вследствие вышесказанного все выводы, получаемые на основе соответствующих t- и F-статистик, а также интервальные оценки будут ненадежными. Следовательно,статистические выводы, получаемые при стандартных проверках качества оценок, могут быть ошибочными и приводить к неверным за иключениям по построенной модели. Вполне вероятно, что стандартные ошибки коэффициентов будут занижены, а следовательно, t-статистики будут завышены. Это может привести к признанию статистически значимыми коэффициентов, таковыми на самом деле не являющихся.
1. 13)Характеристика коэффициентов уравнения регрессии. С помощью т статистики, Р, грубое правило
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|