Метод наименьших квадратов
Стр 1 из 2Следующая ⇒ Регрессионный анализ
Понятие ожидаемого значения случайной переменной позволяет дать точное определение понятия функции регрессии. Пусть случайная переменная у принимает свои значения в опыте вместе с переменной х (случайной или детерминированной — неважно). Простая (парная) регрессия представляет собой модель, где ожидаемое значение зависимой (объясняемой, эндогенной) переменной y рассматривается как функция одной объясняющей (независимой или управляемой, предопределённой) переменной х, то есть модель вида Е(y) =f(x) Множественная регрессия представляет собой модель, где ожидаемое значение зависимой переменной y рассматривается как функция многих объясняющих переменных, то есть модель вида Е(y) =f(x1, х2, …, xn) Случайную переменную у формируют функция f(x) и случайная величина u (uncertainty, disturbance term, возмущение) с ожидаемым значением, равным нулю: у = f(x) + и Такое разложение случайной переменной у именуется регрессионным анализом переменной у. Предполагается, что f(x) отражает идеальную закономерность, на которую накладываются неучтённые факторы или ошибки измерения. В физике это так, а в экономике – нет. В физике параметрами функции f(x) м.б. константы (скорость света, масса протона, период полураспада радиоактивного изотопа). В экономике измеряемые величины (ВВП, количество населения) и их взаимосвязи постоянно меняются, поэтому нет фундаментальных констант. Тем не менее, эконометрика переняла математический аппарат, разработанный для физики, и мы его будем использовать. Регрессионные модели, которые наиболее часто используются в эконометрике: 1) Линейная y = a + bx+u; употребляется наиболее часто, остальные функции стараются преобразовать к линейному виду, т.е. линеаризовать.
Регрессии, нелинейные относительно включённых в анализ объясняющих переменных: 2) Полином второй, редко третьей степени y = a + bx+сх2+u. 3) Равносторонняя гипербола y = a +b/x +u. Эти модели сводятся к линейным заменой переменных: z = х2 для полинома и z=1/x для гиперболы. К нелинейным регрессиям по оцениваемым параметрам относятся: 4) Степенная y = axbe; 5) Показательная y = abxe; 6) Экспоненциальная y = ea+bxe. Здесь e =1+ u. Эти модели могут быть линеаризованы логарифмированием. Следует отметить разницу между идеальной закономерностью, которую для линейной модели обычно записывают y = a + bx+u и оценённой регрессионной моделью y = a +bx + e, а также возмущением u и отклонением, или ошибкой е. Предполагается, что a и b являются реальными константами, а a и b служат их оценками. В экономике констант нет, но математический аппарат сохраняется. Возмущение u – это отклонение реального замера от идеальной закономерности (a + bх), которую мы не знаем. Значит, u мы тоже не знаем, но можем делать предположение о его свойствах. Ошибка е – это разность между реальным у и его значением, оценённым по формуле (a + bx); она служит оценкой u. Коэффициенты b и a можно вычислить по формулам
Метод наименьших квадратов Для оценки параметров линейной или линеаризованной модели применяется метод наименьших квадратов (МНК). Суть метода состоит в следующем: к реальным данным подбирается функция и её параметры, чтобы разности (отклонения, остатки) между реальными и вычисленными значениями у были минимальны. Но разностей много, поэтому минимизируется сумма квадратов этих разностей: Рис.3.1. Отклонения реальных у от оценённой функции регрессии.
Как правило, вычисления проводятся на компьютере с использованием различных сервисов и программ. Далее мы рассмотрим технологию МНК, которую использовали при ручном вычислении параметров парной линейной регрессии.
Сумма квадратов остатков, зависящая от параметров a и b
где n – количество измерений. Эта функция достигает минимума в точке, где её частные производные по a и по b равны нулю:
или an + bSx = Sy; aSx + bSx2 =Sxy Это система нормальных уравнений. В ней два уравнения и два неизвестных a и b, а коэффициенты получаются суммированием х, у и т.д. Решать её можно разными способами. В данном случае использован сервис Excel «Поиск решения» для настройки линейной модели по данным X и Y, представленным в Таблице 3.1. Коэффициенты системы нормальных уравнений расположены в виде матрицы (верхние строки таблицы 3.2), неизвестные a и b задаются произвольно и умножаются на коэффициенты (нижние строки). В окне Поиска решения задаются: Целевая ячейка – первая сумма, Значение равно 247 (Sy), Изменяя ячейки – a и b, Ограничения: вторая сумма равна 3901 (Sxy). Исходные данные X и Y приведены в Таблице 3.1. результаты расчёта в Таблице 3.2. Таблица 3.1. Таблица 3.2.
Теперь можно построить функцию регрессии Ŷ, сравнить её с Y и использовать для прогноза. В принципе, МНК с Поиском решения можно использовать непосредственно. Для этого надо задать произвольные коэффициенты a и b, построить по ним функцию Ŷ = a + bX, вычислить остатки e = Y – Ŷ и их квадраты, сумму e 2. В окне Поиска решения установить Целевая ячейка Se2 минимум, Изменяя ячейки a и b, ограничений нет.
Таблица 3.3.
Этот метод описан более подробно в разделе 4.4.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|