Парная регрессия и корреляция
Стр 1 из 4Следующая ⇒ Министерство образования и науки РФ Южно-Российский государственный университет экономики и сервиса Безуглова Н.П. Фетисов В.Г. Эконометрика Практическое пособие ШАХТЫ 2004
УДК 519.862.6 (07) ББК 65в6(Я7) Б 406
Авторы: ассистент кафедры «Математика» Н.П.Безуглова, д.ф.-м.н., профессор кафедры «Математика» В.Г.Фетисов Рецензенты: д.т.н, профессор кафедры РЭС К.Е.Румянцев к.ф.-м.н., доцент кафедры «Математика» В.И.Филиппенко
Б 406 Безуглова Н.П.. Эконометрика: Практическое пособие/ Н.П.Безуглова, В.Г.Фетисов. – Изд-во ЮРГУЭС, 2004.- 52с.
Данное практическое пособие содержит краткие теоретические сведения, примеры решения типовых задач, а также контрольные вопросы и упражнения по основным разделам учебной дисциплины «Эконометрика». Пособие предназначено для студентов, обучающихся по специальностям 060400 «Финансы и кредит» и 060500 «Бухгалтерский учет и аудит» дневной и заочной форм обучения.
©Южно-Российский государственный университет экономики и сервиса,2004 ©Безуглова Н.П., Фетисов В.Г., 2004 Содержание
1 ПРЕДМЕТ, ЗАДАЧИ И МЕТОДЫ ЭКОНОМЕТРИКИ
Создание надежной информационной базы для менеджмента во всех отраслях экономики невозможно без учёта действия различных факторов, формирующих результаты работы организаций (предприятий). Необходимо выделить роль факторов, которые положительно или отрицательно влияют на результаты хозяйствования. Одновременно целесообразно выделить отдельно влияние факторов, которые зависят непосредственно от принятия управленческих решений данным объектом хозяйствования (предприятием, фирмой, ассоциацией предприятий или регионом) и влияние факторов, которые от менеджмента на данном хозяйственном объекте не зависят. При отсутствии необходимых для переходного периода к рыночной экономике законов или при изменении цен, тарифов, экономических нормативов, налогов, инфляции, которые, несомненно, от конкретного объекта хозяйствования не зависят, ухудшаются экономические результаты его работы. Устранение влияния таких факторов в эконометрических расчетах и характеристика их влияния путем соответствующих вычислений позволяет более правильно прогнозировать результаты хозяйственной деятельности в будущем периоде. Эконометрические расчеты помогают лучше понять хозяйственные явления и процессы, что в свою очередь позволяет более достоверно формулировать советы и давать прогнозы. Предметом эконометрики являются факторы, формирующие развитие экономических явлений и процессов. Эконометрика-это искусство разработки и предвидения экономических нормативов, прогнозов и гипотез. Основными задачами эконометрики являются: оценка направленных действий специалистов на достижение экономической эффективности хозяйственной деятельности; прогнозирование путей развития макро- и микроэкономических факторов хозяйственной деятельности. Прогнозная информация должна давать возможность принимать решение в зависимости от хозяйственной коньюктуры. Успешное выполнение поставленных перед эконометрикой задач зависит от соблюдения всех критериев и принципов эконометрических расчетов от формулировки проблемы, отбора цели, составления альтернативных действий, сбора данных, выбора метода их оценки и построения экономических прогнозов или моделей, взвешивания затрат по отношению к экономическим результатам, дополнительной проверки предпосылок и исходных данных до улучшения модели.
Наибольшее распространение в практике эконометрики имеет метод регрессионного и корреляционного анализа. Для успешного применения этого метода необходимо соблюдать статистические критерии для обработки информации о хозяйственной деятельности: наличие многочисленной совокупности предприятий, случайности хозяйственных и экономических процессов, одинаковых единиц измерения факторов и результативных показателей, нормального распределения переменных; отсутствие функциональной связи между факторами и т.д. Парная регрессия и корреляция Краткая теория Парная регрессия – уравнение связи двух переменных , где - зависимая переменная (результативный признак), - независимая, объясняющая переменная (фактор-признак). Различают линейные и нелинейные регрессии. Линейная регрессия: . Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, и регрессии, нелинейные по оцениваемым параметрам. Регрессии, нелинейные по объясняющим переменным: · полиномы разных степеней ; · равносторонняя гипербола . Регрессии, нелинейные по оцениваемым параметрам: · степенная ; · показательная ; · экспоненциальная Построение уравнения регрессии сводится к оценке ее параметров. Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака от теоретических минимальна, т.е. . Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно и .
Можно воспользоваться готовыми формулами, вытекающими из этой системы: , . Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии ():
, и индекс корреляции - для нелинейной регрессии (): . Оценку качества построенной модели даст коэффициент (индекс) детерминации, а также средняя ошибка аппроксимации. Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических: . Допустимый предел значений - не более 8-10%. Средний коэффициент эластичности оценивает силу влиянии фактора на результат и показывает, на сколько процентов в среднем по совокупности изменится результат от своей средней величины при изменении фактора на 1% от своего среднего значения: . Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной: , где - общая сумма квадратов отклонений; - сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»); - остаточная сумма квадратов отклонений. Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент (индекс) детерминации -квадрат коэффициента или индекса корреляции. F-тест – оценивание качества уравнения регрессии состоит в проверке гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического и критического (табличного) значений F-критерия Фишера. определяется из соотношения факторной и остаточной дисперсий, рассчитанный на одну степень свободы:
, где -число единиц совокупности (наблюдений), -число параметров при переменных в уравнении регрессии. - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости -вероятности отвергнуть нулевую гипотезу при условии, что она верна. обычно принимается равным 0,05 или 0,01. определяется по таблице и зависит от уровня значимости, числа степеней свободы и числа степеней свободы . Таблицу для определения а так же таблицы других используемых при решении задач статистик можно найти в [1].
Если , то гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. В противном случае гипотеза не отклоняется и признается статистическая незначимость, ненадёжность уравнения регрессии и показателя тесноты связи. Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза о случайной природе показателей, т.е. незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия проводится путем сопоставления их значений с величиной случайной ошибки. Случайные ошибки показателей и определяются по формулам: , , . Фактическиезначения t-критерия вычисляются следующим образом: , , . Критическое значение t-критерия определяется по таблице и зависит от уровню значимости и числа степеней свободы , где -число единиц совокупности (наблюдений). Если , то гипотеза о случайной природе показателей отклоняется, т.е. , и не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора . В противном случае гипотеза принимается и признается случайная природа формирования показателей , и . Для расчета доверительных интервалов определяем предельную ошибку для каждого из показателей: , . Доверительные интервалы рассчитываются по формулам: , , ; , , . Если в границы доверительного интервала попадает нуль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр признается нулевым, статистически ненадёжным, так как он не может одновременно принимать и положительные и отрицательные значения. Прогнозное значение определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения . Вычисляется средняя стандартная ошибка прогноза : , где ; и строится доверительный интервал прогноза: , , , где . Примеры решения задач Пример 2.2.1 По 12 территориям России за 199Х г. известны значения двух признаков (табл. 2.2.1.) Таблица 2.2.1
Требуется:
1. Для характеристики зависимости от рассчитать параметры следующих функций: А) линейной; Б) степенной; В) показательной; Г) равносторонней гиперболы. 2. Оценить каждую модель через среднюю ошибку аппроксимации, показатель корреляции и F-критерий Фишера. Выбрать лучшую модель.
Решение. А) Для расчета параметров и линейной регрессии составим следующую таблицу (табл.2.2.2.) Таблица 2.2.2
Напомним, что средние значения рассчитываются по формулам , , , и т.д., где (число наблюдений в рассматриваемой задаче). Дисперсия определяется по формулам , , а среднеквадратическое отклонение есть корень квадратный из дисперсии. Рассчитаем параметры и линейной регрессии . , . Уравнение линейной регрессии имеет вид . Рассчитаем линейный коэффициент парной корреляции . Связь сильная (так как ), прямая (так как ). Коэффициент детерминации , значит, вариация результата на 97,7% объясняется вариацией фактора , а на 2,3% вариацией неучтенных в модели признаков. Подставляя в уравнение регрессии фактические значения , определим теоретические (расчетные) значения . Найдем величину средней ошибки аппроксимации: . В среднем расчетные значение от фактических отклоняются на 5,2%, это говорит об удовлетворительном качестве модели, поскольку средняя ошибка аппроксимации не превышает 8-10%. Оценим теперь статистическую надежность полученной модели с помощью F-критерия Фишера. Выдвигаем гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи. . Определяем по таблице значений F-критерия Фишера . Так как , то гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.
Б) Построению степенной модели предшествует процедура линеаризации переменных. Проведем линеаризацию путем логарифмирования обеих частей уравнения: ; , где , , . Для расчетов используем данные таблицы 2.2.3. Таблица 2.2.3
Рассчитаем и : , . Получим линейное уравнение . Выполнив его потенцирование, получим: . Подставляя в уравнение регрессии фактические значения , определим теоретические (расчетные) значения . По ним рассчитаем показатели: тесноты связи- индекс корреляции и среднюю ошибку аппроксимации: . Связь сильная. Коэффициент детерминации , значит, вариация результата на 99,998% объясняется вариацией фактора , а на 0,002 % вариацией неучтенных в модели признаков. Величина средней ошибки аппроксимации говорит об удовлетворительном качестве модели, поскольку не превышает 8-10%. Оценим теперь статистическую надежность полученной модели с помощью F-критерия Фишера. Выдвигаем гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи. . . Так как , то гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. В) Построению показательной модели предшествует процедура линеаризации переменных. Проведем линеаризацию путем логарифмирования обеих частей уравнения: ; , где , , . Для расчетов используем данные таблицы 2.2.4. Таблица 2.2.4
, . Получим линейное уравнение . Выполнив его потенцирование, получим: .
Подставляя в уравнение регрессии фактические значения , определим теоретические (расчетные) значения . По ним рассчитаем показатели: тесноты связи- индекс корреляции и среднюю ошибку аппроксимации: . Связь сильная. Коэффициент детерминации , значит, вариация результата на 89 % объясняется вариацией фактора , а на 11 % вариацией неучтенных в модели признаков. Величина средней ошибки аппроксимации говорит о не очень хорошем, но все же удовлетворительном качестве модели, поскольку близко к 10%. Оценим теперь статистическую надежность полученной модели с помощью F-критерия Фишера. Выдвигаем гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи. . . Так как , то гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Г) Уравнение равносторонней гиперболы линеаризуется при замене . Тогда . Для расчетов используем данные таблицы 2.2.5. Таблица 2.2.5
Рассчитаем параметры и . , . Получено уравнение . Подставляя в уравнение регрессии фактические значения , определим теоретические (расчетные) значения . По ним рассчитаем показатели: тесноты связи - индекс корреляции и среднюю ошибку аппроксимации: . Связь сильная. Коэффициент детерминации , значит, вариация результата на 74 % объясняется вариацией фактора , а на 26 % вариацией неучтенных в модели признаков. Величина средней ошибки аппроксимации говорит неудовлетворительном качестве модели, поскольку превышает 10%. Оценим теперь статистическую надежность полученной модели с помощью F-критерия Фишера. Выдвигаем гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи. . . Так как , то гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.
Проведённые исследования показывают, что рассматриваемую в задаче зависимость лучше всего описывает степенная кривая, поскольку для этой модели показатель корреляции оказался больше, а ошибка аппроксимации меньше, чем для других построенных функций, при этом уравнение степенной регрессии статистически надёжно. Пример 2.2.2 По 14 территориям Уральского и Западно-Сибирского района по данным за ноябрь 1997 г. изучалась зависимость потребительских расходов на душу населения (тыс.руб., ) от средней заработной платы и выплат социального характера (тыс.руб., ). Было получено следующее уравнение линейной регрессии , . Известны следующие данные , , .
Задание. 1. Оценить статистическую значимость параметров регрессии и корреляции. 2. Выполнить прогноз потребительских расходов на душу населения, если значение средней заработной платы и выплат социального характера увеличится на 6% от своего среднего уровня. 3. Определить доверительны
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|