Сделайте выводы о соответствии выбранной парной линейной модели регрессии эмпирическим данным - по всем показателям адекватности и качества модели.
Лабораторная работа №1. Парная линейная регрессия Цель работы Построение парной линейной регрессии и проверка значимости. Проверка статистической значимость значений коэффициентов регрессии и коэффициента корреляции. Вычисление доверительных интервалов параметров линейной регрессии. Построение прогноза и вычисление стандартных ошибок прогноза
Содержаниеотчета и представление работы Отчет по работе оформляется в виде файла Excel и должен содержать полученные результаты с необходимыми пояснениями.
Задание к работе Исходные данные смоделированы на основе линейной эконометрической модели:
где случайные величины Исходные данные представляют собой двумерную выборку По выборке необходимо построить парную линейную регрессию и проверить ее статистическую значимость.
1. Для заданных исходных данных постройте поле корреляции — диаграмму зависимости показателя
Рис. 1. Диаграмма зависимости показателя
2. Найдите выборочные характеристики — выборочные средние значения Вычисления в Excel реализованы по формулам
— смещенные выборочные оценки дисперсии В Excel реализованы формулы
— смещенные выборочные средние квадратические отклонения
— выборочный коэффициент корреляции
Рис. 2. Выборочные характеристики, вычисленные средствами Excel.
Для вычисления коэффициентов воспользуйтесь встроенной функцией LINEST/ ЛИНЕЙН (функция находится в категории “Статистические” и вычисляет выборочные оценки
1) В свободном месте рабочего листа выделите область ячеек размером 5 строк и 2 столбца для вывода результатов.
2) В Мастере функций (категория “Статистические”) выберите функцию LINEST /ЛИНЕЙН.
3) Заполните поля аргументов функции:
Известные_значения_y — адреса ячеек, содержащих значения признака
Известные_значения_x — адреса ячеек, содержащих значения фактора
Константа — логическое значение, указывающее на наличие свободного члена a в уравнении регрессии: укажите значение поля Константа равное 1, тогда свободный член рассчитывается обычным образом (если значение поля Константа равно 0, то свободный член полагается равным 0);
Статистика — логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет: укажите значение поля Статистика равное 1, тогда выводится дополнительная регрессионная информациям (если Статистика = 0, то выводятся только оценки параметров уравнения регрессии — оценки a и b).
4) После того, как будут заполнены все аргументы функции, нажмите комбинацию клавиш <CTRL> + <SHIFT> + <ENTER>. Расчеты параметров регрессионной модели выводятся в виде таблицы:
Таблица 1.
Регрессионная сумма квадратов Остаточная сумма квадратов
Рис. 3. Таблица результатов использования функции LINEST /ЛИНЕЙН.
4. Проверьте значения коэффициентов
Рис. 4. Таблица значений коэффициентов
5. Вычислите значения
Рис. 5. Результаты выполнения пунктов 5 и 6.
7. Вычислите остатки 8. Постройте график остатков (тип диаграммы — «Точечная»).
Рис. 5. График остатков
10. Вычислите коэффициент детерминации
Сравните полученное значение коэффициента детерминации с вычисленным ранее с помощью функции CORREL/ КОРЕЛЛ выборочным коэффициентом корреляции.
11. Рассчитайте оценку
Статистика Из таблицы распределения Стьюдента с n - 2 степенями свободы по заданному уровню значимости выбирается значение
Тогда: 1) Если 2) Если
Статистика Из таблицы распределения Стьюдента с n - 2 степенями свободы по заданному уровню значимости выбирается значение Тогда: 1) Если 2) Если
Статистика Из таблицы распределения Стьюдента с n - 2 степенями свободы по заданному уровню значимости Тогда: 1) Если 2) Если
Проверка значимости коэффициента b одновременно является проверкой значимости парной линейной регрессии в целом. Еще один способ проверки значимости парной линейной регрессии основан на коэффициенте детерминации R2 и статистике, распределенной по закону Фишера с числом степеней свободы числителя равном 1 и числом степеней свободы знаменателя равном n - 2.
Табличные значения
Аргументы этой функции: Вероятность — уровень значимости Степени_свободы — число степеней свободы, для парной линейной регрессии равно
13. Проверьте значимость полученного уравнения регрессии в целом по критерию Фишера.
Если выполнены предположения регрессионного анализа, то при выполнении гипотезы По таблице распределения Фишера-Снедекора при заданном уровне значимости определяется значение при числе степеней свободы числителя равном 1 и числе степеней свободы знаменателя равном n - 2. Тогда: 1) Если 2) Если
Значение
Вероятность — уровень значимости Степени_свободы1 — число степеней свободы числителя, равно 1 (т.к. один фактор); Степени_свободы2 — число степеней свободы знаменателя, для парной регрессии равно
14. Вычислите доверительные интервалы параметров линейной регрессии.
Доверительные интервалы для параметров a и b с заданным уровнем доверия, в качестве которого на практике обычно выбирают вероятность 0,95 (соответствующую уровню значимости 0.05 или 5%).
15. Постройте прогноз среднего значения показателя и точечный прогноз значения
Точечный прогноз Интервальный прогноз (доверительный интервал прогноза)
По таблицам распределения Стьюдента с n - 2 степенями свободы определяется
есть доверительный интервал прогноза индивидуального значения показателя
Стандартная ошибка индивидуального прогноза определяется по формуле:
Очевидно, что чем дальше
В диалоговом окне этой процедуры поля Входной интервал y, Входной интервал x, Константа имеют тот же смысл, что и для функции LINEST/ ЛИНЕЙН.
В поле Метки поставьте флажок, если первая строка в указанном диапазоне данных содержит названия столбцов. Поставьте флажок в полях Остатки, График остатков, График подбора для того, чтобы получить соответствующую дополнительную информацию.
В результате выполнения процедуры Регрессия появляются три таблицы - регрессионная статистика; - дисперсионный анализ; - таблица, содержащая коэффициенты регрессии, стандартные шибки, t - статистики и границы доверительных интервалов.
Множественный R – множественный коэффициент корреляции
( R-квадрат – коэффициент детерминации Нормированный R-квадрат – (скорректированный коэффициент детерминации) m – число факторов (для парной регрессии – один фактор, одна независимая переменная x, m = 1)
Стандартная ошибка – (выборочное стандартное отклонение остатков)
p – число параметров (для парной регрессии – параметры a и b, p = m + 1)
Наблюдения – n объем выборки.
SSобщ – общая сумма квадратов отклонений
SSрег – сумма квадратов отклонений расчетных значений SSост – сумма квадратов остатков SSост = 10370,1 Эти суммы связаны равенством
MSрег – средний квадрат регрессии MSрег = 93584,5
MSост – средний квадрат остатков
F - статистика, служит для проверки значимость полученного уравнения регрессии в целом по критерию Фишера.
df – число степеней свободы,
– df общ = n – 1 – число степеней свободы суммы SSобщ
– df рег = p – 1 – число степеней свободы суммы SSрег – df ост = n – p – число степеней свободы суммы SSост df общ = df рег + df ост
Нижние 95% – нижняя граница доверительного интервала с доверительной вероятностью 0,95,
Верхние 95% – верхняя граница доверительного интервала с доверительной вероятностью 0,95,
Сделайте выводы о соответствии выбранной парной линейной модели регрессии эмпирическим данным - по всем показателям адекватности и качества модели.
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|