Регрессионный анализ трехмерной модели.
⇐ ПредыдущаяСтр 12 из 12
Для исследования статистической зависимости одного результирующего признака от двух и более факторных признаков в Excel есть две возможности: инструмент Регрессия для случая линейной статистической зависимости и непосредственное применение метода наименьших квадратов в случае зависимости любого вида. Алгоритм применения инструмента Регрессия отличается от описанного выше для случая двумерной модели только количеством исходных данных, размещаемых на рабочем листе и соответственно диапазоном входных параметров, вводимом в диалоговом окне Регрессия. Выходные данные также отличаются только количеством информации при сохранении их смысла.
Рис.8. Регрессия Y2 на X4,X8. На рис.8 приведены результаты применения инструмента Регрессия к статистическим данным по признакам X4–X8–Y2. Оценка линейной функции регрессии y2 на x4,x8 имеет вид:
Значение F–критерия Fрасч =33,2977, что значительно больше Fкр = 3,18 Это означает, что оценка достаточно хорошо согласуется с данными наблюдений. Это подтверждается и достаточно высоким значением коэффициента детерминации R2 = 0,5811351. Расчетные значения t –статистики для свободного члена и коэффициента при x4 больше tкр = 2,009, что подтверждает их значимость. Для коэффициента при x8 tрасч близко к критическому значению, что ставит под сомнение его значимость.
Рис.9. Размещение информации для МНК.
В случае нелинейной регрессии необходимо выполнять действия, предусмотренные методом наименьших квадратов(МНК), используя вычислительные возможности Excel. Расположение исходных данных и формул в таблице Excel приведено на рис.9. Все формулы вводятся только в верхнюю строку, а затем копируются по всему столбцу. На рис.9 приведены расчеты поиска оценок линейной P(x) и квадратичной P2 (x) функции регрессии. Параметры функции регрессии βj расположены в ячейках A56 ÷ C56 для линейной зависимости и в ячейках A59 ÷ F59 для квадратичной зависимости (см. рис.10). Ячейки F53 и I53 содержат значения функций Q – суммы квадратов отклонений.
Рис.10. Размещение информации для Поиска решения.
Значения βj находятся с помощью надстройки Excel Поиск решения по такому алгоритму: – установить курсор на ячейке, содержащей значение функции Q (Q2); – Сервис – Поиск решения; – в появившемся диалоговом окне Поиск решения (рис.11) проверить, стоит ли в поле Установить целевую ячейку адрес функции Q (Q2), и если нет, то ввести его; – в поле Равной щелкнуть пункт минимальному значению; – в поле Изменяя ячейки ввести диапазон ячеек, которые отведены для значений искомых параметров ; – щелкнуть по кнопке Выполнить; – если решение найдено, сообщение об этом появится в диалоговом окне, где нужно щелкнуть по пункту Сохранить найденное решение. Значения найдены и находятся в отведенных для них ячейках (рис.10). Значение суммы квадратов отклонений найденной оценки функции регрессии от наблюденных значений результирующего признака, т.е. функции Q для линейной регрессии и функции Q2 для квадратичной регрессии, находятся в ячейках F53 и I53, линейная величина отклонений – в ячейке F54 и в ячейке I54.
Рис.11. Ввод информации для Поиска решения.
Таким образом, коэффициенты линейной функции регрессии P(x) следует считывать из ячеек A56,B56 и С56; коэффициенты нелинейной функции регрессии P2(x) – из ячеек A59 F59. Для рассматриваемого примера линейная функция регрессии совпадает с полученной с помощью инструмента Регрессия, а квадратичная P2(x) = 247,9641 – 930,3571x4 + 73,538x8 + 1009,39x42 – 4,44689x82 – 140,1884x4x8 Проверка значимости полученной квадратичной оценки уравнения регрессии выполним так. Определим коэффициент корреляции значений эмпирической функции регрессии и выборочного среднего RyP2(x). Как видно из рис.12, коэффициент корреляции достаточно большой (0,80921). Выполним еще одну проверку значимости P2(x) с помощью коэффициента детерминации, для чего необходимо вычислить значения Sост, Sфакт.
Размещение нужных формул приведено на рис.12, а промежуточные результаты и значения коэффициента детерминации ниже. Поскольку коэффициент детерминации для случая квадратичной регрессии значительно превосходит коэффициент детерминации для случая линейной регрессии и имеет достаточно большое значение (0,472867), делаем вывод, что квадратичная регрессия достаточно хорошо согласуется со статистическими данными. Выполним оценку значимости полученного приближения функции в целом с помощью критерия Фишера. Для этого найдем значения критерия Фишера по выборке для рассматриваемых двух видов зависимости (см. рис.12 и 13).
Рис.12.Расчетные формулы Как видно, расчетное значение F-критерия для квадратичной зависимости значительно превосходит значение Fкрит ,что подтверждает ее значимость. Для линейной зависимости превышение Fрасч не столь велико, что делает снова-таки предпочтительнее квадратичную оценку регрессии y2 на x4 и x8 .
Рис.13.Проверка значимости.
Таким образом, выборочное уравнение регрессии имеет вид:
V. Содержание и объем курсовой работы Цель задания – выполнить статистический анализ результатов измерений и определить на основании исследования математической модели оценки законов и параметров распределения, корреляционные связи и статистические зависимости 1. Выполнить многомерный экономико-статистический анализ показателей (в соответствии с вариантом): – проверить данные на засорение; – проверить закон распределения всех параметров; – оценить тесноту связей параметров; – выполнить регрессионный анализ двумерных и трехмерной моделей. 2. Составить математическую модель задачи на основании корреляционного и регрессионного анализа статистических данных. 3. Работу выполнить средствами Excel и его надстроек Пакет анализа и Поиск решения. 4. Отчет по курсовой работе создать в среде Word с необходимыми по тексту результатами в виде таблиц и диаграмм Excel. 5. Отчет должен содержать: – титульный лист; – задание в соответствии с вариантом; – названия и краткое описание, а также результаты каждого этапа выполнения задания; – приложение в виде рабочей книги Excel, содержащей все выполненные расчеты (на дискете); Варианты заданий приведены в приложении на странице 48.
VI. Литература 1. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. – М.: Дело, 1997. – 248 с. 2. Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы: Учебник. – М.: Финансы и статистика, 2000. – 352 с. 3. Колемаев В.А. и др. Теория вероятностей и математическая статистика: Учеб. пособие для экон. спец. вузов / В.А.Колемаев, О.В.Староверов, В.Б.Турундаевский; Под ред. В.А.Колемаева. – М.: Высш. шк.,!991. – 400 с. 4. Сивец С.А. Статистические методы в оценке недвижимости и бизнесе. Учебно-практическое пособие по статистике для оценщиков. – Запорожье, 2001. – 320 с. 5. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере / Под ред. Фигурнова В.Э. – М.: ИНФРА, 1998. – 528 с. 6. Савицкая Г.В. Анализ хозяйственной деятельности предприятия. – Минск: ООО «Новое знание», 2000. – 668 с. 7. Ларсен, Рональд У. Инженерные расчеты в Excel.: Пер. с англ. – М.: Издательский дом «Вильямс», 2004. – 544 с. 8. Гурман В.Е. Теория вероятностей и математическая статистика. Учеб. Пособие для втузов. М., «Высш. школа», 1977. – 479 с.
9. Математическая статистика: Учебник / Иванова В.М., Калинина В.Н., Нешумова Л.А. и др. – М.: Высш. школа, 1981. –371 с.
Приложение Статистические данные.
Продолжение таблицы
Варианты заданий к работе «Статистический анализ» Примечание. В таблице указаны индексы факторных признаков X. Так, для варианта 1 следует выполнить статистический анализ всех 53 значений показателей Y1, X6, X8, X 11, X12, X17.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|