Задача 1.7. Оценка качества многофакторной модели
⇐ ПредыдущаяСтр 5 из 5 7. Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, b- и D-коэффициентов. Для оценки качества выбранной множественной модели (6) , аналогично п.1.4 данной задачи, используем коэффициент детерминации R- квадрат, среднюю относительную ошибку аппроксимации и F -критерий Фишера. Коэффициент детерминации R -квадрат возьмем из итогов «Регрессии» (таблица «Регрессионная статистика» для модели (6)). , следовательно, вариация (изменение) цены квартиры Y на 76,77% объясняется по данному уравнению вариацией города области Х1, числа комнат в квартире Х2 и жилой площади Х4. Используем исходные данные Yi и найденные инструментом «Регрессия» остатки (таблица «Вывод остатка» для модели (6)). Рассчитаем относительные погрешности и найдем среднее значение . ВЫВОД ОСТАТКА
По столбцу относительных погрешностей найдем среднее значение =22.51% (с помощью функции СРЗНАЧ). Сравнение показывает, что 22.51%>7%. Следовательно, точность модели неудовлетворительная. С помощью F – критерия Фишера проверим значимость модели в целом. Для этого выпишем из итогов применения инструмента «Регрессия» (таблица «дисперсионный анализ» для модели (6)) F= 39,6702. С помощью функции FРАСПОБР найдем значение Fкр=3.252 для уровня значимости α = 5%, и чисел степеней свободы k1 = 2, k2 = 37. F>Fкр, следовательно, уравнение модели (6) является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модель (6) факторными переменными Х 1, Х 2. и Х 4. Дополнительно с помощью t–критерия Стьюдента проверим значимость отдельных коэффициентов модели. t –статистики для коэффициентов уравнения регрессии приведены в итогах инструмента «Регрессия». Получены следующие значения для выбранной модели (6) :
Критическое значение tкр найдено для уровня значимости α=5% и числа степеней свободы k=40–2–1=37. tкр=2.026 (функция СТЬЮДРАСПОБР).
Для свободного коэффициента α=–5.643 определена статистика , <tкр, следовательно, свободный коэффициент не является значимым, его можно исключить из модели. Для коэффициента регрессии β1=6.859 определена статистика , <tкр, следовательно, коэффициент регрессии β1 не является значимым, его и фактор города области можно удалить из модели. Для коэффициента регрессии β2=-1,985 определена статистика , <tкр, следовательно, коэффициент регрессии β2 не является значимым, его и фактор числа комнат в квартире можно исключить из модели. Для коэффициента регрессии β4=2.591 определена статистика , >tкр, следовательно, коэффициент регрессии β4 является значимым, его и фактор жилой площади квартиры можно сохранить в модели. Выводы о значимости коэффициентов модели сделаны на уровне значимости α=5%. Рассматривая столбец «P-значение», отметим, что свободный коэффициент α можно считать значимым на уровне 0.64 = 64%; коэффициент регрессии β1 – на уровне 0,46 = 46%; коэффициент регрессии β2 – на уровне 0,8 = 80%; а коэффициент регрессии β4 – на уровне 2,27E-06= 2,26691790951854E-06 = 0,0000002%. При добавлении в уравнение новых факторных переменных автоматически увеличивается коэффициент детерминации R2 и уменьшается средняя ошибка аппроксимации, хотя при этом не всегда улучшается качество модели. Поэтому для сравнения качества модели (3) и выбранной множественной модели (6) используем нормированные коэффициенты детерминации.
Таким образом, при добавлении в уравнение регрессии фактора «город области» Х 1 и фактора «число комнат в квартире» Х 2 качество модели ухудшилось, что говорит в пользу удаления факторов Х 1 и Х 2 из модели. Проведем дальнейшие расчеты. Средние коэффициенты эластичности в случае линейной модели определяются формулами . С помощью функции СРЗНАЧ найдем: =0.45, =2.6, =42.05, =101.24. Тогда , , Следовательно, увеличение жилой площади Х4 при том же кол-ве комнат и городе области на 1% приводит к увеличению цены квартиры в среднем на 1,076%. При изменении города области (Х1) и неизменной жилой площади и числе комнат в квартире цена квартиры увеличится в среднем на 0,03%.
При изменении числа комнат в квартире (Х2) и неизменной жилой площади и городе области цена уменьшается в среднем на 0,05%.
Бета-коэффициенты определяются по формулам: , где среднее квадратическое отклонение j – го фактора - . , С помощью функции СТАНДОТКЛОН найдем SX1= 0,504, SX2= 1,194, SX4=20.223; SY= 57,291. Тогда ; ; Таким образом, при увеличении только фактора Х1 на одно свое стандартное отклонение результат Y увеличивается в среднем на 0.06 своего стандартного отклонения SY, при увеличении только фактора Х2 на одно его стандартное отклонение – уменьшается на 0,041 SY, при увеличении только фактора Х4 на одно его стандартное отклонение – увеличивается на 0,914 SY Дельта-коэффициенты определяются формулами . Найдем коэффициенты парной корреляции с использованием инструмента «Корреляция» пакета «Анализ данных» в Excel.
Коэффициент детерминации был определен ранее и равен 0.7677. Вычислим дельта-коэффициенты: ; Поскольку Δ1<0 и Δ2<0, то факторные переменные Х1 и Х2 выбрана неудачно, и их нужно удалить из модели. Значит, по уравнению полученной линейной трехфакторной модели изменение результирующего фактора Y (цены квартиры) на 104% объясняется воздействием фактора Х4 (жилой площадью квартиры), на 4% воздействием фактора Х2 (число комнат), на 0,0859% воздействием фактора Х1 (город области).
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|