Выбор факторных признаков для построения регрессионной модели на основе анализа матрицы коэффициентов корреляции.
⇐ ПредыдущаяСтр 4 из 4 Для построения матрицы парной корреляции всех переменных с помощью пакета SPSS необходимо выполнить следующие действия: 1. Выбрать в верхней строке меню Анализ – Корреляция – Парные. 2. Переменные, относительно которых проверяется степень корреляционной связи, поочередно переместить в поле тестируемых переменных справа (Рис.2.1-.2.2). 3. Начать расчет путем нажатия ОК.
Рис.2.1.
Рис. 2.1 - 2.2. Построение матрицы парной корреляции в SPSS.
В результате в выходной области появиться матрица парной корреляции всех переменных (Таблица 2.1). Полученные результаты содержат: коэффициент корреляции Пирсона, вероятность ошибки, соответствующая предположению о ненулевой корреляции, и количество использованных пар значений n=16. Коэффициент корреляции R между двумя переменными указывает на силу связи между ними и принимает значения между -1 и +1. При этом, если значение находится ближе к 1, то это означает наличие сильной связи, а если ближе к 0, то слабой.
Таблица 2.1. Корреляции
.399
| .851
| .448
| .003
|
| .910
| N |
|
|
|
|
|
| Индекс потребительских расходов
| Корреляция Пирсона
| .816(**)
| .960(**)
| .273
| .235
| .031
|
| Знч.(2-сторон) |
.000
| .000
| .306
| .380
| .910
|
| N |
|
|
|
|
|
| ** Корреляция значима на уровне 0.01 (2-сторон.). Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. объем реализации имеет тесную связь с индексом потребительских расходов (ryx5= 0.816), с расходами на рекламу (ryx2 = 0.646) и со временем (ryx1 = 0.678). Однако факторы Х2 и Х5 тесно связаны между собой (rх 1x5 = 0.96), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели Х5 - индекс потребительских расходов. На основе анализа матрицы коэффициентов парной корреляции делаем вывод о целесообразности построения двухфакторного регрессионного уравнения Y=f(X2, X5). Построение линейного уравнения регрессии. По заданию необходимо было построить регрессионную модель со значимыми факторами в линейной форме. Оценка параметров регрессии осуществляется по методу наименьших квадратов. Для проведения регрессионного анализа с помощью пакета SPSS выполним следующие действия: 1. Выберем в верхней строке меню Анализ – Регрессия – Линейная. 2. Поместим переменную Y в поле для зависимых переменных, объявив переменные X1, X2, X2, X4, X5 независимыми (Рис. 2.3). 3. Используется установленный по умолчанию в поле «Метод» Исключение. 4. В полях панели Статистики следует отметить флажками Оценки, Согласие модели и критерий Дурбина-Уотсона (в нашей литературе – критерий Дарбина-Уотсона) (Рис. 2.4), затем нажмите Продолжить. 5. В полях панели Сохранить отметьте необходимые поля (Рис. 2.5) и нажмите Продолжить. 6. Не меняйте значения, установленные по умолчанию в полях панели Параметры. Они будут использованы для определения критерия Фишера с доверительной вероятностью 0,95.
7. Начните вычисления нажатием ОК.
Рис. 2.3. Диалоговое окно Линейная регрессия.
Рис. 2.4. Диалоговое окно Линейная регрессия: Статистики.
Рис.2.5. Диалоговое окно Линейная регрессия: Сохранить.
Результаты регрессионного анализа приведены в следующих таблицах.
При последовательном подборе переменных в SPSS предусмотрена автоматизация, основанная на значимости включения и исключения переменных. В табл. 2.2 перечислены переменные, которые были последовательно исключены на каждом шаге. Регрессия Таблица 2.2. Включенные/исключенные переменные
a Включены все запрошенные переменные b Зависимая переменная: Объём реализации (млн. руб.)
В табл. 2.3 приведены значения коэффициента детерминации, коэффициента множественной корреляции, стандартная ошибка, коэффициент Дарбина – Уотсона последовательно для всех моделей. В последней строке приводятся данные для окончательной модели. Таблица 2.3. Сводка для модели
a Предикторы: (константа) Индекс потребительских расходов (%), Средняя цена товара у конкурентов (руб.), Расходы на рекламу (тыс. руб.), Цена товара (руб.), Время b Предикторы: (константа) Индекс потребительских расходов (%), Средняя цена товара у конкурентов (руб.), Расходы на рекламу (тыс. руб.), Время c Предикторы: (константа) Индекс потребительских расходов (%), Расходы на рекламу (тыс. руб.), Время d Предикторы: (константа) Индекс потребительских расходов (%), Расходы на рекламу (тыс. руб.)
e Зависимая переменная: Объём реализации (млн. руб.)
В табл. 2.4 приведены результаты дисперсионного анализа и значения F-критерия, полученные на каждом шаге.
Таблица 2.4. Дисперсионный анализ(e)
a Предикторы: (константа) Индекс потребительских расходов (%), Средняя цена товара у конкурентов (руб.), Расходы на рекламу (тыс. руб.), Цена товара (руб.), Время b Предикторы: (константа) Индекс потребительских расходов (%), Средняя цена товара у конкурентов (руб.), Расходы на рекламу (тыс. руб.), Время c Предикторы: (константа) Индекс потребительских расходов (%), Расходы на рекламу (тыс. руб.), Время d Предикторы: (константа) Индекс потребительских расходов (%), Расходы на рекламу (тыс. руб.) e Зависимая переменная: Объём реализации (млн. руб.)
В табл. 2.5 в первом столбце указан номер модели, во втором – перечисляются используемые в модели независимые переменные, а в третьем столбце содержаться коэффициенты уравнения регрессии. В четвертом столбце содержаться стандартные ошибки коэффициентов уравнения регрессии, в пятом – стандартизованные коэффициенты, а в шестом – t- статистика, используемая для проверки значимости коэффициентов уравнения регрессии. Таблица 2.5. Коэффициенты(a)
a Зависимая переменная: Объём реализации (млн. руб.)
Уравнение регрессии зависимости объема реализации от затрат на рекламу и индекса потребительских расходов, полученное на последнем шаге можно записать в следующем виде: y = -1471.314 + 9.568х1 + 15.754х2
Коэффициенты уравнения регрессии показывают, что при увеличении Затрат на рекламу на одну тыс. руб. Объём реализации увеличится на 9,568 млн. руб., при увеличении Индекса потребительских расходов на один % Объём реализации увеличится на 15,754 млн. руб.
ОЦЕНКА КАЧЕСТВА МОДЕЛИ Оценка качества всего уравнения регрессии. Оценка качества уравнения регрессии производится с помощью коэффициентов детерминации R и множественной корреляции R. Их значения можно найти в табл. 2.3 Сводка для модели. Коэффициент детерминации R = 0,859 показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 86% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов. Коэффициент множественной корреляции R = 0,927 показывает тесноту связи зависимой переменной Y со всеми включенными в модель объясняющими факторами. Проверка значимости уравнения регрессии по F-критерию Фишера. Проверку значимости уравнения регрессии произведем на основе F-критерия Фишера. Значение критерия Фишера F = 39.639 можно найти в табл. 2.4 Дисперсионный анализ. Вероятность ошибки , соответствующая расчетному значению F-критерия, выводится в правой колонке под заголовком "Значимость". Ее величина свидетельствует о значимости уравнения регрессии (р < 0,001).
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|