Пример 11.4.2. Проведение множественной линейной регрессии в SPSS.
Глава 11.4. Регрессия. Практикум Пример 11.4.1. Расчет простой линейной регрессии в SPSS. Рассмотрим процедуру расчета простой линейной регрессии в SPSS на материале Задачи 11.3.1 предыдущей главы. Напомним, что в этом придуманном примере были представлены данные испытуемых: рост в дециметрах и время реакции в секундах[1] (файл R_time.sav). Для расчета регрессии в меню анализа выберем пункт Анализ --- Регрессия --- Линейная (Analyze --- Regression --- Linear). В появившемся окне в поле «Зависимые переменные» (Dependent) необходимо внести зависимую переменную, в нашем случае это C_size --- рост, отсчитанный от среднего по выборке. В поле «Независимые переменные» (Independent(s)) надо внести переменную --- R_time (время реакции). После нажатия кнопки ОК в окне вывода SPSS появляются результаты регрессионного анализа. Рассмотрим их подробно. Первая интересующая нас таблица результатов --- это общая сводка построенной регрессионной модели (таблица 11.4.1) Таблица 11.4.1. Сводка для модели
В первом столбце содержится номер модели (при установке параметров регрессионного анализа в SPSS можно задавать одновременно несколько моделей). Во втором столбце приводится значение коэффициента множественной корреляции R. В данном случае, так как в модель включена всего одна независимая переменная, этот коэффициент в точности совпадает с коэффициентом корреляции Пирсона. Следующий параметр в таблице --- это коэффициент детерминации R2, характеризующий процент дисперсии исходных данных, который объясняется полученной регрессионной прямой (см. Главу 11.1). В нашем случае этот показатель равен 0.750, то есть поостренная регрессионная прямая объясняет всего 75% дисперсии.
В следующей таблице отношение сумм квадратов, объясненной регрессионной прямой, и остаточной суммы квадратов оценено по распределению Фишера, как это делалось в дисперсионном анализе. В нашей задаче регрессионной прямой соответствовала сумма 6, а остатку сумма 2. Мы находим их в соответствующих строках таблицы 11.4.2. Таблица 11.4.2. Дисперсионный анализ
Согласно результатам дисперсионного анализа, в нашим случае F-отношение оказывается недостаточно большим, и уровень значимости составляет 0.134. Это значит, что такую конфигурацию результатов мы моли бы получить случайно при отсутствии связи между ростом и временем реакции. Этот же уровень значимости мы получим, если посчитаем корреляцию между переменными по Пирсону, что также означает, что связь между переменными статистически не достоверна. Последняя таблица содержит информацию об уравнении регрессионной прямой (таблица 11.4.3). Таблица 11.4.3. Коэффициенты
В столбце, помеченном буквой B, представлены свободный член и угловой коэффициент регрессионной прямой, в столбце, помеченном «Бета», стоит коэффициент корреляции. · Для иллюстрации результатов построения регрессионной прямой построим график рассеяний двух переменных, включенных в нашу модель. При построении двухмерного графика рассеяния в SPSS можно добавить в него регрессионную прямую. Для этого надо войти в режим редактирования графика, щелкнув по нему два раза. Затем, в открывшемся окне надо щелкнуть правой кнопкой на области графика и выбрать в появившемся контекстном меню пункт «Добавить: линия аппроксимации для итога» (Add Fit Line at Total). После этого на график появится линия регрессионной прямой, а также значения коэффициента детерминации для этой прямой.
Пример 11.4.2. Проведение множественной линейной регрессии в SPSS. Рассмотрим процедуру проведения множественного регрессионного анализа в SPSS на материале смоделированных результатов следующего прикладного исследования. В торговой фирме проводилось консультативное обследование сотрудников (менеджеров по продажам). В его рамках с помощью психодиагностических методик получены данные по следующим психологическим характеристикам: уровень интеллекта, переключаемость внимания, коммуникабельность, эмоциональная стрессоустойчивость испытуемых. Кроме того, методом экспертной оценки получены значения интегрального показателя эффективности каждого из обследованных сотрудников. Данные представлены в файле effect1.sav. Первые четыре переменные в нем --- это показатели интеллекта, переключаемости внимания, коммуникабельности и стрессоустойчивости испытуемых. Последний столбец --- это среднее значение экспертной оценки эффективности их работы (все оценки выставлялись по десятибалльной шкале). Обратим внимание, что последние 7 строчек содержат данные только по психологическим показателям, эффективность труда у них не указана. Эти данные соответствуют кандидатам на должность менеджера, эффективность которых еще невозможно оценить. Однако с помощью регрессионного анализа эффективность можно попытаться спрогнозировать. Исследователи поставили перед собой следующие задачи: (1) построить регрессионную зависимость между измеренными психологическими характеристиками и эффективностью их труда; (2) на основании регрессионной модели предложить прогноз эффективности труда претендентов на работу, у которых измерены те же психологические характеристики. Рассмотрим, как можно решить эти задачи с помощью множественной линейной регрессии. Проведем процедуру регрессионного анализа в SPSS. Для этого используем тот же пункт меню анализа, что и в примере 11.4.1 --- Анализ --- Регрессия --- Линейная (Analyze --- Regression --- Linear). При этом в поле независимых переменных введем 4 показателя: уровень интеллекта, переключаемость внимания, коммуникабельность и стрессоустойчивость. В качестве зависимой переменной установим эффективность труда. Для того чтобы решить задачу прогнозирования, в окне Сохранить (Save) надо задать сохранение рассчитанных по итоговому уравнению регрессии значений зависимой переменной --- для наших целей следует выбрать нестандартизованный вид. Выбираем Предсказанные значения --- Нестандартизованные (Predicted Values --- Unstandardized). После этого, закрыв окно, нажмем ОК и рассмотрим полученные результаты.
Выведенные таблицы интерпретируются аналогично тому, как мы интерпретировали таблицы простой линейной регрессии. Показатель R, который представлял корреляцию в простой линейной регрессии, в данном случае отображает коэффициент множественной корреляции, характеризующий связь зависимой переменной с совокупностью независимых переменных в целом. Интерес представляет очень высокий показатель R2 (он равен 0.881, что означает, что наша модель позволяет объяснить 81% дисперсии). Согласно результатам дисперсионного анализа в следующей таблице полученная регрессионная модель также оценивается как очень хорошая (F(4,13)=24.106, p<0.001). Иными словами, регрессионная модель зависимости эффективности труда от четырех факторов является значимой и позволяет предсказать 81% дисперсии данных. В последней таблице мы находим нестандартизованные коэффициенты, позволяющие выписать уравнение регрессии: y=0.286*10+0.228*8+0.218*5+0.176*7+0.834. По этому уравнению вычислены предсказанные показатели эффективности труда, которые помещены в файле данных (переменная PRE1). Таким образом, основываясь на результатах регрессионного анализа мы можем, в некоторых случаях, зная значения независимых переменных, предлагать достаточно точный и разумный прогноз значений зависимой переменной и сделать выбор, кого из кандидатов следует взять на работу.
[1] Время реакции неправдоподобно велико. Такие числа были выбраны исключительно для удобства ручного счета.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|