2.2 Дисперсионный анализ линейной функции регрессии
2. 2 Дисперсионный анализ линейной функции регрессии Центральное место в дисперсионном анализе занимает разложение общей суммы квадратов отклонения результирующего показателя y от его среднего значения на две части, а именно на объясненную (факторную) и остаточную: , (*) где – общая сумма квадратов отклонений; – объясненная (факторная) сумма квадратов; – остаточная сумма квадратов.
Результаты расчетов сведены в табл. 2. 1.
Таблица 2. 1
На основании выполненных расчетов имеем: 277, 469 = 261, 087 + 16, 382. Следовательно равенство (*) выполняется. Если коэффициент b изменить в 1, 1 раза, то измененное уравнение линейной регрессии будет иметь вид: ŷ x = 4, 5978 + 1, 47323 · x и приведенное выше соотношение (*) выполняться не будет, что следует из расчетов (табл. 2. 2).
Таблица 2. 2
Из таблицы следует: 277, 469 ≠ 390, 633+93, 697, т. е. . На Рис. 2. 1 результаты дисперсионного анализа для линейной функции регрессии представлены графически.
Рис. 2. 1
В результате проделанной работы, были освоены навыки математического соотношения характеристик дисперсионного анализа линейной функции регрессии. Было доказано, что оценка общей дисперсии 𝑆 𝑦 общ 2 состоит из оценки дисперсии объясненной 𝑆 𝑦 объясн 2 и оценки дисперсии остатков 𝑆 𝑦 остат 2. На основании выполненных расчетов мы получили равенство: 277, 469 = 261, 087 + 16, 382. При изменении коэффициента 𝑏 в 1. 1 раза, то измененное уравнение линейной регрессии будет иметь вид: Ŷ ᵪ = 4, 5978 + 1, 47323 · x, и приведенное выше соотношение выполняться не будет.
2. 3 Оценка тесноты связи экспорт и импорта с помощью показателей корреляции и детерминации
Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy. Существуют различные формы записи линейного коэффициента корреляции. Наиболее часто встречаются следующие: rxy = b (Sx / Sy) = Mxy /(Sx / Sy) = ( – )/ SxSy. Как известно, линейный коэффициент корреляции находится в пределах –1 ≤ rxy ≤ 1. Если коэффициент регрессии b > 0, то 0 ≤ rxy ≤ 1, и наоборот, при b < 0 –1 ≤ rxy ≤ 0. Используя первое выражение для rxy, рассчитаем линейный коэффициент парной корреляции: rxy = b (Sx/Sy) =1, 3393 (3, 4828/4, 8086) = 0, 970.
Значение коэффициента корреляции показывает, что связь прямая, то есть с увеличением импорта, экспорт увеличивается. Для оценки качества подбора линейной функции необходимо определить квадрат линейного коэффициента rxy2, который называется коэффициентом детерминации линейной функции регрессии. Он характеризует долю дисперсии (разброса) цен на жилье на первичном рынке ŷ x, объясняемую зависимостью от себестоимости строительства x, в общей дисперсии, возникающей за счет влияния множества факторов, не учтенных функцией регрессии. Соответственно величина 1 – rxy2 характеризует долю дисперсии экспорта y, вызванную влиянием остальных не учтенных в математической модели факторов. Определим коэффициент детерминации: ryx2 = ( 0, 970 )2 = 0, 941. Следовательно, изменение экспорта на 94, 1% объясняется изменением импорта.
2. 4 Оценка ошибки аппроксимации уравнений регрессии Из графиков и приведенных в таблицах расчетных данных следует, что фактическое значение экспорта y отличается от теоретического значения ŷ x, рассчитанных по одному из уравнений регрессии. Очевидно, чем меньше это отличие, тем ближе опытные данные к теоретическим значениям и тем лучше качество модели. Величина, представляющая собой разность опытного и теоретического результативного признака (y – ŷ x ) для каждого опыта представляет собой ошибку аппроксимации функции, связывающей экспорт и импорт. В данном случае число таких опытов равно двенадцати. Для оценки каждого опыта используются не сами разности, а абсолютные значения разностей опытного и теоретического результативных признаков, отнесенные к опытному признаку и выраженные в процентах, то есть:
Аi = | (yi – ŷ xi) / yi |100%. Таблица 4. 1
Оценка качества всей функции регрессии может быть осуществлена как средняя ошибка аппроксимации – средняя арифметическая Аi: А = (А1 + А2 + … + А12 ) / 12. Найдем величину средней ошибки аппроксимации линейной функции связи между ценами на жилье на первичном рынке и себестоимостью строительства: А = 40, 189 · 100% / 12 = 3, 349 %. Аналогично получим среднюю ошибку аппроксимации для степенной: А = 42, 511/12 = 3, 543% и для показательной функции: А = 30, 326/12 = 2, 572%. Их анализ показывает, что ошибка аппроксимации находится в допустимых для практического использования пределах, однако с теоретической точки зрения может быть продолжен поиск более качественной функции регрессии. Ниже приводятся графики ошибки аппроксимации линейной, степенной и показательной регрессий.
Рис. 4. 1
Рис. 4. 2
Рис. 4. 3
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|