Интерпретация регрессии
Коэффициенты b 0, b 1 уравнения линейной регрессии представлены в столбце Коэффициенты. Коэффициент Y-пересечение 18,78946749 (ячейка E17) является постоянным членом уравнения b 0, а коэффициент Площадь 0,021010249 (ячейка E18) – коэффициентом регрессии b 1. Таким образом, уравнение регрессии имеет вид: . Интерпретация уравнения регрессии была приведена выше при анализе линии тренда. В таблице ВЫВОД ОСТАТКА значения столбца Предсказанное Цена (диапазон E25:E39) являются значениями функции регрессии , которые оценивают стоимость каждого объекта недвижимости. В столбце Остатки (диапазон F25:F39) указаны отклонения , определяющие разность между фактическими значениями и значениями функции регрессии (подобранными значениями). Например, первый объект имеет площадь в 521 квадратный метр. В среднем мы ожидаем, что его стоимость приблизительно равна =29,73580748 тысяч долларов ($29736), но реальная стоимость равна $26000. Отклонение для данного объекта (ячейка F25) составляет $26000 – $29736 = –$3736 тысяч долларов. Следовательно, реальная стоимость меньше ожидаемой на $3736. Для ответа на вопрос «Насколько хорошо полученная функция регрессии соответствует данным», используются четыре характеристики: стандартная ошибка, R 2, t -статистика и анализ дисперсии. Стандартную ошибку часто называют стандартной ошибкой оценки. Ее можно интерпретировать как стандартное отклонение остатков, которое показывает, какой величины ошибку в среднем вы допускаете, когда вместо фактического значения Y используете значение функции регрессии. Стандартная ошибка измеряется в тех же единицах, что и Y. В ячейке E7 указана величина стандартной ошибки, равная 3,237774407 тысяч долларов (приблизительно $3238). Это означает, что фактическая стоимость объекта недвижимости отличается от стоимости, вычисленной с помощью полученной функции регрессии, на $3238. В случае нормального распределения остатков можно ожидать, что примерно 2/3 точек данных находится на расстоянии не более $3238 выше или ниже прямой.
Если стандартная ошибка оценки является абсолютной мерой величины ошибок, то коэффициент детерминации R 2 является относительной мерой. Величина R 2 находится в пределах от 0 до 1 и часто выражается в процентах. Значение R 2 указано в ячейке E5 и составляет приблизительно 66%. Интерпретация R 2 была дана выше при анализе линии тренда. Значение Нормированный R-квадрат, приведенное в ячейке E6, используется для сравнения с другими моделями, содержащими дополнительные независимые переменные. Значения t -статистик в ячейках G17 и G18 являются частью проверок гипотез о наличии зависимости между переменными X и Y. Данные 15 объектов недвижимости рассматриваются как выборка из большей (генеральной) совокупности. Выдвигается нулевая гипотеза о том, что зависимость отсутствует, т.е. коэффициент регрессии генеральной совокупности b1 для площади (переменная Х) равен нулю, а, следовательно, изменение площади не влияет на стоимость (переменная Y). По полученным результатам коэффициент регрессии выборки b 1 имеет незначительную стандартную ошибку 0,004148397 (ячейка F18). Это означает, что b 1 и b1 мало отличаются друг от друга. Для заданного объема выборки по t -таблице распределения Стьюдента при двустороннем 95%-ом доверительном интервале (в Excel 95%-ый Уровень надежности принят по умолчанию) определяется критическое значение t -статистики (tтабл), которое показывает на сколько стандартных ошибок выборочный коэффициент регрессии b 1 может отличаться от b1=0, чтобы нулевая гипотеза оставалась истинной. В нашем случае tтабл =2,16, а значение t -статистики равно 5,064667406 (ячейка G18). Выборочный коэффициент регрессии b 1 находится на расстоянии 5,064667406 стандартных ошибок от нуля, что существенно больше, чем при tтабл (5,064667406>2,16). Следовательно, нулевая гипотеза отвергается, вычисленный коэффициент регрессии является значимым и имеется зависимость между стоимостью и площадью.
Замечание. Для многих расчетов, исходя из предположения, что выборочные данные распределены нормально, принимают tтабл =2. В ячейке H18 приведено Р -значение 0,00021678, которое является вероятностью получения результатов при выполнении нулевой гипотезы с 5%-ым уровнем значимости (для 5%-ого уровня значимости вероятность ошибки I рода, когда отвергается нулевая гипотеза, являющаяся истинной, равна 0,05). Обычно нулевую гипотезу отвергают, когда Р -значение меньше 0,05. В данном случае мы можем отвергнуть нулевую гипотезу об отсутствии связи. Таблица анализа дисперсии подытоживает проверку нулевой гипотезы. Более подробно этот анализ будет рассмотрен при построении множественной модели регрессии.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|