Оценка адекватности модели
Оценить качество модели в целом можно, основываясь на минимальности отклонения фактических значений результативного признака от теоретических, рассчитанных по уравнению регрессии. Величина отклонений эмпирических и расчетных значений по каждому наблюдению представляет собой ошибку аппроксимации. Их число соответствует объему совокупности. Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации, как среднюю арифметическую простую: Возможно и другое определение средней ошибки аппроксимации, как Oднако первая формула используется чаще. Верификация регрессионных моделей При подстановке в уравнение регрессии = а + bх соответствующего значения х можно определить предсказываемое (прогнозируемое) значение уp как вариант точечного прогноза уk при хр= хk. Однако точечный прогноз явно не будет отвечать реальным событиям. Поэтому его необходимо дополнить расчетом стандартной ошибки mvx и соответственно интервальной оценкой прогнозного значения: y-myx ≤ yp ≤ y+myx Для построения формулы, позволяющей определить величину стандартной ошибки mvx необходимо обратиться к уравнению регрессии: = a + bx Подставив в это уравнение выражение параметра a (), уравнение регрессии примет вид: Отсюда следует, что стандартная ошибка mvx зависит от ошибки и ошибки коэффициента регрессии b: m2 =m 2+mb2(x- )2 Из теории выборочного исследования статистических данных известно: , однако в качестве меры оценки следует использовать остаточную дисперсию на одну степень свободы 2. Соответственно получим формулу для расчета среднего значения переменной у:
Ошибка коэффициента регрессии b определяется по формуле: Считая, что предсказываемое значение фактора хр= хk, получим формулу расчета стандартной ошибки прогнозируемого значения результативного признака по уравнению регрессии: Рассмотренная формула стандартной ошибки предсказываемого значения при заданном хр = хk характеризует ошибку линии регрессии. Величина стандартной ошибки mvx достигает максимума при хр = хk = , возрастает по мере удаления хр от в любом направлении, т. е. чем больше разность хр от , тем больше ту x. Наилучшие результаты прогноза следует ожидать, если факторный признак хр находится в центре области наблюдений х, и нельзя ожидать хороших результатов прогноза при удалении хр от . Если значение хр оказывается за пределами наблюдаемых значений факторных признаков х, используемых при построении модели, то результаты прогноза ухудшаются по мере отклонения хр от области наблюдаемых значений фактора х. Графически доверительные границы для ух представляют собой гиперболы, расположенные по обе стороны от линии регрессии. Фактические значения у варьируют около среднего значения . Индивидуальные значения у отличаются от на величину случайной ошибки, дисперсия которой оценивается как остаточная дисперсия на одну степень свободы S2. Поэтому ошибка индивидуального предсказываемого значения ур должна включать не только стандартную ошибку m vx, но и случайную ошибку.
Доверительный интервал линии регрессии: а - верхняя доверительная граница уp; b- линия регрессия = a + bx; с - доверительный интервал для ур при заданных хр; d- нижняя граница для ур. Средняя ошибка прогнозируемого индивидуального значения у при хр= хk составит: Тогда с заданной вероятностью доверительный интервал для ур при заданном хр = xk составит: , где tk – критическое (табличное) значение t -критерия Стьюдента для соответствующего уровня значимости α = 1- р и числа степеней свободы (n - 2).
При прогнозировании на основе уравнения регрессии необходимо помнить, что величина прогноза зависит не только от величины стандартной ошибки индивидуального значения ур, но и от точности прогноза значения фактора х. Рассмотренная формула стандартной ошибки индивидуального значения признака myi ( xk ) может использоваться для оценки существенности различия предсказываемого значения, исходя из регрессионной модели и выдвинутой гипотезы развития событий. Для этой цели используется односторонний t-критерий Стьюдента: Полученное фактическое значение одностороннего t-критерия Стьюдента сравнивается с табличным, и если tфакт > tтабл, то предполагаемое значение значимо (существенно) отличается от прогнозируемого по модели, и наоборот.
Пример Менеджер новой чебуречной не уверен в правильности выбранной цены на чебуреки, поэтому в течение 12 недель он варьирует цену и записывает количество проданных чебуреков. Полученные данные приведены в таблице:
Постройте линейное уравнение регрессии, характеризующее зависимость продаж от изменения цены; оцените параметры модели; на основании полученной модели определите оптимальную цену единицы товара; рассчитайте возможный объем продаж исходя из рекомендуемой цены.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|