Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Доверительные интервалы для оценки

 

Доверительные интервалы для оценки неизвестного генерального значения ` yген( m ) и индивидуального значения ` yi .

Поскольку в основном для построения регрессионных моделей используются данные выборок, то зачастую интерпретация взаимоотношений между переменными в генеральной совокупности базируется на выборочных результатах.

Как было сказано выше, регрессионное уравнение используется для прогноза значений Y по заданному значению X. В нашем примере показано, что при 600 посетителях магазина сумма выручки могла бы быть 7,661 у. е. Однако это значение – только точечная оценка истинного среднего значения. Мы знаем, что для оценки истинного значения генерального параметра возможна интервальная оценка.

Доверительный интервал для оценки неизвестного генерального значения `y ген( m ) имеет вид

 

где

 

 

Здесь ` yx предсказанное значение Y

 

( ` yx = = b 0 + b 1 y i );

Syx стандартная ошибка оценки;

п – объем выборки;

х i заданное значение X.

Легко видеть, что длина доверительного интервала зависит от нескольких факторов. Для заданного уровня значимости a увеличение вариации вокруг линии регрессии, измеряемой стандартной ошибкой оценки, увеличивает длину интервала. Увеличение объема выборки уменьшит длину интервала. Более того, ширина интервала также варьирует с различными значениями X. Когда оценивается ` yx по значениям X, близким к ` x, то интервал тем уже, чем меньше абсолютное отклонение х i от ` x (рис. 9.5).

 

 

Когда оценка осуществляется по значениям X, удаленным от среднего ` x, то длина интервала возрастает.

Рассчитаем 95%-й доверительный интервал для среднего значения выручки во всех магазинах с числом посетителей, равным 600. По данным нашего примера уравнение регрессии имеет вид

 

` yx = 2,423 + 0,00873 x:

 

и для ` x i = 600 получим ` yi; =7,661, а также

 

 

По таблице Стьюдента t 18 = 2,10.

Отсюда, используя формулы (9.31) и (9.32), рассчитаем границы искомого доверительного интервала для m yx

 

 

Итак, 7,369 £ m yx £7,953.

Следовательно, наша оценка состоит в том, что средняя дневная выручка находится между 7,369 и 7,953 у.е. для всех магазинов с 600 посетителями.

Для построения доверительного интервала для индивидуальных значений Y x, лежащих на линии регрессии, используется доверительный интервал регрессии вида

 

 

где h i,` yi , S yx, п и х i определяются, как и в формулах (9.31) и (9.32).

Определим 95% – и доверительный интервал для оценки дневных продаж отдельного магазина с 600 посетителями


 

В результате вычислений получим

 

 

Итак, 6,577 £ ` yi £ 8,745.

Следовательно, с 95%-й уверенностью можно утверждать, что ежедневная выручка отдельного магазина, который посетили 600 покупателей, находится в пределах от 6,577 до 8,745 у. е. Длина этого интервала больше чем длина интервала, полученного ранее для оценки среднего значения Y.

Доверительные интервалы для оценки истинных значений неизвестного параметра уравнения регрессии b1 и коэффициента регрессии р в генеральной совокупности.

Построим доверительный интервал для истинного значения генерального параметра b1. Для этого проверим гипотезу о равенстве нулю b1. Если гипотеза будет отклонена, то подтверждается существование линейной зависимости Y от X. Сформулируем нулевую и альтернативную гипотезы:

Н 0: b1 = 0 (линейной зависимости нет);

Н 1: b1¹ 0 (линейная зависимость есть).

Для проверки гипотезы Н 0 используется t-критерий (случайная величина t, имеющая распределение Стьюдента с п – 2 степенями свободы):

Где

 

 

Убедимся, что полученный выборочный результат является достаточным для заключения о том, что зависимость объема выручки от числа посетителей магазина статистически существенна на 5%-м уровне значимости.

 

 

Следовательно,

 

 

Найдем наблюдаемое значение критерия t


 

tкрит(a=0,05;k=18)= 2,1 (по таблице распределения Стьюдента).

Так как 13,77>2,10, то нулевая гипотеза Н 0 отвергается в пользу альтернативной гипотезы Н 1, и можно говорить о наличии существенной линейной зависимости ежедневной выручки от числа посетителей магазина.

Второй, эквивалентный первому, метод для проверки наличия или отсутствия линейной зависимости переменной Y от Х состоит в построении доверительного интервала для оценки b1 и определении того, принадлежит ли значение b1 этому интервалу. Доверительный интервал для оценки b1 получают по формуле

 

 

Найдем для нашего примера 95%‑ й. доверительный интервал для оценки b1:

 

 

Итак, 0,0074 £ b1 £ 0,01006, т.е. с 95%-й уверенностью можно считать, что истинное значение коэффициента регрессии b1 находится в промежутке между числами 0,0074 и 0,01006. Так как эти значения больше нуля, то можно сделать вывод, что существует статистически значимая линейная зависимость выручки от числа посетителей. Если бы интервал включал нулевое значение, то мы не смогли бы сделать этого вывода.

Третий метод проверки существования линейной связи между двумя переменными состоит в проверке выборочного коэффициента корреляции r.

Для этого выдвигается нулевая гипотеза Н 0: ρ =0 (нет корреляции).

Альтернативная гипотеза Н1:ρ ¹0 (корреляция существует).

Для проверки нулевой гипотезы Н 0 используем t‑критерий (случайную величину t, имеющую распределение Стьюдента с п – 2 степенями свободы) (9.11).

 

 

Наблюдаемое значение t составит

 

 

Полученный результат практически совпадает со значением, полученным по формуле (9.35). Следовательно, мы вновь подтверждаем наличие линейной связи между двумя переменными Y и X.

 


Список литературы

 

1. Апатенок Р.Ф. Математика для экономистов. М, Просвещение, 1998.

2. Красс М. Математика для экономических специальностей. Учебник. 3-е изд., перераб и доп. М, Экономист, 1999.

3. Роббинс С.В. Математика в статистике. М., Наука, 1967.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...