Обоснование структуры регрессионной модели
Рассмотрим вариацию значений относительно у. Справедливо разложение где -полная вариация , относительно среднего ; -вариация относительно ,объясняемая регрессией; -вариация регрессионных остатков.
. Так как при этом число степеней свободы (число независимых слагаемых в квадратичной форме) равно сумме чисел степеней свободы слагаемых и : , то, согласно теореме Кохрана, слагаемые и независимы между собой.
Разделив левую и правую часть выражения на , получим:
Первое слагаемое в правой части полученного равенства есть оценка множественного коэффициента детерминации , так как он характеризует долю вариации у, обусловленную влиянием объясняющих переменных включенных в модель. Тогда получим: . Значение свидетельствует о максимальной прогностической силе модели, когда по значениям можно однозначно определить у, так как из условия следует, что для всех . Когда , вариация остатков равна полной вариации у и отсутствует линейная зависимость между у и переменными . Покажем, что в случае линейной зависимости между у и объясняющими переменными совпадают статистики критериев для проверки нулевых гипотез H 0: и H 0: . Преобразуем статистику для проверки гипотезы о значимости коэффициента детерминации (H 0: )
Мы получили в итоге статистику для проверки гипотезы о значимости уравнения регрессии (H 0: ). Статистика при выполнении гипотезы H 0 имеет F -распределение с числами степеней свободы числителя и знаменателя . Гипотезы H 0 отвергается с вероятностью ошибки , если будет больше критического значения , найденного по таблице F -распределения. Из этого следует, что , т. е. хотя бы один коэффициент регрессии не равен нулю.
В этом случае решается задача проверки значимости отдельных коэффициентов регрессии.
Доверительные интервалы коэффициентов линейной регрессии Пусть вектор ошибок ε имеет n -мерное нормальное распределение. В этом случае вектор Y наблюдений также имеет нормальное распределение и из взаимной некоррелированности его элементов следует их независимость. Оценка имеет нормальный закон распределения с математическим ожиданием и дисперсией , где . Откуда имеет нормированный, нормальный закон распределения. Статистика имеет распределение с (п—k—1) степенями свободы. Напомним, что случайная величина имеет распределение Стьюдента (t -распределение) с степенями свободы, если z имеет нормированное нормальное распределение , и имеет распределение с степенями свободы , причем z и u независимыми. Получаем выборочную характеристику ,
которая имеет распределение Стьюдента с (п—k—1) степенями свободы. Построим с надежностью интервальную оценку для . Теперь определим интервальную оценку в точке, определяемой вектором начальных условий, размерности (k+1): . Тогда несмещенная оценка с минимальной дисперсией значения признака в точке, определяемой условиями , равна . В самом деле, , ,
где — ковариационная матрица вектора оценок b. Найдем доверительный интервал для : , которая имеет распределение Стьюдента с (п-k-1) степенями свободы. Из условия , раскрыв неравенство, стоящее в скобках, найдем интервальную оценку для в точке, определяемой вектором с надежностью : , где определяется по таблице t -распределения Стьюдента для уровня значимости и числа степеней свободы (п-k-1). Доверительная оценка для интервала предсказания с надежностью определяется как: .
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|