Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Простейшая линейная модель регрессии




 

Оценивание параметров регрессии

Пусть на основании анализа исследуемого явления предполагается, что в среднем у есть линейная функция от х, т. е. имеет место уравнение регрессии

где  — условное математическое ожидание случайной величины у при заданном х. Объясняющая переменная х рассматривается как неслу­чайная величина;

 и — неизвестные параметры генеральной совокупности, которые под­лежат оценке по результатам выборочных наблюдений.

Предположим, что для оценки параметров и  из двухмерной гене­ральной совокупности (х, у) взята выборка объемом и, где    результат     i -го наблюдения (i =1,2,..., п). В этом случае линейная модель регрессии имеет вид

,

где  — взаимно независимые случайные величины с нулевым математи­ческим ожиданием и дисперсией , т. е.  для всех               i =1,2,..., п и  при i = j -(условие гомоскедастичности, постоянства остаточной дисперсии;) и равными 0 при i ≠ j -(условие взаимной некоррелированности регрессионных остатков.)

Согласно методу наименьших квадратов в качестве оценок неизвест­ных параметров и , следует брать такие значения выборочных характе­ристик b0 и b1, которые минимизируют сумму квадратов отклонений зна­чений результативного признака yt от условного математического ожидания , т. е.

Так как Q дифференцируема по и , то для отыскания минимума функции найдем частные производные по и :

.

Приравняв производные нулю и подставив вместо  и   их оценки b0 и b1, получим:

Данная система уравнений называется системой нормальных уравнений. Решая систему относительно b0 и b1получим:

Перейдя к средним, будем иметь

Докажем, что в случае нормального закона распределения случайной величины , а отсюда  и , оценки метода наименьших квадратов и наибольшего правдоподобия совпадают.

Пусть из двумерной генеральной совокупности (х, у) взята независи­мая выборка , где i = 1, 2,..., п, объемом n.

Будем рассматривать у i, как независимые нормальные случайные ве­личины с математическим ожиданием , являющимся функ­цией от xi,  и постоянной дисперсией .

Тогда , где , и функция правдоподобия примет вид с учетом независимости наблюдения

Согласно методу наибольшего правдоподобия в качестве оценок пара­метров  и  возьмем значения  и , максимизирующие L. При за­данных  и постоянном  функция правдоподобия L достигнет максимума, когда показатель степени при е будет минимальным, т. е. при условии минимума функции , что совпадает с условием нахождения оценок  по методу наименьших квадратов. Таким образом, оценки  обладают свойствами оценок наи­большего правдоподобия.

Однако функция правдоподобия L зависит также и от параметра . Из условия  найдем оценку  наибольшего правдоподобия параметра :

Несмещенная оценка параметра  равна

Исследуем свойства  и .

 

 

Определение интервальной оценки для Р0

Будем рассматривать модель регрессионного анализа

 или ,

где — центрированные величины, удовлетворяющие усло­вию

.

Тогда оценки  и  метода наименьших квадратов равны

 

Но

 

Откуда  получим:

 

Величина  есть линейная функция нормальных случайных величин . Следовательно, она также имеет нормальный закон распределения с математическим ожиданием

так как по условию , и дисперсией

Здесь учитывалось, что , взаимонезависимые случайные величины с дисперсией для всех i = 1, 2,…,п.

Подставляя вместо  несмещенную оценку , получим оценку дисперсии , для , .

Таким образом,  есть случайная величина, имеющая нормальный за­кон распределения .

Отсюда следует, что величина

имеет нормированный нормальный закон распределения.

С другой стороны, статистика

имеет - распределение с  степенями свободы, так как уравнение регрессии определяется двумя параметрами  и , которые подлежат оце­ниванию.

Отсюда следует, что статистика

имеет t -распределение Стьюдента с  степенями свободы.

С помощью статистики t построим с доверительной вероятностью   интервальную оценку для из условия

Откуда получим:

 

или, учитывая, что , будем иметь: , где определяется по таблице распределения Стьюдента (t -распределение) для уровней значимости  и числа степеней свободы ().

 

Определение интервальной оценки и проверка значимости β1

Рассмотрим выражение

Решив уравнение относительно  получим:

,

откуда  будем иметь:

Это значит, что  есть линейная функция независимых нор­мально распределенных случайных величин , где . Следовательно, она также имеет нормальный закон распределения.

Определим математическое ожидание и дисперсию .

Учитывая, что математическое ожидание суммы равно сумме матема­тических ожиданий, что неслучайный множитель  можно вынести за знак математического ожидания и , получим:

Так как  есть независимые между собой случайные величины с дисперсией , а дисперсия постоянной величины равна нулю, т. е. , то

откуда получим

Мы доказали, что в  есть случайная величина, имеющая нормальный закон распределения:

Отсюда следует, что

Учитывая независимость случайных величин, получим статистику, имеющую t -распределение c () степенями свободы:

 

Интервальную оценку для  с надежностью у найдем из условия: .

 

После преобразования) получим:

 ,  ,

где  находят по таблице t -распределения при  и ;

 

 — несмещенная оценка дисперсии Db 1;

 — оценка среднего квадратического отклонения величины b 1.

Интервальную оценку с надежностью   для  найдем с помощью ста­тистики ,                                                                                         

где  находят по таблице - распределения для числа степеней свободы () и вероятностей соответственно  и .

Установление значимости простейшего линейного уравнения регрес­сии  сводится к проверке при заданном   нулевой гипотезы о значимости коэффициента регрессии  т. е. гипотезы Н0:  при альтернативной гипотезе Hl: .

С этой целью используется t -критерий, и значение статистики крите­рия  сравнивают с критическим значением , найденным по таб­лице t -распределения при заданном  и .

Гипотеза Н0:  отвергается с вероятностью ошибки  при выпол­нении неравенства  и уравнение регрессии считается значимым. В противном случае, т.е. если , гипотеза Н0:  не отвергается и уравнение регрессии считают незначимым и на этом регрес­сионный анализ заканчивается.

Для значимого уравнения регрессии представляет интерес построение интервальных оценок для коэффициента регрессии  свободного члена  и самого уравнения .

 

 

Определение интервальной оценки для условного математического ожидания

 

Пусть имеем уравнение регрессии

и его оценку

где  — оценки метода наименьших квадратов параметров уравнения .

Величина  есть линейная функция двух случайных величин  и  имеющих нормальный закон распределения. Следовательно,  также име­ет нормальный закон распределения. Определим параметры этого закона. Получим:

.

Откуда .

Для определения дисперсии  предварительно докажем независи­мость величин  и .

Так как величины  и  имеют нормальный закон распределения, то независимость этих величин следует из их некоррелированности. Следо­вательно, нам достаточно доказать, что

.

Учитывая, что х, есть неслучайная величи­на, получим:

Так как  по условию есть независимые случайные ве­личины с  , то  при  , где . Следовательно,

,

где . Учитывая, что , после подстановки окончательно получим:

.

Этот результат получен для центрированных величин , для которых выполняется условие . В этом случае  и — независимые случайные величины. Тогда согласно выражению (2.26), дисперсия величины   равна сумме дисперсий слагаемых, т.е.

.

 Получаем:

Таким образом,

Тогда нормированный нормальный закон распределения имеет величина

 

.

Откуда получим выборочную характеристику

,

которая имеет распределение Стьюдента (t -распределение) с () степенями свободы.

Тогда с надежностью   доверительный интервал для   при заданном х = х 0 равен

,

где определяется по таблице распределения Стьюдента для уровня зна­чимости  и () числа степеней свободы.

Интервальная оценка для прогнозного значения у в точке , определяется как

.

У прогнозного значения уп+1 дисперсия на  больше, чем у величины   на величину дисперсии.

По мере удаления х0 от среднего значения () ширина доверительного интервала увеличивается, а точность оценки  снижается. Доверительный интервал имеет наименьшую величину, когда , т. е. наблюдаемое значение признака равно . Расположение дове­рительного интервала для , найденного с надежностью , иллюстрирует рис. 2.1.

 

Рис. 2.1. Расположение доверительных границ в случае линейной регрессии

 

2.1.2. Применение методов многофакторного регрессионного анализа в задачах строительства

 

Методы многофакторного регрессионного анализа находят широкое применение  в задачах строительства. Так регрессионный анализ позволяет установить соответствие между ценой объекта недвижимости с учётом влияющих на её цену факторов, при организации строительного производства - учесть влияние внутренних и внешних факторов, влияющих на эффективность производственной деятельности, при принятии управленческих решений -провести сравнение различных технологий и принять оптимальное решение.

Рассмотрим общий случай линейной зависимости, когда результатив­ный показатель у с точностью до случайной составляющей ε есть линей­ная функция от k объясняющих переменных х12,…,хk.

Пусть из (k + 1)-мерной генеральной совокупности (у, х1, х2,…,хk) взя­та случайная выборка объемом и пусть i-е наблюдение имеет вид (yii1i2,..,xik), где i = 1,2,…,п.

Под КЛММР будем понимать регрессионную модель вида , для всех i =1,2,..., п, где — неизвестные параметры модели, подлежащие оценива­нию по выборке, есть неслучайные величины, как параметры генеральной совокупности.

Объясняющие переменные и регрессионные остатки модели удовле­творяют требованиям:

а) объясняющие переменные х12,…,хk рассматриваются как неслучайные величины, т. е. предполагается, что они измерены без ошибок;

б) величины х12,…,хk не связаны между собой линейной функциональной зависимостью;

в) регрессионные остатки ε i есть взаимонезависимые случайные вели-
чины с нулевым математическим ожиданием  и дисперсией равной:  для всех i = 1,2,..., п. Отсюда следует, что коэффициент ковариации

,

где i, l =1,2,..., п;

г) при анализе свойств оценки уравнения регрессии обычно исходят
из того, что вектор  регрессионных остатков подчиняется
n -мерному нормальному закону распределения с вектором математических ожиданий  и ковариационной матрицей , т. е. , где  — единичная матрица размерности п*п.

Найдем математическое ожидание yi при заданном векторе значений объясняющих переменных .Получим:

.

Мы получили уравнение регрессии, характеризующее функциональ­ную зависимость среднего значения у от объясняющих переменных .

В этом уравнении  называют свободным членом уравнения. Обычно он содержательно не интерпретируется, так как в экономике случай, когда все объясняющие переменные  равны нулю, так как не имеет содержательного смысла. Например, в регрессионной модели производи­тельности труда о каком производстве может идти речь, если равны нулю производственные площади, число работающих и т. д.

Параметры модели  называются коэффициентами регрес­сии. Коэффициент регрессии   показывает, на какую величину в среднем изменится у, если переменную хj, увеличить на едини­цу при неизменных значениях остальных объясняющих переменных, вхо­дящих в модель. Это легко проверить, если, например, в (3.3) к хik приба­вить единицу. Будем иметь:

.

В матричной форме линейная модель имеет вид

,

где — вектор-столбец (размерности п) значений результативного показателя;

 — матрица (размерности п*(к+1)) значений объясняющих переменных;

— вектор– столбец (размерности (k +1)) неизвестных параметров, которые подлежат оцениванию по выборке;

— вектор – столбец (размерности n) случайных ошибок, регрессионных остатков.

Причем ,

                                                  

где 0 – вектор – столбец, все n значений которого равны 0, а ковариационная матрица

 

.

 

Из условия (3.2) следует, что для i = 1, 2,…, п  и при  тогда

,

где — единичная матрица размерности (n × n).

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...