Тест на выбор «Длинной» или «Короткой» регрессии
Проводится для отбора наиболее существенных объясняющих переменных, т.е. для проверки оправданности исключения незначимых показателей из длинной модели. Для проведения этого теста строятся 2 регрессии: первая регрессия строится по всем наблюдениям и по всем факторам, а вторая строится также по всем наблюдениям, но с теми факторами, у которых «P-значение» не превышает значение α(0,05), т.е. значимым. Далее находятся ESS_UR и ESS_R соответственно, вычисляются наблюдаемое и критическое значения статистики Фишера, после сравнения которых, делается вывод о принятии/отклонении нулевой гипотезы о возможности использования короткой модели, т.е. о незначимости отброшенных факторов. Если наблюдаемое значение меньше критического, то нулевая гипотеза принимается, значит, нужно использовать короткую модель. Но если скорректированный коэффициент детерминации (R²adj) в длинной модели больше, чем в короткой, то данный тест нельзя считать убедительным основанием для предпочтения той или иной модели. В моем случае, FLSнабл=1,77 меньше FLSкрит=2,36 и, следовательно, принимается нулевая гипотеза, можно использовать короткую модель без ущерба для качества расчетов. Также скорректированные коэффициенты детерминации (R²adj) в обеих регрессиях примерно равны 0,86. Дальнейшие тесты проводились именно по короткой модели.
Тест Чоу на однородность данных
Данный тест проводится для установления: есть ли возможность использовать общую модель для всех данных в модели, «выигравшей» в тесте на «длинную-короткую» модель, либо необходимо использовать разные модели. Однако тест Чоу не говорит нам, в чем именно должно будет заключаться различие в двух моделях, если они должны быть.
Строится регрессия победившей в тесте «длинная-короткая» модели, определяется содержательное основание для разделения всех данных по группам. После разделения упорядочивают данные по этому основанию. Для каждой из двух полученных групп наблюдений строится регрессия, находится сумма квадратов остатков, и вычисляются наблюдаемое и критическое значения статистики Фишера. Далее эти величины сравниваются, и делается вывод о принятии/отклонении нулевой гипотезы об однородности данных, т.е. о возможности использования единой модели. Если наблюдаемое значение больше критического, то нулевая гипотеза отклоняется, альтернативная принимается, значит, данные неоднородны и необходимо использовать две разных модели. В моем случае, данные были поделены на две подгруппы: Юг, Поволжье и Центр (где развито сельское хозяйство и благоприятные климатические условия), и остальные регионы. FCHнабл=2,35 больше FCHкрит=2,06, нулевая гипотеза отклоняется, нужно использовать две разные модели. Далее необходимо установить, существует ли зависимость дисперсии случайных возмущений от какого-либо конкретного показателя - провести тест на гетероскедастичность. Среди наиболее известных тестов на гетероскедастичность являются тесты «Гольдфельда-Куандта», «Бреуша-Пагана», «Уайта». Принципиальным отличием первых двух является условие применения каждого. Так, по тесту «Гольдфельда-Куандта» определяют, зависит ли дисперсия случайных возмущений от фактора, включенного в модель, а в тесте «Бреуша-Пагана» - от не включенного показателя. Последний же тест, определяет не конкретного «подозреваемого», а наличие квадратичной форме зависимости одновременно от всех показателей, включенных в модель. Тест «Гольдфельда-Куандта»
Для выполнения теста «Гольдфельда-Куандта» берется победившая в ходе прошлых тестов модель (в моем случае - короткая), из середины таблицы удаляются d=n/2 наблюдений так, чтобы получившиеся в результате этого две матрицы (сверху и снизу) имели одинаковое число наблюдений (n-d)/2. Далее строятся регрессии для каждой подгруппы, находятся ESS_1, ESS_2 и определяется, какое из этих значений является ESS_max, а какое ESS_min. Вычисляются наблюдаемое и критическое значения статистики. Если наблюдаемое значение больше критического, нулевую гипотезу о гомоскедастичности модели отклоняют.
Подозреваемого я определил по диаграмме рассеяния короткой модели: выбрал номинальную заработную плату (Х3), т.к. точки сужались вдоль тренда, т.е. я предположил, что разброс величина прожиточного минимума зависит от номинальной средней заработной платы. В моем случае, GQнабл=2,4 больше GQкрит=2,17, т.е. нулевая гипотеза отвергается и модель гетероскедастична.
Тест «Бреуша-Пагана»
Для проведения «Бреуша-Пагана» берут победившую модель, строят ее обычную регрессию, кроме подозреваемого X3, с остатками, вычисляют квадраты этих остатков, оценку дисперсии остатков, новую зависимую переменную. Далее строится регрессия Y’^ (Z), где Z - подозреваемый показатель, который определяют по диаграмме рассеяния. Из второй регрессии «Бреуша-Пагана» вычисляется наблюдаемое и критическое значения статистики. Выводы теста делаются на основе общих правил: превышение наблюдаемого над критическим означает отклонение нулевой гипотезы о гомоскедастичности. В моем случае, BPнабл=28,47 больше BPкрит=3,84, значит, модель гетероскедастична, дисперсия случайных возмущений зависит от некоторых дополнительных переменных, не включенных ранее в регрессионную модель
Тест «Уайта»
Строят обычную регрессию с остатками, находят их квадраты и приписывают к исходной матрице. К ней же приписывают квадраты факторов и строится новая регрессия, в которой в качестве зависимой выступают квадраты остатков. Вывод делаем на основе значимости регрессии в целом. Для этого сравниваем «значимость F» с α. Если «значимость F» меньше α, то модель в целом значима. В моем случае, регрессия в целом - значима, следовательно, она - гетероскедастична и присутствует наличие квадратичной зависимости от всех факторов.
Тест «Дарбина-Уотсона»
Для выявления автокорреляции остатков первого порядка проведем тест Дарбина-Уотсона. Тест Дарбина-Уотсона непосредственно применим только к данным временных рядов, в которых все наблюдения упорядочены по времени. Поэтому в данной работе этот тест применяется в несвойственной для него ситуации и лишь условно, в учебных целях. Устанавливает лишь автокорреляцию первого порядка путем изучения остатков уравнения регрессии, в модели обязательно должен присутствовать постоянный член. Строится обычная регрессия с остатками, которые смещают вниз на единицу. По общей части остатков вычисляют их разности и квадраты разностей. Вычисляется наблюдаемое значение статистики. Критические значения определяют по таблице Дарбина-Уотсона по числу наблюдений и факторов. Выводы делают на основе того, в какой интервал критических значений попало наблюдаемое. Возможны четыре варианта ответа: вывод не определен (dL =< DWнабл < dU, 4-dU =< DWнабл < 4-dL), автокорреляция отсутствует (dU =< DWнабл < 4-dU), существует отрицательная автокорреляция (4 - dL =< DWнабл =< 4), существует положительная автокорреляция (0 =< DWнабл < dl). В моем случае, DWнабл=1,62 больше dL=1,54 и меньше dU=1,7, следовательно, вывод о наличии автокорреляции не определен. мультиколлинеарность переменный регрессия тест
Заключение
Целью исследования являлось изучение зависимости величина прожиточного минимума в РФ от численности населения, числа пенсионеров, номинальной заработной платы, средней начисленной пенсии, среднегодового прироста цен на продовольственные товары, среднегодового прироста цен производителей промышленных товаров, среднегодового прироста производства сельскохозяйственной продукции, ВРП на душу населения. Исследования показали, что основное влияние на результативный показатель оказывает номинальная заработная плата и размер средней начисленной пенсии, а также среднегодовой прирост потребительских цен. Остальные факторы вносят несущественный вклад.
Проведены следующие исследования: . Проверка мультиколлинеарности независимых переменных проводилась с помощью матрицы парных коэффициентов корреляции и теста на мультиколлинеарность Фаррара-Глобера. Исследования показали, что мультиколлениарность присутствует (факторы зависимы). . Результаты анализа показали наличие трех значимых коэффициентов Х3, Х4 и Х6. Тест на выбор регрессии показал, что короткая модель, включающая в себя только эти коэффициенты, лучше длинной. . Тест Чоу выявил факт неоднородности данных. . С помощью теста Гольдфельда-Куандта проверено зависит ли линейно дисперсия случайных возмущений от какого-то Xi, было доказано наличие гетероскедастичности. . С помощью теста Бреуша-Пагана была подтверждена зависимость дисперсии случайных возмущений от какого-либо другого дополнительного показателя, не включенного ранее в регрессионную модель. . Тест Уайта подтвердил наличие гетероскедачстичности и наличие квадратичной зависимости от всех факторов. . Для выявления автокорреляции остатков первого порядка был проведен тест Дарбина-Уотсона. Вывод о наличии автокорреляции не определен.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|