Тест на мультиколлинеарность Фаррара-Глобера
Стр 1 из 3Следующая ⇒ Перечень условных обозначений, символов, терминов
n - число наблюдений тестируемой модели k - число факторов/показателей/регрессоров R^2 - коэффициент детерминации - оценка адекватности, качества подгонки модели, R^2 = 1-ESS/RSS=RSS/TSS R^2adj - нормированный коэффициент детерминации, R^2adj=1-(1-R^2)*((n-1)/(n-k-1)) alpha - уровень значимости (=0,05), вероятность совершения ошибки первого рода, вероятность отвергнуть правильную нулевую гипотезу выброс - наблюдение, которое отклоняется от выборочного среднего более, чем на 2 или 3 величины стандартного отклонения Гетероскедастичность - непостоянство дисперсии объясняемой переменной, случайных ошибок Гомоскедастичность - независимость дисперсии случайных возмущений от номера наблюденя Диаграмма рассеяния - математическая диаграмма, изображающая значения переменных в виде точек на декартовой плоскости Дисперсия - мера отклонения наблюдаемого значения переменной от ее среднего значения Тренд - основная тенденция изменения ряда Нулевая гипотеза - гипотеза, которая проверяется на согласованность с имеющимися эмпирическими данными; проверяемое предположение Альтернативная гипотеза - гипотеза, противоречащая нулевой Тест на мультиколлинеарность Фаррара-Глобера: dfFG - число степеней свободы для теста на мультиколлинеарность Фаррара-Глобера [0,5*k*(k-1)] det_R - определитель матрицы корреляции (вычисляется в Exсel при помощи функции «МОПРЕД») Ln(det_R) - натуральный логарифм определителя матрицы корреляции FGнабл - наблюдаемое значение статистики Фаррара-Глобера FGкрит - критическое значение Хи-квадрат распределения при уровне значимости alfa и со степенью свободы dfFG Тест на «Длинную-Короткую модель»:
q- отбрасываемое число факторов dfLS_1 (dfLS_2) - число степеней свободы dfLF_1=q, dfLS_2=n-k-1 ESS_R - сумма квадратов остатков короткой модели ESS_UR - сумма квадратов остатков длинной модели FLSнабл - наблюдаемое значение Фишера для теста на длинную-короткую модель (=((ESS_R-ESS_UR)/q)/(ESS_UR/(n-k-1)) FLSкрит - критическое значение Фишера для теста на "длинную-короткую" модель (0,05;dfLS_1;dfLS_2) Тест Чоу: n 1 - число наблюдений в первой подгруппе n 2 - число наблюдений во второй подгруппе dfCH_1(dfCH_2) - число степеней свободы для теста на однородность Чоу FCHнабл - наблюдаемое значение статистики Фишера для теста на однородность данных (=(ESS_R-ESS_UR)/dfCH1/(ESS_UR/dfCH2)) FCHкрит - критическое значение Фишера для теста на однородность данных (=FРАСПОБР(alfa;dfLS_1;dfLS_2)) Тесты на гетероскедастичность: . Гольдфельда-Куандта: D - число отбрасываемых наблюдений, d=n/4 nGQ - число наблюдений в каждой подгруппе ((n-d)/2) dfGQ - число степеней свободы для теста GQ [ ((n-d)/2)-k-1 ] ESS_1(ESS_2) - остаточная сумма квадратов из 1-й(2-й) подгруппы наблюдений ESS_max(min) - максимальное(минимальное) значение ESS из каждой подгруппы наблюдений GQнабл - наблюдаемое значение статистики для теста на гетероскедастичность (ESS_max/ESS_min) GQкрит - критическое значение Гольдфельда-Куандта для теста на гетероскедастичность (FРАСПОБР (alfa;dfGQ;dfGQ)) . Бреуша-Пагана: dfBP - число степеней свободы, число подозреваемых RSS_BP_2 - объясненная сумма квадратов для второй регрессии теста ВР BPнабл - наблюдаемое значение статистики для теста не гетероскедастичность Бреуша_Пагана (==RSS_BP_2/2) BPкрит - критическое значение Пирсона для теста на гетероскедастичность Бреуша-Пагана (=ХИ2ОБР(alfa; dfBP)) . Тест Уайта: Значимость-F - значимость из 2-й регрессии Уайта e(i) - «остатки» (отклонение наблюдаемого значения зависимой переменной от ее расчетного, e(i) = Y - Y^) Тест на автокорреляцию остатков: 1. Тест Дарбина-Уотсона: dL - нижняя граница наблюдения DW (берется из табл.Дарбина-Уотсона)
dU - верхняя граница наблюдения DW (берется из табл.Дарбина-Уотсона) ESS_shift - остаточная сумма квадратов из регрессии остатков от предыдущих остатков DWнабл - наблюдаемое значение статистики для теста DW, DWнабл=ESSshift/ESS
Введение
Для достоверного отображения объективно существующих в экономике процессов необходимо выявить существенные взаимосвязи между ними. Целью исследования является выявление факторов, влияющих на величину прожиточного минимума в РФ, а также установление характера взаимосвязи. В качестве факторов рассматриваются: o численность населения, тыс. чел.; o число пенсионеров, тыс.чел.; o номинальная заработная плата, руб.; o средний размер начисленных пенсий, руб.; o ВРП на душу населения, тыс.руб. o темп прироста цен на потребительские товары, %; o темп прироста цен производителей промышленных товаров, %; o темп прироста производства сельскохозяйственной продукции, %. Рассмотрена выборка по областям РФ. Использованы данные за 2010 г. Требуется подобрать модель, отражающую основные закономерности исследуемого явления с достаточной степенью статистической надежности.
Исходные данные
Исходные данные взяты с портала Федеральной службы статистики РФ Данные: результативный признак (у): y: величина прожиточного минимума, руб.; факторные признаки (х): х1: численность населения, тыс. чел.; x2: число пенсионеров, тыс.чел.; х3: номинальная заработная плата, руб.; х4: средний размер начисленных пенсий, руб.; х5: ВРП на душу населения, тыс. руб.; х6: темп прироста цен на потребительские товары, %; х7: темп прироста цен производителей промышленных товаров, %; x8: темп прироста производства сельскохозяйственной продукции, %. Данные по всем регионам РФ за 2010 год, взяты как наиболее достоверные и полные. Часть регионов была исключена из-за нарушения однородности выборки (Москва и Московская область, Санкт-Петербург). Также исключены некоторые регионы из-за неполной информации, например, Чеченская республика. После отсеивания осталось 73 региона. Требуется подобрать модель, отражающую основные закономерности исследуемого явления с достаточной степенью статистической надежности.
Тест на мультиколлинеарность Фаррара-Глобера
Проведем тест на мультиколлинеарность Фаррара-Глобера, чтобы проверить, насколько значимо определитель матрицы парных коэффициентов отличается от единицы. Необходимо стремиться получить такие данные, для которых в этом тесте наблюдаемое значение статистики превышает критическое значение не более чем в три раза. Для начала нужно построить полную квадратную матрицу корреляции. Для этого будем использовать треугольную матрицу корреляции, которую вычисляем при помощи Пакета Анализа данных (Сервис - Анализ данных - Корреляция - ОК). После этого нужно проанализировать получившуюся матрицу. Все значения в ней должны находиться в интервале [-0,70; 0,70]. В моем случае, все коэффициенты находятся в заданном интервале и являются линейно независимыми. Далее строим полную квадратную матрицу парных коэффициентов корреляции. Затем вычисляем определитель этой матрицы при помощи функции «МОПРЕД», и находим натуральный логарифм определителя матрицы с помощью функции «LN». Также, необходимо найти число степеней свободы для нахождения критической точки Хи², статистическое и критические значения. Если наблюдаемое значение превышает критическое, то нулевая гипотеза о независимости факторов отвергается, альтернативная принимается. В моем случае, FGнабл=148,97 превышает FGкрит=41,34, следовательно, нулевая гипотеза отвергается, т.е. выявлена мультиколлинеарность, и факторы линейно зависимы, но наблюдаемое значение превышает критическое примерно в три раза, т.е. избавляться от мультиколлинеарности не следует.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|