Практическое занятие 10. Тема 5. Статистическое изучение взаимосвязей: корреляционный анализ
1) Методы изучения и измерения взаимосвязи. метод параллельных данных, метод аналитических группировок, балансовый метод, графический метод. 2) Расчет коэффициента парной линейной корреляции Пирсона вручную. 3) Расчет парных и множественных коэффициентов корреляции в пакетах стат.анализа. 4) Оценить корреляцию факторов, и, если корреляция значительна, подобрать вид регрессионной модели, найти ее параметры, оценить ее качество, произвести идентификацию модели, сделать прогноз для заданного значения фактора Х. Данные приведены в таблице:
Практическое занятие 11. Задание для самостоятельного выполнения:
а. Сгенерируйте 2-мерную выборку размером 30 пар чисел или возьмите на сайте Росстата реальную 2-мерную выборку такого размера (например, экономические показатели, совмещенные с социальными (например, доходы и возраст населения по 20 регионам или периодам времени и т.п.). б. Рассчитайте все известные вам статистические показатели корреляции между рядами данных. в. Проверьте значимость коэффициентов корреляции подходящими статистическими критериями на уровне значимости 0,95. г. Сделайте вывод от наличии или отсутствии корреляции, обосновывая свой вывод сделанными расчетами.
Практическое занятие 12-14. Тема 6. Регрессионный анализ и регрессионное моделирование, прогнозирование. Регрессионный анализ в RStudio, Excel.
1) Регрессия. Возьмите в качестве рядов данных 2 любые социально-экономических ряда числовых данных длиной 20-30 данных с сайта Росстата (факторы обозначьте как X и Y) (в RStudio можно воспользоваться готовыми выборками одинакового размера из пакета Mcomp, например, предварительно подключив его). 2) Проверьте графически с помощью нормальной точечной диаграммы и подсчета коэффициента линейной парной корреляции, есть ли какая-нибудь корреляция между факторами. 3) Если коэффициент корреляции меньше 0,7 по модулю, подберите другую пару рядов данных. 2) Если линейная корреляция между рядами превышает 0,7 – постройте модель регрессии одного фактора к другому (т.е. найдите параметры регрессии методом МНК ). 4) Определив параметры линейной регрессии найдите ряд расчетных Yмодельное. 5) Проверьте качество модели построением совмещенных графиков Y и Yмодельное, подсчетом коэффициента детерминации R2, дисперсии остатков. Сделайте вывод о качестве модели по результатам этого анализа. 6) Если качество модели неудовлетворительное, попробуйте построить график зависимости переменной Y от переменной X и оценить возможный нелинейной вид зависимости. Если по графику просматривается определенная нелинейная – попробуйте найти параметры нелинейной регрессии и оценить ее значимость и коэффициент детерминации. 7) Оцените значимость параметров нелинейной регрессии по Стьюденту и значимость регрессионной модели - по Фишеру. Сравните, какая из регрессионных моделей визуально и аналитически лучше описывает исходные данные. Задание для самостоятельного выполнения. Имеются следующие данные:
6373 | 3468 |
2905 |
61,9 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2010 |
5636
|
3075 |
2562 |
79,6 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2011 | 4922 | 2684 | 2238 | 111 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2012 | 4131 | 2250 | 1881 |
121,4 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2013 | 4137 | 2242 | 1895 |
108,8 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2014 | 3889 | 2123 | 1766 |
98,9 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2015 | 4264 | 2296 | 1968 |
52,4 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2016 |
4243 | 2268 | 1975 | 44 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2017(**) |
3900 |
2074,8 |
1825,2 |
54,4 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2018 |
3700 |
1964,7 |
1735,3 | 55 |
* сведения Росстат http://www.gks.ru/bgd/free/b04_03/isswww.exe/stg/d01/36.htm
** https://nangs.org/analytics/rosstat-zanyatost-i-bezrabotitsa-v-rossijskoj-federatsii
***http://newsruss.ru/doc/index.php/%D0%A6%D0%B5%D0%BD%D1%8B_%D0%BD%D0%B0_%D0%BD%D0%B5%D1%84%D1%82%D1%8C
· Проверить, есть ли корреляция между уровнем безработицы (Y) в социальной группе и полом, есть ли корреляция между среднегодовой ценой нефти марки Брент (X) и уровнем безработицы в РФ (Y).
· Построить график временного ряда, совмещенные графики, например, вида:
· Если корреляция между ценой нефти (Х) и уровнем безработицы (Y) прослеживается, построить регрессионную модель Y=F(X) зависимости уровня безработицы от среднегодовой цены нефти марки Брент за период с 2011 по 2018. Вид модели Y выбрать исходя из зависимости, с учетом способа оценки корреляции (линейной или нелинейной). Оценить значимость параметров и значимость модели. Построить совмещенную диаграмму исходных и расчетных значений Y. Сделать вывод о качестве модели и результатах моделирования.
|
|