Главная | Обратная связь | Поможем написать вашу работу!

Ряд распределения регионов по среднегодовой численности занятого населения и его характеристика. Проверка гипотезы о законе распределения регионов по среднегодовой численности занятого населения.

Ряд распределения – простейшая группировка, представляющая собой распределение численности единиц совокупности по какому-либо признаку. Он характеризует состав (структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности. [14]

Составим вариационный интервальный ряд распределения (когда признак х – принимает значение интервала (от… до…)) регионов по среднегодовой численности занятого населения, данные которого занесем в таблицу 2.3.1.

На первом этапе анализа трудовых ресурсов в какой-либо совокупности необходимо получить представление о ее вариации, изменчивости, а затем установить причины изменения и степени влияния факторов. Вариация, представляющая собой различие индивидуальных значений единиц совокупности, есть необходимое условие существования и развития массовых явлений. В жизни общества, как и в природе, каждой массовой совокупности, массовому процессу присуща некоторая специфическая мера вариации ее элементов, при которой данный процесс протекает оптимально.

Для изучения вариации трудовых ресурсов используют ряд приемов: построение рядов распределения, расчет обобщающих показателей вариации, графическое изображение уровней, расчет показателей динамики и сравнения.

Ранжированный и интервальный ряды распределения строят для совокупности рассредоточенных в пространстве, сосуществующих в данный момент или период времени единиц. Ряд распределения показывает распределение единиц совокупности по какому-либо признаку в пространстве. Ряд распределения состоит из двух элементов (х – значения признака, f – частоты, веса).

Определим шаг интервала: ,

где n нашли по формуле Стерджесса: n = 1+3,3221lg N = 1+3,3221lg79 ≈ 5;

чел. - размах вариации, показывающий границы, в пределах которых изменяется среднегодовая численность занятого населения по регионам в Российской Федерации.

Но поскольку в последних двух группах локальные частоты слишком малы (f ₄ = 1 и f ₅= 2), то их следует объединить, тогда получится 4 группы регионов.

Таблица 2.3.1

Исходные данные распределения регионов России

по среднегодовой численности занятого населения

Группы регионов по среднегодовой численности занятого населения, чел., х	Число регионов в группе,			Кумулятивные частоты
65510-499874	11	282692	3109612	11	-425314,75	180892636568	1989819002248
499874-934238	7	717056	5019392	18	9049,25	81888926	573222482
934238-1368602	3	1151420	3454260	21	443413,25	196615310276	589845930828
1368602-2237330	3	1802966	5408898	24	1094959,25	1198935759161	3596807277483
Итого по группам	24	708006,75	16992162	-	-	1576525594931	6177045433041

По данным таблицы 2.3.1 видно, что в России наибольший удельный вес занимают регионы с небольшой среднегодовой численностью занятого населения (65510-499874 чел.). Таких регионов 11 из 24. Самой высокой численностью занятого населения отличается Краснодарский край – 2237330 чел.

Используя исходные данные таблицы 2.3.1, дадим оценку распределения регионов по средней величине численности занятого населения, используя структурные средние. Данные средней величины позволяют устранить влияние аномальных значений показателя.

Определим показатель центра распределения: чел.

Т.е. среднее значение численности занятого населения составляет 708007 чел.

Найдем единицы совокупности, которые расположены в медианном, квартельном и децильном интервалах:

Мода - это то, что чаще всего мы наблюдаем, т.е. это значение признака, которое чаще всего встречается у единиц совокупности, частота встреч определяется по величине f.

Для дискретных рядов мода – это вариант с наибольшей частотой, для интервальных рядов распределения мода рассчитывается по следующей формуле:

чел.

где М₀ – мода; х₀– начало (нижняя граница) модального интервала (с наибольшей численностью);

h – величина модального интервала;

f ₁ – частота интервала, предшествующего модальному;

f ₂ – частота модального интервала;

f ₃ – частота интервала, следующего за модальным.

Значит, в нашей совокупности регионов наиболее часто встречаются регионы, имеющие среднегодовую численность занятого населения 384044 чел.

Графическое определение моды показано на рисунке 1.

Величина моды и медианы, как правило, отличается от величины средней, совпадая с ней только в случае симметрии вариационного ряда. Мода и медиана по-разному характеризуют совокупность. Мода определяет непосредственно размер признака, свойственный хотя и значительной части, но все же не всей совокупности. Мода по своему обобщающему значению менее точна по сравнению со средней арифметической, характеризующей совокупность в целом с учетом всех без исключения элементов совокупности.

Медианойявляется значение элемента, который больше или равен и одновременно меньше или равен половине остальных элементов ряда распределения. Медиана делит ряд на две равные части. Она не зависит ни от амплитуды колебаний ряда, ни от распределения частот в пределах двух равных частей ряда, поэтому ее применение позволяет получить более точные результаты, чем при использовании других форм средних. Медиану определяют по формуле:

чел.

Таким образом, 50 % регионов страны имеют среднегодовую численность занятого населения менее 561926 человек и, соответственно, остальные 50 % - более 561926 человек.

На четыре равные части изучаемую совокупность делит квартель, который находится по формуле:

чел.

Отсюда следует, что 25 % регионов страны имеют менее 302436 человек и 25 % - более 776288 человек. Более точные данные можно получить с помощью дециля:

чел.

Полученные результаты показывают, что среднегодовая численность занятого населения в 10 % регионов России составляет менее 160280 человек, другие 10 % - более 1542347 человек.

0 65510 499874 934238 1368602 2237330 х

Рис. 1. Гистограмма локальных частот

чел. - квартельный размах, который показывает, что изменение среднегодовой численности занятого населения по регионам, находящимся в центре изучаемой совокупности, варьирует в пределах 473852 человек.

Для оценки вариации у совокупности единиц в целом рассчитывают среднее линейное отклонение и дисперсию (средний квадрат отклонений численности занятого населения от ее средней величины): [14]

Для удобства описания данных рассчитывают среднеквадратическое отклонение:

чел.

То есть по Российской Федерации численность занятого населения по регионам варьирует в среднем на ± 507323 человека от среднего уровня (708007 чел.). Тогда коэффициент вариации составит:

или 71,66 %, что говорит о сильном варьировании численности занятого населения по регионам страны.

Проверим гипотезу о законе распределения регионов России по среднегодовой численности занятого населения. Для этого на основании построенной гистограммы локальных частот (рис. 1) выдвинем основную (нулевую) гипотезу: Н₀: Х в генеральной совокупности (т.е. по всей России) имеет показательное распределение.

Соответственно, альтернативная ей гипотеза:

Н₁: Х в генеральной совокупности не имеет показательного закона распределения.

Х - распределение регионов по среднегодовой численности занятого населения, чел.

Для удобства расчетов теоретических частот и наблюдаемого значения статистического критерия χ² вычисления будем проводить в таблице 2.3.2.

Таблица 2.3.2

Исходные данные для проверки гипотезы о законе распределения регионов России по среднегодовой численности занятого населения

Интервал х_i – x_i+1	Число регионов в группе,		p_i	n_i' = f· p_i
65510-499874	11	282692	0,4179	10,0296	0,9417	0,0939
499874-934238	7	717056	0,2263	5,4312	2,4611	0,4531
934238-1368602	3	1151420	0,1226	2,9424	0,0033	0,0011
1368602-2237330	3	1802966	0,1023	2,4552	0,2968	0,1209
Итого	24	708006,75	-	-	-	0,6690

Найдем оценку параметра предполагаемого показательного распределения:

Вычислим вероятности попадания в каждый из интервалов:

Найдем теоретические частоты: n_i ' = f · p_i =24· p_i

n ₁ ' =24·0,4179 = 10,0296 n ₃ ' =24·0,1226 = 2,9424

n ₂ ' =24·0,2263 = 5,4312 n ₄ ' =24·0,1023 = 2,4552

После проведения сравнения теоретических и локальных частот вычисляем:

(α=0,05; k = S - r -1=3-1-1=1) = 3,8 (по таблице критических точек распределения χ², которая приведена в приложении 8), где r = 1, т.к. показательный закон распределения имеет 1 параметр (λ).

S = 3 (число групп выборки), т.к. малочисленные частоты (f < 5) объединили.

Ищут всегда правостороннюю критическую область (рис. 2).

Рис. 2. Нахождение критического значения статистики

критической области Þ нет оснований отвергать гипотезу Н₀. Т.е. регионы по среднегодовой численности занятого населения в России имеют показательное распределение:

Дисперсионный анализ.

Для оценки достоверности различий между тремя и более средними величинами целесообразно применить дисперсионный анализ. Модель дисперсионного анализа, используемая в работе - двухфакторный дисперсионный анализ со смешанным эффектом факторов и случайным распределением единиц неравной численности в группах. Данный метод позволяет оценить влияние группировочного признака (фактора) на изменение результативного признака.

Дисперсионный анализ, проводимый по критерию F Фишера, основан на законе сложения (разложения) дисперсий. Согласно этому закону общая дисперсия по всей совокупности единиц наблюдения при их группировке раскладывается на систематическую (межгрупповую) и остаточную (случайную) дисперсии. [17, c.130]

В разделе 2.2 построена комбинационная группировка по численности экономически активного населения, численности мужчин в трудоспособном возрасте и ВРП на душу населения по регионам России. На основе полученной группировки построим двухфакторную комбинационную группировку с целью оценки влияния факторов на занятость населения. Результаты группировки представлены в таблице 2.4.1.

Особенностями данной задачи являются: разный эффект факторов, положенных в основание группировки, разная численность групп. Первый фактор относится к факторам постоянного эффекта, поэтому фактическое значение критерия F определяется как отношение вариации по фактору к остаточной дисперсии, в то время как по второму фактору со случайным эффектом расчет фактического значения критерия проводим как отношение дисперсии по этому фактору к дисперсии взаимодействия факторов. Разная численность единиц в группах и подгруппах нарушает равенство между общей суммой квадратов отклонений и составляющими ее компонентами, поэтому расчет объемов вариаций имеет специфику. Рассмотрим последовательность работ поэтапно. В соответствии с общей схемой проверки статистических гипотез сначала следует выдвинуть нулевую и альтернативную гипотезы.

Нулевая гипотеза: между средними величинами в генеральных совокупностях нет достоверных различий, следовательно, факторы не оказывают существенного влияния на занятость населения: .

Альтернативная гипотеза: между средними величинами в генеральных совокупностях есть достоверные различия, следовательно, факторы оказывают существенное влияние на занятость населения: .

Таким образом, проверка гипотезы о равенстве групповых средних сводится к проверке различий найденных дисперсий. Поэтому этот метод называют дисперсионным анализом.

Определим фактическое значение критерия F - распределения.

Факторы и способы формирования выборок определили тип модели. В соответствии со схемой при этом типе модели общий объем вариации может быть представлен как сумма:

W _общ = W _{факт А} + W _{факт В} + W _{факт АВ} + W _ост.

Расчет объемов вариаций проводим в два этапа:

- на первом этапе обеспечим разложение W ₀ = W _факт + W _ост,

- на втором этапе – разложение W _факт = W _ВРП + W _эк.акт. + W _взаим.

Рассчитаем объемы вариаций, предусмотренные первым этапом разложения:

W _ост = W _общ - W _факт = 0,1614 – 0,1179 = 0,0435.

Рассчитаем объем вариаций, предусмотренные вторым этапом разложения, предварительно представив данные по отдельным факторам в таблице шахматной формы (табл. 2.4.2).

Таблица 2.4.2

Зависимость среднегодовой численности занятого населения от численности экономически активного населения и ВРП на душу населения

Группы регионов по уровню численности экономически активного населения в общей численности постоянного населения	Подгруппы регионов по ВРП на душу населения, руб.			Средняя
	29903,7-203345,07	203345,07-376786,44	376786,44-550227,81	Средняя
1	0,2136	0,0000	0,0000	0,2136
2	0,4498	0,0000	0,0000	0,4498
3	0,4700	0,4981	0,5623	0,4795
В среднем	0,4515	0,4981	0,5623	0,4579

Средние величины, отражая зависимость от внесения минеральных удобрений и качества почвы, испытывают также влияние неравномерности распределения единиц в группах. На средние по группам (подгруппам) оказывает влияние распределение единиц по этому фактору. Чтобы устранить это влияние, представим данные по группам (подгруппам) как единичные наблюдения и рассчитаем по ним средние простые (табл. 2.4.3).

Таблица 2.4.3

(средние простые)

Группы регионов по уровню численности экономически активного населения в общей численности постоянного населения	Подгруппы регионов по ВРП на душу населения, руб.				Средняя
	29903,7-203345,07	203345,07-376786,44	376786,44-550227,81		Средняя
1	0,2136	0,0000	0,0000	0,2136	0,0712
2	0,4498	0,0000	0,0000	0,4498	0,149933
3	0,4700	0,4981	0,5623	1,5304	0,510133
	1,1334	0,4981	0,5623	2,1938	-
В среднем	0,3778	0,166033	0,187433	-	0,243756

Сопоставление таблиц 2.4.2 и 2.4.3 показывает, что данные в них различны. В таблице 2.4.2 исключено влияние неравномерности распределения и отражено влияние первого и второго факторов, а также их возможного взаимодействия. Общая сумма квадратов, отклонений урожайности, связанная с группировочным признаками, равна:

W _факт = W _эк.акт. + W _ВРП + W _взаим.

Полученные сумы квадратов отклонений первого этапа, а главное W _ост, непосредственно несопоставимы с суммами квадратов отклонений второго этапа расчетов.

Для обеспечения сопоставимости следует вычислить W _ост, скорректированную на среднюю численность единиц в группах. Средняя численность определяется по формуле средней гармонической:

Разделив W _ост на среднюю численность, получаем скорректированную остаточную вариацию, которую следует использовать для анализа дисперсий: 0,0435: 4,5315 = 0,0096.

Определим для каждого объема вариации число степеней свободы:

v₀= n - 1 = 24 – 1 = 23,v_ВРП= 3 – 1 = 2,

v_ф= mk - 1 = 3·3 - 1 = 8,v_эк.акт. = 3 – 1 = 2,

v_взаим= v₀- v_ф = 23 – 8 = 15.

Определим дисперсии:

Фактическое значение критерия F -распределения по фактору А (численность экономически активного населения) равно:

Фактическое значение критерия F -распределения по фактору В (ВРП на душу населения) составит:

Фактическое значение критерия F -распределения по взаимодействию факторов А и В будет равно:

F _табл найдем по таблице Фишера – Снедекора (приложение 9). Данные запишем в таблицу 2.4.4.

Таблица 2.4.4

Анализ дисперсий

Источник вариации	Объем вариации W_i	Число степеней свободы v_i	Дисперсия	Отношение дисперсий
Источник вариации	Объем вариации W_i	Число степеней свободы v_i	Дисперсия	F _факт	F _табл
Численность экономически активного населения	0,3286	2	0,1643	3,79	3,68
ВРП на душу населения	0,0815	2	0,0408	15,27	3,68
Взаимодействие факторов	0,0882	4	0,0221	2,05	3,06
Остаточная вариация	0,0435	15	0,0108	1	х
Итого:	0,5418	23	х	х	х

Из данной таблицы видно, что F _{факт (эк.акт.)} > F _табл, F _{факт (ВРП)} > F _табл, следовательно, есть основания отвергнуть нулевую гипотезу, т.е. с вероятностью 95 % можно утверждать, что численность экономически активного населения и ВРП на душу населения оказывают существенно влияние на занятость населения. Влияние же взаимодействия двух факторов не доказано.

1 234 5

Воспользуйтесь поиском по сайту: