С применением показателя
среднего квадратичного отклонения (σ)
n = 1 + 3,322× lgN,
где n – количество групп,
N - численность совокупности
lgN – десятичный логарифм от N
Недостаток этого метода: дает хорошие результаты только, если совокупность состоит из большого числа единиц.
Весь диапазон изменения показателя предполагается равным.
Если величина интервала равна 0.5σ, то совокупность разбивается на 12 групп, когда 2/3 σ – на 9 групп, или σ – на 6 групп.
Недостаток этого метода:появляется вероятность «пустых» или малочисленных групп.
Расчет ширины интервала.
Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определённой группы.
Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе.
Каждый интервал имеет:
- длину (ширину) – разность между верхней и нижней границей интервала.
- верхнюю границу;
- нижнюю границу. или хотя бы одну из них
Например:
Объем оптового товарооборота за декабрь 2016г., тыс. руб.
Число предприятий
тыс. единиц
mi
% от общего
числа предприятий
wi
Менее 1
1-25
25-50 интервалы, где
50-100 первый показатель -
100-200 нижняя граница,
200-500 второй – верхняя.
Свыше 500
Итого
15,620
9,362
3,633
3,618
3,261
3,034
3,100
41,628
37,5
22,5
8,7
8,7
7,8
7,3
7,5
100,0
Итак, в данной таблице 25 -50 тыс. руб. – интервал, где 25 тыс. руб. -это нижняя граница, 50 тыс. руб. – верхняя граница интервала, 50-25= 25 тыс. руб. – ширина интервала.
Интервалы бывают:
- равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;
- неравные:прогрессивно возрастающие, прогрессивно убывающие, произвольные, специализированные
- открытые, когда имеется только одну границу (верхняя – у первого, нижняя граница – у последнего интервала);
- закрытые, когда имеются и нижняя, и верхняя границы.
Пример произвольных интервалов:
Распределение населения РФ по величине среднедушевых доходов в месяц в 2009 г.*
Группа населения по величине среднедушевых денежных доходов в месяц, руб.
Удельный вес населения, % к итогу
До 2000,0
1,0
2000,1-4000,0
1,1
4000,1-6000,0
10,3
6000,1-8000,0
11,1
8000.1- 10 000.0
10,4
10 000,1- 15 000,0
20,4
15 000,1- 25 000.0
21,8
Свыше 25 000,0
18,6
Итого
100,0
Виды
интервалов
Метод определения величины (шага) интервала
Примечание
Равные
По формуле:
где h –шаг интервала (ширина)
, -максимальное и минимальное значение признака в совокупности;
n – число групп
Округление значений:
- если до запятой 1 знак, то округляется до десятых долей (0,88 ≈ 0,9; 1,585 ≈ 1,6; 4,72 ≈4,7);
- если шаг имеет 2 цифры до запятой, то округляется до целого числа (15,985 ≈16; 14,231 ≈ 14)
- если до запятой трехзначное, четырехзначное число и более, то округляется до ближайшего числа, кратного 100 или 50
Неравные
1) Путем объединения двух или нескольких интервалов.
Этот метод применяется если:
- содержаться группы, не отражающие определенные типы изучаемого явления или процесса;
- имеются группы, не содержащие ни одной единицы совокупности («пустые»)
2) Для прогрессивно возрастающих и прогрессивно убывающихпо формулам:
-арифметической прогрессии
hi+1 = hi + a
- геометрической прогрессии
hi+1 = hi×q
где hi - величина i-го интервала
a и q – константы (постоянная величина)
i-тым интервалом считается, тот интервал, которым мы сейчас рассматриваем
Константа a в арифметической прогрессии для прогрессивно возрастающих интервалах имеет знак «+», а прогрессивно убывающих – знак «-»
Константа qв геометрической прогрессии для прогрессивно возрастающих интервалах больше «1», а прогрессивно убывающих – меньше «1».
Специализированные.
Например: Характеристика отношения мужского населения к трудовой деятельности
0 – 15 лет
нетрудоспособные
16 – 18
лица полурабочего возраста
19 – 59
лица рабочего возраста
60 – 69
лица полурабочего возраста
70 и старше
нетрудоспособные
этоинтервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку у явлений, находящихся в различных условиях, т.е. целью является отобразить качественное своеобразие групп. В этом случае в каждой группе есть особое свое содержание, и граница интервала устанавливается там, где происходит переход от одного качества к другому.
Произвольные* При изучении социально-экономических явлений на макроэкономическом уровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими (пример группировки с произвольными интервалами на стр. 23 конспекта)
Обозначение интервалов
По непрерывному признаку
По дискретному
признаку
1) Например, группировка фирм по величине прибыли, тыс. руб.:
4200 – 4400
4400 – 4600
4600 – 4800
Как видим, верхняя граница совпадает с нижней границей второго интервала, верхняя – второго, с нижней третьего, и т.д. При таком обозначении нужно определиться, как формируется верхняя граница «включительно» или «исключительно».
Если верхняя граница формируется по принципу «включительно», то фирмы с величиной прибыли 4400, 4600 тыс. руб. будут отнесены к 1,2 группе соответственно.
Если верхняя граница формируется по принципу «исключительно», то фирмы с величиной прибыли 4400, 4600 тыс. руб. будут отнесены ко 2 и 3 группе соответственно.
Дискретный - прерывистый, дробный, состоящий из отдельных частей. Такой признак всегда представляется в виде целого (недробного) числа.
Например, группировка фирм по числу персонала, чел:
100-150
151-200
201-300
Т.е. верхняя граница 2,3, и т.д. интервалов больше на 1, чем показатель границы нижнего интервала предыдущей группы.
2) Можно использовать открытые интервалы:
а) до 4400
4400 – 4600
4600 и более
Показатель 4400 тыс. руб. входит во вторую группу, а 4600 тыс. руб. – в третью.
б) до 4400
4400 – 4600
более 4600
Показатель 4400 тыс. руб. входит в первую группу, а 4600 тыс. руб. – во вторую.