Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Методические указания к выполнению задания №2




Обощающие характеристики совокупностей

 

Анализ статистических совокупностей включает в себя: построение рядов распределения; графическое представление распределения; определение характеристик центра распределения, показателей вариации.

Рядами распределения называют числовые ряды, характеризующие структуру совокупности по некоторому признаку. Ряд распределения может быть получен в результате структурной группировки. Ряд распределения, образованный по количественному признаку (он называется вариационным рядом), может быть дискретным, если значения признака выражены целыми числами и каждая варианта представлена в вариационном ряде отдельной группой, или интервальным (непрерывным), если значения признака выражены вещественными числами или число вариант признака достаточно велико.

Ряд распределения состоит из следующих элементов:

xi - варианта - отдельное, возможное значение признака i =1,2,..., K, где K - число значений признака;

Ni - частоты - численность отдельных групп соответствующих значений признаков;

N - объём совокупности - общее число элементов совокупности;

qi - частость - доля отдельных групп во всей совокупности;

Di - величина интервала;

- абсолютная плотность распределения;

- относительная плотность распределения.

Полученный вариационный ряд оформляется в виде таблицы, где в первой графе указываются варианты (интервалы) значений признака, а в следующих графах частота, частость, или если необходимо абсолютная или относительная плотность распределения.

Ряд распределения по частоте (частости) в целом характеризует структуру совокупности по данному признаку. Однако для описания распределения совокупность могут использоваться и кумулятивные ряды, т.е. ряды накопленных частот (или частостей), которые иногда имеют даже некоторые преимущества.

Накопленная частота (частость) данного значения признака - это число (доля) элементов совокупности, индивидуальные значения признака которых не превышают данного.

Обозначим: F(x) - накопленная частота для данного значения x;

G(x) - накопленная частость для данного значения x.

Эти характеристики обладают следующими свойствами:

0 £ F(x) £ N; 0 £ G (x) £ 1

Рассмотрим интервалы [ xi -xi+1 ], i =1,2,..., K:

.

Первым этапом изучения вариационного ряда является его графическое изображение. Способы построения графиков для разных видов рядов распределения различны.

Изображением дискретного ряда распределения является полигон. В системе координат по оси абсцисс откладываются варианты (xi), по оси ординат - частоты (частости), затем отмечают точки с координатами (xi;Ni), которые последовательно соединяются отрезками прямой.

Интервальный ряд распределения изображается графически в виде гистограммы. При её построении на оси абсцисс откладывают интервалы ряда. Над осью абсцисс строятся прямоугольники, основанием которых является интервал, а высота - соответствующая этому интервалу абсолютная плотность распределения (или частота, частость - если ряд равноинтервальный).

Изображением ряда накопленных частот служит кумулята. Накопленные частоты наносятся в системе координат в виде ординат для границ интервалов; соединяя нанесенные точки отрезками прямых, получаем кумуляту.

Вторым этапом изучения вариационного ряда является определение характеристик центра распределения. Характеристика центра распределения представляет собой такую величину,

которая в некотором отношении характерна для данного распределения и является его центральной величиной.

К характеристикам центра распределения относятся: средняя арифметическая, медиана, мода.

Для сгруппированных данных, представленных в вариационном ряду средняя арифметическая (` x) определяется как:

,

т.е. в качестве веса при усреднении берётся частота Ni, соответствующая групповым значениям xi. Если ряд дискретный, то каждое значение признака представлено. Если же ряд интервальный, то его нужно превратить в условно дискретный: в качестве группового значения xi для каждого интервала вычисляется его середина.

Медиана (Me[ x ]) - это такое значение признака, которое делит объём совокупности пополам в том смысле, что число элементов совокупности с индивидуальными значениями признака, меньшими медианы, равна числу элементов совокупности с индивидуальными значениями больше медианы.

Численное значение медианы можно определить по ряду накопленных частот. Накопленная частота для Me[ x ] равна половине объёма совокупности (F (Me[ x ]) = N /2); имея ряд накопленных частот, можно вычислить, при каком значении признака накопленная частота равна половине объёма совокупности. Для интервального ряда в этом случае определяется только интервал в котором будет находиться Me[ x ], само значение приближённо можно определить как:

,

где x 0 - начало интервала, содержащего медиану;

DMe - величина интервала, содержащего медиану;

F (x 0) - накопленная частота на начало интервала, содержащего медиану;

N - объём совокупности;

N Me - частота того интервала, в котором расположена медиана.

Квартили (Q1, Q2, Q3) – значения признака, делящие упорядоченную по значению признака совокупность на 4 равные части. 1-ая квартиль (Q1) определяет такое значение признака, что ¼ единиц совокупности имеют значения признака меньше, чем Q1, а ¾ - значения больше чем Q1. 2-ая квартиль (Q2) равна медиане. 3-я квартиль (Q3) определяет такое значение признака, что ¾ единиц совокупности имеют значения признака меньше, чем Q3, а ¼ - больше чем Q3. Значения квартилей для сгруппированных данных определяются по накопленным частотам. При этом для 1-ой квартили накопленная частота сравнивается с величиной N·1/4; для 3-ей квартили – с величиной N·3/4. Значение квартили для интервального ряда распределения может быть уточнено по формуле:

Qi=x0+DQi (iN/4 – F(x0))/NQi.

x0- нижняя граница интервала, в котором находится i-ая квартиль;

DQi - величина интервала, содержащего i-ую квартиль;

F(x0) - сумма накопленных частот интервалов, предшествующих интервалу, в котором находится i-ая квартиль;

NQi - частота интервала, в котором находится i-ая квартиль.

Децили (D1, D2, D3, D4, D5, D6, D7, D8, D9) – значения признака, делящие упорядоченную по значению признака совокупность на 10 равных частей.

Мода (Mo[ x ]) - наиболее часто встречающееся значение признака в совокупности.

Для дискретного ряда — это то значение, которому соответствует наибольшая частота распределения. Для интервального ряда в начале определяется интервал, содержащий моду, - тот, которому соответствует наибольшая плотность распределения. Затем приближённо определяется численное значение моды.

Если ряд равноинтервальный, то используется формула:

,

где x 0 - начало интервала, содержащего моду,

DMo - величина интервала, содержащего моду,

N Mo - частота того интервала, в котором расположена мода,

N Mo-1 - частота интервала, предшествующего модальному,

N Mo+1 - частота интервала, следующего за модальным.

Средняя величина характеризует только уровень, закономерный для данной совокупности. В ряде случаев одно и то же численное значение средней может характеризовать совершенно различные совокупности. Поэтому для того чтобы судить о типичности средней для данной совокупности, её следует дополнить показателями, характеризующими вариацию (колеблемость) признака. Наиболее распространёнными из них являются дисперсия, среднее квадратичное отклонение, коэффициент вариации.

Дисперсия () - это среднее из квадратов отклонений от средней величины, для вариационного ряда она определяется по формуле:

,

Если ряд интервальный, то в качестве варианты (xi), также как при расчете средней, берётся середина интервала.

При использовании калькулятора, а также для дискретных рядов распределения более удобной может быть другая формула вычисления дисперсии:

где

Наиболее широко в статистике применяется такой показатель вариации, как среднее квадратичное отклонение (), который представляет собой квадратный корень из дисперсии.

Относительным показателем колеблемости признака в данной совокупности, является коэффициент вариации (V):

Коэффициент вариации позволяет сравнивать вариации различных признаков, а также одноименных признаков в разных совокупностях.

 

 

Контрольное задание №2

 

1. На основе равноинтервальной структурной группировки (для любого признака) построить вариационный частотный и кумулятивный ряды распределения, оформить в таблице, изобразить графически.

2. Проанализировать вариационный ряд распределения, вычислив:

· среднее арифметическое значение признака;

· медиану и моду, квартили и децили (первую и девятую) распределения;

· среднее квадратичное отклонение;

· дисперсию;

· коэффициент вариации.

3. Сделать выводы.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...