Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Графическое представление статистических рядов




Для случая, когда количественный признак является дискретной величиной, его значения хi и соответствующие им частоты ni или относительные частоты wi представляют в виде таблицы, в которой значения признака (варианты) располагаются в порядке возрастания.

, где ni - это число повторений варианта

Такие таблицы называют статистическим дискретным рядом распределения или дискретным вариационным рядом.

 

Хi Х1 Х2… Хk
wi w1 w2… wk

 

Графически статистические ряды могут быть представлены в виде полигона, гистограммы или графика накопленных частот.

Полигоном частот называют ломаную линию, отрезки которой соединяют точки (xi, ni).

Полигоном относительных частот называют ломаную линию, отрезки которой соединяют точки (xi, i)

Полигоны обычно служат для изображения выборки в случае дискретной случайной величины.

Пример. В результате измерения температуры у 12 животных получены следующие значения: 37,8; 37,8; 38; 37,7; 37,9; 37,8; 37,5; 37,7; 37,6; 38; 38,1; 37,9. Требуется построить вариационный ряд и соответствующий ему полигон.

Решение. Проанализируем исходные данные. Значение температуры

t = 37,8 у животных наблюдалось три раза; значение температур t = 37,7;

t = 37,9; t = 38 — по два раза; значение температур t = 37,5; t = 37,6; t = 38,1 — по одному разу. Исходя из этого, строим вариационный ряд:

xi 37,5 37,6 37,7 37,8 37,9   38,1
ni              

Ему соответст­вует полигон частот(рис. 9)

 

Рис. 9 Полигон частот

В случае большого количества вариантов и непрерывного распределения признака статистическое распределение признака можно задать в виде последовательности интервалов и соответствующих им частот или относительных частот. Для этого интервал, в котором заключены все наблюдаемые значения признака, разбивают на определенное количество частных интервалов (x0; x1]; (x1; x2]; …; (xk-1; xk] длиной h и находят для каждого частичного интервала сумму частот вариант .

Для графического изображения интервального ряда распределения используют гистограммы.

Гистограмма относительных частот (или просто гистограмма) - ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длинною h, а высоты равны i /h (или i). Площадь гистограммы равна единице.

f*= -плотность относительных частот.

- длина соответствующего интервала

К=1+3,32ּlg(n) - количество классов (интервалов)

Пример. У 30 коров измеряли окружность локтевого сустава. Получены следующие результаты измерений:

(26;28] (28;30] (30;32] (32;34] (34;36] (36;38]
           
0,03 0,08 0,18 0,13 0,05 0,02

 

Для нашего примера . Данному вариационному ряду будет соответствовать гистограмма (рис. 10)

 

Рис. 10 Гистограмма плотности относительных частот

Гистограмму можно рассматривать как график эмпирической (выборочной) плотности распределения fi (x). Если у теоретического распределения F существует конечная плотность, то эмпирическая плотность является некоторым приближением для теоретической. В этом и состоит практическая польза гистограммы.

Графиком накопленных частот называется фигура, строящаяся аналогично гистограмме с той разницей, что для расчета высот прямоугольников берутся не простые, а накопленные относительные частоты, т.е. . Эти величины не убывают, и таким образом график накопленных частот имеет вид ступенчатой “лестницы” (от 0 до 1).

График эмпирической функции распределения проходит через правые верхние углы прямоугольника.

График накопленных частот и эмпирическая функция распределения на практике используется для приближения теоретической функции распределения.

Пример: Дан сгруппированный ряд наблюдений

 

Требуется построить гистограмму и график накопленных частот.

Рис.11. Гистограмма относительных частот.

 

Рис.12. График накопленных частот (кумулята)

Выборочные характеристики

Средние величины

Для того, чтобы количественно охарактеризовать самые существенные свойства распределения, а также для того, чтобы можно было сравнить разные распределения, вычисляют средние показатели - выборочные числовые характеристики.

В статистике используются различные величины в зависимости от того, какие цели при анализе материала ставит исследователь. Понятием средней величины пользуемся в тех случаях, когда требуется определить средний надой по стаду, средний привес, средний прирост стада, средние клинические показатели деятельности сердца, лёгких, среднего состава крови и во многих других случаях.

Различают следующие виды средних величин: средняя арифметическая (), средняя геометрическая (), средняя квадратическая (), средняя гармоническая (), мода (М0) и медиана Ме.

Наиболее распространенным видом средних величин является средняя арифметическая, которая бывает простой и взвешенной.

Возможны следующие случаи:

1. Результаты наблюдения не сведены в вариационный ряд или все частоты равны единице или одинаковы. Тогда вычисляют простую среднюю арифметическую

,

где хi – значение признака

n – объём результатов (число наблюдений).

2. Частоты ni отличны друг от друга, то есть значения признака хi повторяются. В этом случае вычисляют среднюю арифметическую взвешенную (выборочную среднею)

3. Распределение интервальное. В этом случае вместо хi берут середину интервалов

Основные свойства среднего: 1)выборочное среднее является той точкой, сумма отклонений наблюдений от которой равна 0; 2)сумма квадратов расстояний между наблюдаемыми значениями и их средним арифметическим является минимальным.

Медиана выборки (термин был впервые введен Гальтоном, 1882)

Медиана – это значение варианта, который делит ранжированный ряд на равные по числу вариант части.

4 7 12 8 9 5 7 13 15

Ме = 12 Ме =

Свойство: сумма абсолютных расстояний между точками выборки и медианой минимальна.

Если признак Х представлен интервально:

медианному интервалу соответствует первая накопленная частота превосходящая n/2.

,

где - нижняя граница медианного интервала

– шаг разбиения, ширина класса

– накопленная частота интервала, предшествующего медианному интервалу

- абсолютная частота медианного интервала.

Модой (термин впервые введен Пирсоном,1894) называется вариант, имеющий наибольшую частоту.

Если распределение имеет несколько мод, то говорят, что оно мультимодально или многомодально (имеет два или более «пика»)

Мультимодальность распределения дает важную информацию о природе исследуемой переменной. Например, в социологических опросах, если переменная представляет собой предпочтения или отношение к чему-то, то мультимодальность может означать, что существует несколько определенно различных мнений. Мультимодальность так же служит индикатором того, что выборка не является однородной и наблюдения, возможно порождены двумя или более «наложенными» распределениями.

Класс с наибольшей частотой называется модальным.

Для определения моды интервальных рядов служит формула

,

где - нижняя граница модального интервала

– ширина класса

– абсолютная частота модального интервала

– абсолютная частота интервала, предшествующего модальному

– абсолютная частота интервала, следующего за модальным.

Пример: На основании многолетних клинических наблюдений, проводившихся в Сухумском питомнике обезьян, составлена следующая выборка, включающая 100 анализов на содержание кальция (мг %) в сыворотке крови низших обезьян (павианов-гамадрилов).В данном случае признак варьирует непрерывно в пределах от 9,0 до 14,7 мг %.

Задание: 1) составить интервальный вариационный ряд; 2) найти Мо, Ме;

3) построить график накопленных частот (кумуляту)

Решение. 1) Установим величину классового интервала:

 
 

 


Определим нижнюю границу первого класса:

Составим классовые интервалы:

 
 

 


Получилось 8 интервалов.

2) Строим вспомогательную таблицу и разносим все 100 вариаций по намеченным классовым интервалам.

 

Классы по уровню кальция в сыворотке крови, мг % Срединные значения классов Частоты   Накопленная частота  
8,6-9,4 9,0     0,02
9,4-10,2 9,8     0,08
10,2-11,0 10,6     0,23
11,0-11,8 11,4     0,46
11,8-12,6 12,2     0,71
12,6-13,4 13,0     0,88
13,4-14,2 13,8     0,95
14,2-15,0 14,6      
Сумма        

 

Модальный интервал 11,8-12,6, т.к. ему соответствует наибольшая частота n=25. По формуле для моды интервального вариационного ряда имеем

Медианному интервалу соответствует первая накопленная частота, превосходящая (50). . Следовательно, медианный интервал 11,8-12,6. По формуле для медианы интервального вариационного ряда имеем

3) График накопленных частот

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...