Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Таблица 2.8. Распределение домашних хозяйств России по числу совместно проживающих членов в 1994 году на 1 000 домашних хозяйств (Теория статистики, 2000)




Таблица 2. 8

Распределение домашних хозяйств России по числу совместно проживающих членов в 1994 году на 1 000 домашних хозяйств (Теория статистики, 2000)

Число членов домашних хозяйств, чел., xi Число домашних хозяйств (частота), mi Число домашних хозяйств (частость), wi
19, 2
26, 2
22, 6
20, 5
5 и более 11, 5
Итого: 1 000 100, 0 %

 

Для определения числа групп k, на которое можно поделить совокупность, пользуются формулой Стерджесса (Теория статистики, 2000):

k = 1 + 3, 322·lg N.                            (2. 12)

Используя формулу Стерджесса можно определить длину интервала h, если отбросить аномальные значения признака и построить ряд с равными интервалами:

.                              (2. 13)

При разбиении ряда на интервалы необходимо обращать внимание на значения их границ. Если верхняя граница одного интервала совпадает с нижней границей следующего за ним интервала, то остаётся неясным, в какой интервал попадают пограничные случаи. Пограничное значение можно включить в предыдущие группы или в последующие. Важно соблюдать принятое правило для всего разбиения. Можно также установить границы между группами таким образом, чтобы верхняя граница данного интервала несколько отличалась от нижней границы следующего за ним интервала, например: принимаем значения границ – до 3, 0; 3, 1 – 5, 0; 5, 1 – 7, 0, 7, 1 – 9, 0 и т. д.

Любой вариационный ряд можно охарактеризовать с помощью накопленных частот. Накопленная частота показывает число единиц совокупности, у которых значение варианта не больше данного. Накопленная частота для данного варианта или для верхней границы данного интервала получается суммированием (накапливанием) частот всех предшествующих интервалов, включая данный.

Если вместо абсолютных частот использовать частости, то аналогично получим накопленные частости. Ряд частостей применяют, когда совокупность очень велика. Кроме того, они позволяют сравнивать распределения по одному и тому же признаку в разных по численности совокупностях. Для приведения частостей, относящихся к интервалам разной длины, к сопоставимому виду, используют относительную плотность распределения. Вычисляют абсолютную и относительную плотности распределения.

Абсолютная плотность распределения – это частота, приходящаяся на единицу длины интервала – .

Относительная плотность распределения – это частость, приходящаяся на единицу длины интервала – .

Для характеристики распределения применяют средние величины, такие как средняя арифметическая простая, средняя арифметическая взвешенная, мода, медиана.

Среднюю  арифметическую простую определяют по формуле:

,                                      (2. 14)

где xi – текущие величины признака, n – число признаков в вариационном ряду.

Среднюю  арифметическую взвешенную определяют по формуле:

.                                                  (2. 15)

В отличие от средней арифметической, на которую оказывают влияние все значения xi, значение медианы совершенно не зависит от крайних значений признака.

Медианой называют такое значение признака, которое приходится на середину ранжированного ряда. Таким, образом, в ранжированном ряду распределения одна половина признака имеет значения признака, превышающие медиану, другая – меньше медианы.

Значение медианы Me при использовании частот на данном интервале определяют по следующей формуле:

,                                    (2. 16)

где xk– 1 – нижняя граница медианного интервала; hk – длина медианного интервала; Fk– 1 – накопленная частота интервала, предшествующего медианному; mk – частота медианного интервала.

Если вместо частот использовать частости, то значение медианы определяют по формуле:

,                                        (2. 17)

где pk– 1 – накопленная частость интервала, предшествующего медианному; wk – частость медианного интервала.

Для анализа структуры вариационного ряда используют такие значения признака, которые делят все распределение на равные группы, называемые квантилями. Квартили, квинтили, децили и процентили являются частными случаями квантилей.

Медиана делит вариационный ряд пополам: 50 % его признаков меньше медианы и 50% – больше. Таким образом, медиана является 50– м процентилем.

Квартилями называются такие значения признака, которые делят распределение на четыре равные части.

Квинтили делят распределение на пять равных частей.

Децили делят распределение на десять равных частей или, что то же самое, децили соответствуют десятые части совокупности.

Процентили делят распределение на сто равных частей. Или другими словами, процентили – это величины, делящие выборку данных на 100 групп, содержащих (по возможности) равное количество наблюдений, по 1 % наблюдений в каждой группе.

Можно еще сказать, что процентили это значения в ряду наблюдений в порядке возрастания (убывания) величин, которые делят распределение на 100 равных частей.

Квартили, квинтили, децили и процентили определяют по тем же формулам, что и медиану.

При исследовании проб на загрязнение объектов окружающей среды часто встречается необходимость определить число проб, превышающих 95 % всех исследованных проб. Для этого определяют 95– й процентиль.  

95– му процентилю – соответствует уровень загрязнения пробы, превышающий по этому показателю 95 % всех исследованных проб.

Пример 4. На некоторой территории проведено обследование вод хозяйственно– бытового назначения. В обследованных источниках обнаружено присутствие свинца. Всего взято 50 проб. ПДК для свинца в водах хозяйственно бытового назначения составляет 0, 1 мг/кг. В проведённых анализах обнаружены концентрации свинца, значения которых приведены в табл. 2. 9. Для построения вариационного ряда значения концентраций ранжированы в порядке их возрастания.

В соответствии с принятой оценкой степени напряжённости медико– экологической ситуации степень напряжённости оценивают по величине превышения концентрации вредного вещества 1– го класса опасности над ПДК в следующих значениях: до 1; 1, 1 – 2, 0; 2, 1 – 3, 0; 3, 1 – 5, 0 и более 5, 0.

Разбить вариационный ряд на интервалы в соответствии со степенью напряжённости. Определить число проб в каждой группе. Определить частость. Определить накопленные частоты и частость. Определить значение медианы. Определить значение 95– й процентили. Сделать выводы о пригодности обследованного источника для использования воды в хозяйственно-бытовых целях.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...