Взаимосвязь показателей вариации
⇐ ПредыдущаяСтр 3 из 3 В нормальном ряду распределения между показателями вариации имеются следующие примерные соотношения: 5.3. Основные свойства дисперсии 1. Если все значения признака уменьшить или увеличить на какое-то постоянное число а, то дисперсия не изменится. 2. Если все значения признака уменьшить или увеличить в К раз, то дисперсия изменится в К 2 раз. 3. Сумма квадратов отклонений индивидуальных значений признака x от их средней
4. Дисперсия признака равна разности между средним квадратом значения признака и квадратом их средней:
Дисперсия альтернативного признака В ряде случаев возникает необходимость измерить вариацию альтернативного признака, то есть такого, который может принимать только два значения. Обозначив отсутствие интересующего нас признака через 0, его наличие через 1, долю единиц, обладающих данным признаком - через р, не обладающих — через q, дисперсию этого признака можно определить как Например, если 64% работников предприятия имеют высшее образование р, то дисперсия будет равна:
5.4. Правило сложения дисперсий На вариацию признака влияют различные причины и факторы, которые делятся на случайные и систематические. Поэтому и вариация может быть случайной, вызванной действием случайных причин и систематической, обусловленной воздействием постоянных причин и факторов. В связи с этим возникает необходимость в определении случайной систематической составляющей и её роли в общей вариации. Общую дисперсию мы уже рассматривали. Она характеризует общую вариацию признака под влиянием всех условий, всех причин, вызывающих эту вариацию и исчисляется по формуле:
Для определения влияния постоянного фактора на величину вариации пользуются аналитической группировкой. Вариация, обусловленная фактором, положенным в основание группировки, называется межгрупповой вариацией. Размеры ее определяются при помощи дисперсии групповых средних или межгрупповой дисперсии, которая характеризует колеблемость групповых или частных средних
где Таким образом, межгрупповая дисперсия (дисперсия групповых средних) равна средней арифметической из квадратов отклонений частных средних от общей средней. Она характеризует систематическую вариацию, которая возникает под влиянием фактора, признака, положенного в основание группировки. Для определения влияния случайных факторов и их роли в общей вариации определяют дисперсию в пределах каждой группы, т.е. внутригрупповую дисперсию, а затем и среднюю из внутригрупповых дисперсий:
В математической статистике доказано, что общая дисперсия признака равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий. Это правило называется правилом сложения дисперсий. 5.5. Ряды распределения и их моделирование а) Моменты распределения Одной из важных задач анализов рядов распределения является выявление закономерности распределения, определение ее характера и количественного выражения. Эта задача решается при помощи показателей, характеризующих форму, тип распределения. Кроме рассмотренных выше важной характеристикой рядов распределения являются моменты распределения. Моментом распределения (М к) называется средняя арифметическая из отклонений значений признака x от некоторой постоянной величины а в степени к:
Величина к определяет порядок момента. В зависимости от величины а различают начальные, центральные и условные моменты (табл. 5.2).
Таблица 5.2 Значение моментов распределения
Условные моменты используются для определения дисперсий высоких степеней. Практически используются моменты первых четырех порядков. Если в качестве весов взять не частоты, а вероятности, то получим теоретические моменты распределения. б) Кривые распределения Для обобщенной характеристики особенностей формы распределения применяются кривые распределения, которые выражают закономерность распределения единиц совокупности по величине варьирующего признака. Эмпирическая кривая - это фактическая кривая, полученная по данным наблюдения, в которой отражаются как общие, так и случайные условия, определяющие распределение (кривая 1, рис.5.3) Теоретическая кривая распределения - это кривая, выражающая функциональную связь между изменением варьирующего признака и изменением частот и характеризующая определенный тип распределения (кривая 2, рис.5.3). По форме кривые распределения бывают симметричными и асимметричными. В зависимости от того, какая ветвь кривой вытянута, различаютправостороннюю асимметрию илевостороннюю асимметрию (рис.5.1). Кривые распределения также могут иметь различную островершинность (рис.5.2). Для характеристики степени асимметрии кривой используют коэффициент асимметрии, который представляет собой отношение центрального момента третьего порядка к среднему квадратическому отклонению в кубе
Если А > 0, то асимметрия правосторонняя, а если А < 0, то асимметрия левосторонняя, в симметричном распределении - А = 0. Кроме этого коэффициента для характеристики асимметрии применяют и соотношение между
Для характеристики островершинности кривой распределения применяют коэффициент эксцесса, который равен отношению центрального момента четвертого порядка к дисперсии в квадрате
В нормальном распределении Е =3, поэтому, если Е >3, то эксцесс выше нормального (островершинная кривая), Е <3, эксцесс ниже нормального (плосковершинная кривая). в) Моделирование рядов распределения Все рассмотренные выше показатели характеризуют отдельные свойства совокупности. Общую характеристику ряда распределения можно представить аналитически, в виде функции, характеризующей зависимость между изменениями признака и частотами. Если имеется эмпирический ряд распределения, то необходимо найти функцию распределения, т. е. подобрать такую теоретическую кривую, которая наиболее полно бы раскрывала закономерность распределения. Нахождение функции кривой распределения называется моделированием. Для аппроксимации (выравнивания) эмпирических кривых распределения в статистике часто пользуются нормальным распределением, функция которого где F (x) - интегральная функция распределения; t - нормированное отклонение; e - основание натуральных логарифмов. Теоретическое распределение вероятностей и частот дает представление о форме, типе распределения, о закономерности, свойственной изучаемому явлению.
Правосторонняя Симметричная Левосторонняя Асимметрия кривая асимметрия
Рис.5.1. Типы кривых распределения (по асимметрии)
Рис. 5.2. Типы кривых распределения (по островершинности) Эмпирическое и теоретическое распределение рабочих по степени выполнения норм приведено в табл.5.3 и на рис.5.3. Таблица 5.3 Распределение рабочих по степени выполнения норм выработки
г) критерии согласия Для оценки близости эмпирического и теоретического распределения используются специальные показатели, которые называются критериями согласия. Критерии согласия как правило тем или иным способом оценивают степень расхождения между эмпирическими и теоретическими частотами.
Наиболее часто используется критерий, который называется хи-квадрат Пирсона и рассчитывается где f’ -теоретические частоты, f -эмпирические частоты. Чем меньше значение Для проверки согласия с помощью Также применяется и критерий согласия Колмогорова Вычислив фактический критерий В явлениях общественной жизни асимметричные распределения встречаются гораздо чаще, чем симметричные. Некоторые асимметричные распределения могут быть приведены к симметричному путем преобразования признака Х, например логарифмированием. В этом случае распределение называется логарифмически нормальным. Такое преобразование производится, как правило, для сильно асимметричных распределений.
Решение типовых задач Задача 1. Проверка пряжи на крепость в лаборатории дала следующие результаты (табл. 5.4): Таблица 5.4
Вычислить все показатели вариации. Решение. В задаче значения признака имеют различную численность, поэтому значения, Таблица 5.5
Средняя крепость пряжи определяется по формуле
Размах вариации
Среднее линейное отклонение вычисляется по формуле
Дисперсия, взвешенная по частоте вариантов, равна
Среднее квадратичное отклонение равно:
коэффициент вариации составляет
Задача 2. На предприятии 64% работников имеют среднее и высшее образование. Определить дисперсию доли рабочих, имеющих среднее и высшее образование. Решение. Дисперсия альтернативного признака определяется как Задача 3. Имеются следующие данные (табл.5.6): Таблица 5.6 Заработная плата рабочих по профессиям (1997 год), тыс. руб.
Вычислить: среднюю месячную заработную плату для каждой группы и для всех рабочих; групповые дисперсии; среднюю из внутригрупповых дисперсий; межгрупповую дисперсию; общую дисперсию; проверить правило сложения дисперсий и сделать выводы. Решение. В задаче требуется определить, как влияют на изменение заработной платы рабочих постоянные причины, положенные в основание группировки (в данном случае - различия в профессии), и случайные причины. Для этого необходимо определить систематическую и случайную вариации и их роль в общей вариации. Для решения задачи и вычисления заданных показателей, построим вспомогательную таблицу (табл.5.7). Таблица 5.7
Среднюю заработную плату по каждой группе и для всех рабочих определяем по формуле средней арифметической простой: Внутригрупповые дисперсии вычисляем по формуле:
Межгрупповая дисперсия определяется как:
Общая дисперсия равна: По правилу сложения дисперсий общая дисперсия равна сумме средней внутригрупповых и межгрупповой дисперсии: s2 =
Задача 4. Средняя успеваемость студентов экономического факультета Решение. В симметричном распределении Задача 5. Урожайность сахарной свеклы в сельхозпредприятиях области характеризуется следующими показателями: Решение. Асимметрия правосторонняя, так как Задача 6. Центральный момент третьего порядка Решение. Асимметрия правосторонняя, так как A>0, и незначительная Эксцесс выше нормального, потому что E>3.
РАЗДЕЛ 6. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ 6.1. Общие сведения о выборочном наблюдении В связи с тем, что статистика имеет дело с массовыми совокупностями статистические исследования весьма трудоемки. Поэтому давно возникла мысль о замене сплошного наблюдения выборочным. Выборочное наблюдение - это наиболее совершенный способ несплошного наблюдения, при котором обследуется не вся совокупность, а лишь ее часть, отобранная по определенным правилам выборки и обеспечивающая получение данных, характеризующих всю совокупность в целом. При проведении выборочного наблюдения нельзя получить абсолютно точные данные. Как при сплошном, так как при выборочном наблюдении неизбежны ошибки, которые делятся на ошибки регистрации и ошибки репрезентативности. В свою очередь, ошибки репрезентативности бывают случайные и систематические. Важнейшим условием применения выборочного метода является правильный отбор единиц совокупности, а именно: а) строго объективный отбор единиц совокупности, при котором каждая из них получала бы абсолютно одинаковую возможность попасть в выборку; б) достаточное количество отобранных единиц совокупности. При соблюдении этих условий выборка будет репрезентативной или представительной. Вся совокупность единиц, из которой производится отбор, называется генеральной совокупностью и обозначается буквой N. Часть генеральной совокупности, попавшая в выборку, называется выборочной совокупностью и обозначается n. Обобщающие показатели генеральной совокупности - средняя, дисперсная и доля - называются генеральными и соответственно обозначается Теоретической основой выборочного метода является теорема П.Л.Чебышева, которая формулируется следующим образом: с вероятностью, сколь угодно близкой к единице (достоверности), можно утверждать, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между выборочной средней и генеральной средней будет сколь угодно мала:
При практическом использовании теоремы Чебышева генеральную дисперсию
6.2. Виды и схемы отбора Формирование выборочной совокупности из генеральной может осуществляться по-разному. Различают следующие виды отбора: собственно-случайный; механический; типический; серийный; комбинированный. 5. Собственно-случайный отбор. Он ориентирован на выборку единиц из генеральной совокупности без всякого расчленения ее на части или группы. Либо применяется жеребьевка, либо используются таблицы случайных чисел. 6. Механический отбор. Он состоит в том, что отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы (группы), причем все единицы генеральной совокупности должны располагаться в определенном порядке. Размер интервала или группы равен обратной величине доли выборки (или количеству отбираемых единиц). Из каждой группы (интервала) берется только одна единица. Так, при 2%-ной выборке отбирается каждая 50-ая единица (1:0,02; или формируется 50 групп или интервалов), при 20%-ной выборке - каждая 5-я единица (1:0,2) и т. д. 7. Типический отбор. При его осуществлении вся генеральная совокупность делится на группы по типическому признаку, а затем в каждой группе проводится тот или иной отбор. Наиболее часто из каждой группы выбирается количество единиц, пропорциональное удельному весу группы в общей совокупности и как правило - механическим отбором. Такой отбор часто называют пропорциональным типическим отбором с механической выборкой. 8. Серийный отбор с равновеликими сериями состоит в выборке не отдельных единиц генеральной совокупности, а целых серий (гнезд). Попавшие в выборку серии подвергаются сплошному наблюдению. Сами серии могут формироваться различными методами и способами. 9. Комбинированный отбор. Все вышеперечисленные виды отбора комбинируются между собой. Используя различные виды отбора, можно применить и различные схемы отбора: бесповторный отбор (схема невозвращенного шара)- после выбора какой-либо единицы она обратно в генеральную совокупность не попадает и не может быть выбрана снова; повторный отбор (схема возвращенного шара) - после выбора какой-либо единицы она вновь возвращается в генеральную совокупность и может быть выбрана снова.
6.3. Определение средних и предельных ошибок при различных видах отбора Ошибка выборки Если Ошибка выборки зависит от многих факторов, и, если из одной и той же генеральной совокупности можно сформировать бесконечное множество выборочных совокупностей, каждая из них даст и свою ошибку. Поэтому при выборочном наблюдении говорят о средней из возможных ошибок ( средняя или стандартная ошибка выборки), которую обозначают как Величина
Эти формулы справедливы для повторной схемы отбора. При бесповторном отборе вводится поправочный коэффициент, равный
В тех случаях, когда выборка небольшая этим множителем можно пренебречь, так как его значение близко к единице (обычно при Для решения практических задач важна не средняя ошибка выборки, а пределы, за которые она не выйдет, т.е. говорят о предельной ошибке выборки. Предельная ошибка выборки связана со средней ошибкой соотношением Таким образом, предельная ошибка выборки зависит от трех факторов: дисперсии Таблица 6.1 Определение предельной ошибки выборки при различных видах отбора
6.4. Определение необходимой численности выборки При разработке выборочного наблюдения предполагают заранее заданными величину допустимой ошибки выборки и вероятность ответа (и t). Неизвестным, следовательно, остается тот минимальный объем выборки, который должен обеспечить требуемую точность. Из формулы Таблица 6.2 Формулы расчета численности выборки при собственно-случайном отборе
Численность выборки можно выразить через отношение Для типического и серийного отбора объем выборки определяется по специальным формулам. Решение типовых задач Задача 1. Методом случайной повторной выборки было взято для проверки на вес 200 шт. деталей. В результате был установлен средний вес детали - 30 г при среднеквадратическом отклонении равном 4 г. С вероятностью 0,954 требуется определить предел, в котором находится средний вес детали в генеральной совокупности. Решение. Предельная ошибка средней при собственно-случайном отборе (повторная выборка) определится по формуле
Нам известно, что t =2 (т.к. P =0.954);
Следовательно, с вероятностью 0,954 можно утверждать, что средний вес детали в генеральной совокупности будет находиться в пределах
Задача 2. Был проведен учет городского населения города А методом случайного бесповторного отбора. Из общей численности населения 500 тыс. человек было отобрано 500 тыс. и установлено, что 15% имеют возраст старше 60 лет. С вероятностью 0,683 определить предел, в котором находится доля жителей города А в возрасте старше 60 лет. Решение. Предельная ошибка доли при собственно-случайном бесповторном отборе определится как
Здесь Следовательно, с вероятностью 0,683 можно утверждать, что доля жителей старше 60 лет находится в пределах: 0,15-0,048< P <0,15+0,048; или 10,2%< P <19,8%. Задача 3. Проведена 10%-ная типическая выборка пропорциональна численности отобранных групп (табл. 6.3). Таблица 6.3 Группировка рабочих разных профессий по степени выполнения норм выработки
Требуется с вероятностью 0,954 определить пределы, в которых находится средний процент выполнения норм рабочими завода в целом. Выборка бесповторная. Решение: Вычислим общий средний процент выполнения норм выработки:
Далее определим среднюю из групповых дисперсий
Рассчитаем предельную ошибку выработки для типического отбора
Таким образом, с вероятностью 0,954 можно утверждать, что средний процент выполнения норм рабочими завода в целом находится в пределах
т.е. он не меньше 103,82% и не больше 104,18%. Задача 4. Для определения средней урожайности сахарной свеклы в области проведена 20%-ная серийная бесповторная выборка, в которую вошло 5 районов из 25. Средняя урожайность по каждому отобранному району составила: 250, 260, 275, 280, 300 ц/га. Определить с вероятностью 0,954 пределы, в которых будет находиться средняя урожайность сахарной свеклы по области. Решение. Найдем общую среднюю
Определим межсерийную дисперсию по формуле
Рассчитаем предельную ошибку выборки при серийном бесповторном отборе
Следовательно, с вероятностью 0,954 можно утверждать, что средняя урожайность сахарной свеклы в области будет находиться в пределах от 272,66 до 287,34 ц/га. Задача 5. Предполагается, что партия деталей содержит 8 % брака. Определить необходимый объем выборки, чтобы с вероятностью 0,954 можно было установить долю брака с погрешностью не более 2%. Исследуемая партия содержит 5000 деталей. Решение. По условию задачи t =2, доля бракованных деталей | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|