Правило сложения дисперсий
Если совокупность состоит из нескольких частей, то можно определить в пределах каждой не только среднюю величину, но и дисперсию Правило сложения дисперсий означает, что общая дисперсия складывается из двух слагаемых, одно из которых измеряет вариацию внутри частей совокупности, а второе — различия (вариацию) между этими частями (представленными средними). Именно поэтому правило сложения дисперсий находит широкое применение в анализе взаимосвязей и зависимостей. Наглядно представить статистические данные позволяет графический метод, заключающийся в изображении показателей при помощи геометрических фигур и т.д. Передаваемая графически информация воспринимается значительно лучше, чем текстовая запись цифровых данных. Поле графика — это пространство, в котором располагается графический образ. Рис. 3.2. Полигон распределения семей по числу их членов
Шкалой называется линия, отдельные точки которой могут быть прочитаны как определенные числа. Масштаб — мера перевода числовой величины в графическую. Масштаб графика выражается линейной мерой, т.е. числом миллиметров в отрезке, которому должна соответствовать единица статистического показателя. В большинстве случаев в статистических графиках применяется система декартовых координат. Графический образ зависит от используемых геометрических знаков и может быть точечным, круговым, столбиковым и др. Диаграмма — наиболее распространенная форма графических изображений. Диаграмма столбиковая изображает статистические величины в форме удлиненных прямоугольников (столбиков). Столбиковая диаграмма — диаграмма одномерного измерения, поэтому все столбики по ширине должны быть одинаковыми, так как величина показателя характеризуется высотой столбика, и размещаться на горизонтальной прямой на равном расстоянии друг от друга. Пример столбиковой диаграммы, отражающей динамику застройки одного из районов г. Москва (Северное Бутово) приведен на рис.3.3.
Рис.3.3. Динамика застройки одного из районов г. Москва (Северное Бутово) за 2007-2010 гг. [21]
Разновидностью полосовой диаграммы является скользящая диаграмма. В скользящей полосовой диаграмме направленность полос определяется не их нулевыми точками, а условными значениями, по которым полосы смещаются друг против друга вправо и влево. Полосовой скользящей диаграммой можно графически изобразить данные демографической статистики о вероятной продолжительности жизни людей в зависимости от пола и возраста. Широкое применение имеют линейные диаграммы, которые иначе называются статистическими кривыми, и отражают изменение явления во времени. При непрерывной вариации признака строятся интервальные вариационные ряды, графическим изображением которых является гистограмма. Для ее построения по оси абсцисс в соответствии с принятым масштабом откладывают границы интервалов признака. Эти интервалы являются основаниями прямоугольников, площади которых равны произведению величины интервалов на их частоты или частости. В ряде случаев для изображения вариационных рядов используется кумулятивная кривая (кумулята). Для ее построения следует рассчитать накопленные частоты или частости, на оси абсцисс откладываются значения варьирующего признака, а на оси ординат помещаются накопленные частоты или частости. Например, имеются следующие данные о распределении семей по числу детей (цифры условные): Таблица 3.1 Данные о распределении семей по числу детей (цифры условные)
Рис. 3.4.Кумулята распределения семей по числу детей, соответствующая данным табл.3.1. Секторная диаграмма применяется для иллюстрации структуры изучаемой совокупности. Секторные диаграммы строятся по следующему принципу: вся величина явления принимается за 100%, затем считаются доли отдельных частей в процентах. Круг разбивается на секторы пропорционально частям изображаемого целого, т.е. на 1% приходится 3,6 градуса. Чтобы получить центральные углы секторов, отображающие доли частей целого, следует их процентное выражение умножить на 3,6 градуса Например, на рис. 3.5. показан характер возникновения ЧС в 2007 г.[19] (в 2009 г. произошла 270 ЧС техногенного характера, количество ЧС природного характера составило 133, произошла 21 биолого-социальная ЧС). Рис. 3.5. Характер возникновения ЧС в 2007 г.[19] Для одновременного изображения трех величин, связанных между собой таким образом, что одна величина является произведением двух других, применяются диаграммы, называемые знак Варзара (по имени русского статистика В.Е. Варзара) и представляет собой прямоугольник, у которого один сомножитель принят за основание, другой – за высоту, а вся площадь равна их произведению (рис.3.6). Например, имеются следующие данные, приведенные в табл. 3.2. (цифры условные): Таблица 3.2
Рис. 3.6.Валовой сбор озимой и яровой пшеницы
Графический метод в статистике является продолжением и дополнением табличного метода. График позволяет сравнительно легко обнаружить на глаз ошибки расчетов, которые в табличной форме не были так заметны. Незамеченными при чтении таблиц могут оставаться не только ошибки, но какие-то тенденции. Все это обнаруживается на графике. Статистические графики отражают целостную картину изучаемого явления, его обобщенное представление. При графическом изображении статистических данных становится более выразительной сравнительная характеристика изучаемых показателей, отчетливее проявляется тенденция развития изучаемого явления, лучше видны основные взаимосвязи.
Анализ вариационных рядов Одной из важных задач анализа рядов распределения является выявление закономерности распределения, определения ее характера и количественного выражения. Эта задача решается при помощи показателей, характеризующих форму, тип распределения. Кроме рассмотренных выше важной характеристикой рядов распределения являются также моменты распределений. Моментом распределения Порядок момента определяется величиной В зависимости от постоянной величины - начальные, - центральные и - условные моменты. Если В этом случае при При при и т.д. Начальные моменты используются, в частности, при расчете дисперсии: Если постоянная величина В этом случае при при при В формулах для вычисления условных моментов Анализ вариационных рядов предполагает выявление закономерностей распределения, определение и построение некой теоретической (вероятностной) формы распределения. Графическое изображение эмпирического вариационного ряда принимает вид плавной кривой, именуемой кривой распределения. Характер распределения лучше всего проявляется при большом числе наблюдений и малых интервалах.
Кривая распределения является обобщенной характеристикой особенностей формы распределения и выражает закономерность распределения единиц совокупности по величине варьирующего признака. Различают кривые распределения эмпирические и теоретические. Эмпирическая кривая — кривая распределения, полученная по данным наблюдения, которая отражает как общие, так и случайные условия, определяющие распределение. Теоретическая кривая распределения — кривая, выражающая функциональную связь между изменением варьирующего признака и изменением частот и характеризующая определенный тип распределения. Анализируя частоты в эмпирическом распределении, можно описать его с помощью математической модели — закона распределения, установить по исходным данным параметры теоретической кривой и проверить правильность выдвинутой гипотезы о типе распределения данного ряда. Нахождение функции кривой распределения называется моделированием. При исследовании закономерностей распределения очень важно выдвинуть верную гипотезу о типе кривой распределения, так как, если кривая описана математически (с помощью уравнения) верно, она более точно отражает закономерности данного распределения и может быть использована в различных практических расчетах и прогнозах, в этом случае можно сформулировать рекомендации для принятия практических решений. Для аппроксимации (выравнивания) эмпирических кривых распределения и сопоставления их с теоретическими в практике статистического исследования часто используют различные распределения: нормальное, логарифмически нормальное, биномиальное, Пуассона, Шарлье и др. Каждое распределение имеет свою специфику и область применения. Далее будут рассмотрены только нормальное распределение и распределение Пуассона. Нормальное распределение При построении статистических моделей весьма широко применяется нормальное распределение. В 1727 г. английский математик Абрахам де Муавр (1667—1754) открыл закон распределения вероятностей, названный законом нормального распределения. Позднее, в начале XIX в., разработкой вопросов, относящихся к данному закону, занимались Пьер Лаплас (1749-1827) и Карл Гаусс (1777-1855). Общие условия возникновения закона нормального распределения установил А.М.Ляпунов (1857-1918). Распределение непрерывной случайной величины или где:
При графическом изображении плотности распределения Случайные величины, распределенные по нормальному закону, различаются значениями параметров Если 1) чем меньше 2) чем больше Рис. 3.7. Кривая нормального распределения теоретическая и экспериментальная Если Особенности кривой нормального распределения. 1. Кривая симметрична и имеет максимум в точке, соответствующей значению 2. Кривая асимптотически приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности. Чем больше отдельные значения Кривая имеет две точки перегиба на расстоянии Площадь между ординатами, проведенными на расстоянии Коэффициенты асимметрии и эксцесса равны нулю. Порядок расчета теоретических частот кривой нормального распределения: 1) по эмпирическим данным рассчитывают среднюю арифметическую ряда 2) находят нормированное отклонение каждого варианта от средней арифметической: 3) по таблице распределения функции 4) вычисляют теоретические частоты где 5) в случае, если вариационный ряд имеет равные интервалы, Распределение Пуассона К числу важнейших теоретических распределений, имеющих практическое применение, относится пуассоновское распределение, названное по фамилии французского математика Симеона Пуассона (1781-1840). Классическую форму распределение Пуассона принимает в том случае, если значения признака носят дискретный характер Аналитически распределение Пуассона можно выразить формулой: где:
Из формулы видно, что единственным параметром распределения является средняя арифметическая. Порядок расчета теоретических частот кривой распределения Пуассона: 1) находят среднюю арифметическую ряда, т.е. 2) по таблицам определяют 3) для каждого значения где:
Рис.3.8 Кривая распределения Пуассона Кривые распределения бывают симметричными и асимметричными. В зависимости от того, какая ветвь кривой распределения вытянута — правая или левая — различают правостороннюю или левостороннюю асимметрию. Кривые распределения могут быть одно-, двух- и многовершинными. В нормальном ряду распределения размах вариации
Если указанные соотношения нарушены, то это свидетельствует о наличии асимметрии распределения. При разности между при разности между Коэффициент асимметрии равен отношению центрального момента третьего порядка к среднему квадратическому отклонению в кубе: Если В качестве показателя асимметрии применяется и коэффициент асимметрии Пирсона, представляющий собой отношение разности между средней арифметической и модой к среднему квадратическому отклонению: Если если если Крутизна, островершинность кривой распределения называется эксцессом. Различают эксцессы: нормальный, выше нормального и ниже нормального.
Для характеристики степени эксцесса применяют коэффициент эксцесса, который равен отношению центрального момента четвертого порядка к среднему квадратическому отклонению в четвертой степени: Рис. 3.10. Эксцессы распределения Рис. 3.11. Изменение квадратического отклонения для кривых распределения с различным эксцессом Если распределение нормальное, то эксцесс нормальный и равен 3. Если
Так как все предположения о характере того или иного распределения — это гипотезы, а не категорические утверждения, то необходима статистическая проверка с помощью так называемых критериев согласия. Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождения между теоретическими и эмпирическими частотами следует признать несущественными (случайными), а когда — существенными (неслучайными). Критерии согласия позволяют принять для данного эмпирического распределения модель, выраженную некоторым теоретическим законом распределения. Существует ряд критериев согласия. Чаще других применяют критерии Пирсона, Романовского и Колмогорова. Критерий согласия Пирсона где:
Вычисление Для распределения Уровень значимости 1) 2) 3) Например, вероятность 0,01 означает, что в одном случае из 100 может быть отвергнута правильная гипотеза. В экономических исследованиях считается практически приемлемой вероятность ошибки 0,05, т.е. в 5 случаях из 100 может быть отвергнута правильная гипотеза. Кроме того, Число степеней свободы Под числом связей понимается число показателей эмпирического ряда, использованных при исчислении теоретических частот, т.е. показателей, связывающих эмпирические и теоретические частоты Так, в случае выравнивания по кривой нормального распределения имеется три связи:
Поэтому при выравнивании по кривой нормального распределения число степеней свободы определяется как В случае выравнивания по кривой Пуассона Для оценки существенности расчетное значение При полном совпадении теоретического и эмпирического распределений Если В случае если Используя критерий согласия 1) объем исследуемой совокупности должен быть достаточно большим 2) эмпирическое распределение должно состоять из данных, полученных в результате случайного отбора, т.е. они должны быть независимыми. Критерий Романовского Он весьма удобен при отсутствии таблиц для Если Критерий Колмогорова
где Рассчитав значение Основное условие для использования критерия Колмогорова — достаточно большое число наблюдений. Контрольные вопросы 1. Что представляет собой статистический ряд распределения? 2. Виды рядов распределения и чем они отличаются? 3. Что такое вариация ряда распределения?4. Какие существуют показатели вариации и для каких целей они применяются? 5. Что такое среднее квадратическое отклонение и каков порядок его вычисления? 6. Что такое коэффициент вариации, для каких целей он применяется и как рассчитывается? 7. В чем сущность показателя дисперсия? 8. Какими свойствами обладает дисперсия? 9. В чем заключается правило сложения дисперсий? 10. Какую задачу решают статистические графики? 11. Как строятся столбиковые диаграммы? 12. Что такое полосовая диаграмма и ее разновидность — скользящая диаграмма? 13. В чем сущность круговых диаграмм и как они строятся? 14. Что такое знак Варзара? Как он строится и для чего применяется данный график? 15. Что является одной из важных задач анализа рядов распределения? 16. Что выражают кривые распределения? 17. Какие кривые называются эмпирическими и теоретическими? 18. В чем сущность моделирования рядов распределения и его значение в анализе? 19. Как определяются коэффициенты асимметрии и что они характеризуют? 20. Как определяется коэффициент эксцесса и что он характеризует? 21. Что характеризует критерий согласия? 22. Какова формула критерия согласия Пирсона, с каким показателем связано его вычисление и применение в анализе? 23. Что представляет собой число степеней свободы и как оно определяется? 24. Какова формула критерия согласия Колмогорова и ее применение в анализе?
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|