Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Статистическое распределение признака




Федеральное агентство по образованию

Государственное образовательное учреждение высшего

Профессионального образования

«Челябинский государственный университет»

Кафедра теории управления и оптимизации

 

Описательная статистика

Методические указания

 

 

Челябинск

 

УДК – 332.64

 

Методические указания «Описательная статистика» Челябинск, ГОУ ВПО «ЧелГУ», 2009, 22 с.

 

 

Методические указания содержат краткое изложение основных понятий и определений по теме «Описательная статистика», примеры решения задач по соответствующему разделу курса и задачи для самостоятельного решения.

Предназначены для студентов 2 курса факультета управления.

 

Составитель: Е.Ю. Маркелова, канд. физ. – мат. наук, доцент, каф. Теории оптимизации и управления.

Рецензент: Н.Д. Зюляркина, канд. физ. – мат. наук, доцент каф. компьютерной безопасности, ЮУрГУ

 

Одобрено учебно-методическим советом математического факультета Челябинского государственного университета.

 

 

Введение

Никакой достоверности нет в науках там,

Где нельзя приложить ни одной из

Математических наук, и в том, что

не имеет связи с математикой.

ЛЕОНАРДО ДА ВИНЧИ

Во многих областях человеческой деятельности сегодня требуется переход от первичного накопления эмпирического материала к его систематизации и осознанию. Все более тонкими и косвенными становятся методы экспериментирования – все более трудной становится задача структурной интерпретации результатов.

Специалистам разных отраслей все чаще приходится иметь дело с большими массивами информации и строить свои суждения в условиях неопределенности. Поэтому появляется необходимость широкого применения методов теории вероятности и математической статистики, накопивших большой опыт построения выводов в ситуациях неполной информации.

Математическая статистика занимается математическим описанием случайных явлений, то есть построением вероятностных моделей и проверкой их пригодности. При этом выделяют два раздела математической статистики: описательная статистика, занимающаяся накоплением, систематизацией и представлением экспериментальных данных в удобной форме; индуктивная статистика, которая позволяет сделать выводы относительно объектов, которые характеризуются собранными данными.

Данное руководство преследует цель ознакомления студентов с основными понятиями теории выборок и возможностями реализации методов описательной статистики в современных компьютерных технологиях.

 

Генеральная совокупность и выборка

Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, в группе студентов (это совокупность), качественным признаком может быть тип темперамента каждого студента, а количественным – уровень интеллекта (IQ).

Иногда проводят сплошное обследование, то есть обследуют каждый из объектов совокупности относительно признака, которым интересуются. Однако на практике сплошное обследование применяют редко. Если совокупность содержит большое число объектов, или обследование всех объектов трудоемко, то случайно отбирают из всей совокупности ограниченное число объектов и подвергают их изучению.

Выборочная совокупность (или выборка) – совокупность случайно отобранных для изучения объектов. Генеральная совокупность – это совокупность объектов, из которых производится выборка. Объем совокупности – это число объектов этой совокупности.

Требования к выборке:

- репрезентативность (выборка должна правильно представлять пропорции генеральной совокупности);

- независимость (выбор последующего объекта не зависит от качества уже выбранного предыдущего объекта.

Эти требования будут выполнены, если отбор производить случайным образом (все объекты имеют одинаковую вероятность попасть в выборку).

 

Способы отбора

На практике применяются различные способы отбора объектов.

- простой случайный отбор – объекты извлекают по одному из всей генеральной совокупности случайным образом;

- типический отбор – объекты отбираются из каждой типической части генеральной совокупности (например, если генеральная совокупность представлена разными возрастами, то типическую часть можно определить одним возрастом);

- механический отбор – генеральную совокупность механически делят на столько групп, сколько объектов должно войти в выборку, а из каждой группы случайным образом отбирают один объект.

Шкалы измерения

Измерение – это приписывание числовых значений объектам или событиям в соответствии с определенными правилами. Существует несколько типов шкал измерения, наиболее часто используются следующие.

1) Номинативная шкала – шкала, классифицирующая объекты по названиям. Эта шкала состоит из нескольких ячеек, первая их которых содержит название (имя) объекта, а другие ячейки могут быть значениями признаков. Пример номинативной шкалы:

Ф.И.О. Голосует «за» Голосует «против» Воздержался
Иванов И.Р.   +  
Петров А.А. +    
Агеева О.Н.     +
Попова Е.Г.   +  

2) Порядковая шкала – шкала, классифицирующая по принципу «больше-меньше» (ранговая шкала, шкала приоритетов). Единица измерения в шкале порядка – расстояние в один ранг, при этом расстояние между рангами может быть разным (оно нам не известно). В качестве примера порядковой шкалы приведем перечень видов страха, упорядоченный российскими гражданами:

Виды страха ранг
Страх полета  
Страх неудачи  
Страх собак  
Страх одиночества  

3) Интервальная шкала - шкала, классифицирующая по принципу «больше-меньше на определенное количество единиц». Принцип построения большинства интервальных шкал построен на известном правиле трех сигм: примерно 97,7% всех значений признака при нормальном его распределении укладывается в диапазоне (М- 3 σ,М+ 3 σ). Здесь M - математическое ожидание, а s - среднее квадратическое отклонение. Пример интервальной шкалы – шкала Кеттела: среднеарифметическое значение признака принимается за точку отсчета, вправо и влево отмеряются интервалы, равные ½ стандартного отклонения. Пример интервальной шкалы:

Ф.И.О. руководителя Уровень авторитарности
Иванов П.И. 9,3
Петров Н.С. 6,5
Сидоров Т.Ю. 8,2

 

Статистическое распределение признака

Пусть из генеральной совокупности извлечена выборка, причем значение x1 наблюдалось n1 раз, значение x2 наблюдалось n2 раз, и.т.д., значение xк наблюдалось nк раз. Наблюдаемые значения xi называют вариантами, а последовательность вариант, записанная в возрастающем (убывающем) порядке, - вариационным рядом. Числа ni, показывающие, сколько раз встречается варианта xi в выборке, называются частотами, а их отношения к объему выборки - ni/n = Wiотносительными частотами.

Если исследуемый признак является дискретным, то есть принимает конечное или счетное число значений, то статистическим распределением выборки называют перечень вариант и соответствующих им частот (или относительных частот). Геометрической интерпретацией такого распределения является полигон - ломаная, отрезки которой соединяют точки (x1,n1), (x2,n2), … (xк,nк) (рис.3.). Полигон относительных частот – ломаная, соединяющая (x1,W1), (x2,W2), … (xк,Wк).

Если же признак может принимать любые значения из интервала [a,b], то есть является непрерывным, то статистическое распределение для него задается в виде последовательности интервалов и соответствующих им частот. Статистическое распределение для непрерывного признака строят следующим образом:

- находят максимальное xmax и минимальное xmin значения признака в выборке и интервал изменения значений признака [ xmax,xmin ] делят на k частичных интервалов. Здесь k определяют по формуле Старджнсса:

k =1+3,332 lg(n).

- в качестве частоты, соответствующей интервалу, берут сумму частот вариант, попавших в этот интервал.

Геометрической интерпретацией такого распределения является гистограмма – ступенчатая фигура, состоящая из прямоугольников с основанием равным h и высотой ni/h. В гистограмме относительных частот высота прямоугольников равна Wi/h (рис.4).

Итак, статистическое распределение признака отражает закономерность встречаемости разных его значений.

В исследованиях чаще ссылаются на нормальное распределение, которое характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к средней величине – достаточно часто. График нормального распределения представляет собой колоколообразную кривую.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...