Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Тема №4. Статистическое распределение выборки.




Пусть из генеральной совокупности извлечена выборка, причем значение Х1 наблюдалось n1 раз, Х2 -- n2 раз, …, Х k -- nk раз.

Тогда: , где n - общее число наблюдений (объем выборки).

Наблюдаемые значения Хi называют вариантами, а последовательность вариант, записанных в возрастающем порядке – вариационным рядом. Число наблюдений называют частотами, а их отношение к объему выборки называют относительными частотами.

ОПРЕДЕЛЕНИЕ 1.3. Статистическим распределением выборки называют перечень вариант и соответствующих им относительных частот.

Если в теории вероятностей распределение вероятностей это соответствие между возможными значениями случайной величины и их вероятностями, то в математической статистике это соответствие между наблюдаемыми значениями вариант и относительными частотами.

Функция распределения вероятностей определяется как: (1.1)

Пусть известно статическое распределение частот количественного признака Х. Пусть nх - число наблюдений, при которых наблюдалось значение признака X меньшее х; n – общее число наблюдений, тогда относительная частота события Х<х равна .

ОПРЕДЕЛЕНИЕ 1.4. Эмпирической функцией распределения (функцией распределения выборки) называется функция F*(x), определяющая для каждого значения Х относительную частоту появления события Х<х.

Функцию распределения F(x) генеральной совокупности называют теоретической функцией распределения. (1.1)

Эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.

Для наглядности статистического распределения в случае дискретного распределения признака Х строят полигон (ломанная, где длина Х откладывается на оси абсцисс, а на оси ординат соответствующие им частоты ni).

В случае непрерывного распределения признака Х строят гистограммы. Для построения гистограммы все наблюдаемые значения признака разбивают на несколько i частичных интервалов длиной h, и для каждого интервала сумму частот вариант попавших в i интервал отмечают по оси ординат.

ОПРЕДЕЛЕНИЕ 1.5. Гистограммой распределения частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высоты равны отношению (плотность частот).

ПРИМЕР. Задача 1. Даны данные о количестве ежедневных звонков абонента с сотового телефона: 5, 6, 10, 12, 4, 6, 0, 3, 15, 20, 14, 13, 11, 8, 10, 7, 6, 10, 12, 16, 18, 10, 14, 12, 5, 7, 16, 8, 9, 12. Построить гистограммы частот и относительных частот распределения телефонных звонков в месяц.

Решение: Объем выборки п=30. Выберем длину частичного интервала h в 4 звонка. Тогда получим следующее распределение выборки.

Номер интервала, i Частичный интервал xi – xi+1 Сумма частот вариант интервала, ni Плотность частоты, ni/h Относитель-ные часто-ты, wi=ni/n
  0 – 4 5 – 8 9 – 12 13 – 16 17 – 20   0,75 2,25 2,5 1,5 0,5 0,1 0,3 0,33 0,2 0,07
    ni =30   wi =1

Строим гистограмму распределения частот, откладывая по оси абсцисс заданные интервалы длиной h=4, а параллельно оси ординат высоты длиной ni/h. Для построения гистограммы распределения относительных частот – откладываем параллельно оси ординат высоты длиной wi=ni/n.

Гистограмма распределения Гистограмма распределения

частот звонков. относительных частот звонков.

Для соответствия эмпирической функции распределения частот теоретической функции распределения в статистических программах строят гистограмму с наложением соответствующей плотности распределения вероятностей.

Рисунок 3.2 – Гистограмма распределения с наложением нормальной кривой (пакет Statistica 6.0).

Пусть имеются данные выборки, например значения некоторого признака, Х1, Х2,…, Хn, полученные в результате n наблюдений. Через эти данные выражают оцениваемый параметр. Рассмотрим х1, х2……… хn как независимые случайные величины Х1, Х2,…, Хn, принимающие только одно возможное значение х1, х2……… хn соответственно.

Таким образом, для того чтобы найти статистическую оценку θ неизвестного параметра теоретического распределения через эти данные необходимо найти функцию от наблюдаемых случайных величин, которые дают приближенное значение оцениваемого параметра. Статистическую оценку, которая определяется одним числом, называют точечной.

Полученные оценки должны быть достоверными, т.е. обладать свойствами несмещенности, эффективности и состоятельности.

1. Несмешанной называют статистическую оценку θ*, математическое ожидание которой равно оценивающему параметру θ при любом объеме выборки, т.е. М(θ*)= θ. (2.1)

2. Эффективной оценкой называют статистическую оценку θ*, которая при заданном объеме выборки n имеет наименьшую возможную дисперсию.

3. Состоятельной называют статистическую оценку, которая при n→ ∞ и стремится по вероятности к оцениваемому параметру, т.е. .

Тема №5. Общие описательные характеристики.

ОПРЕДЕЛЕНИЕ 2.1. Генеральной средней называется среднее арифметическое значение признаков генеральной совокупности:

, (2.2)

где N – объем генеральной совокупности.

Если х1 встречается N1 раз, х2N2 раз и т.д., то (2.2) можно переписать в виде:

(2.2)¢

ОПРЕДЕЛЕНИЕ 2.2. Несмещенной оценкой генеральной средней служит выборочная средняя, определяемая как среднее арифметическое значение признаков выборки (ni частоты появления признака):

или (2.3)

Средняя величина позволяет сделать вывод о центральном или наиболее общем значении, найденном для совокупности данных. Мера рассеяния (дисперсия) показывает, насколько данные распределены относительно среднего значения признака.

Показатели асимметрии иллюстрируют степень левосторонней асимметрии или правосторонней асимметрии, т.е. положительной или отрицательной «скошенности» в распределении частот.

Показатели уровня «островершинности» или «плосковершинности» в распределении частот называются эксцессами.

ОПРЕДЕЛЕНИЕ 2.3. Момент k -ого порядка относительно исходной величины А находится как:

(2.4)

При А=0, k=1 формула (2.4) станет формулой для определения средней арифметической;

При А – среднем значении, k=2, формула (2.4) станет формулой для определения дисперсии;

При А – среднем значении, k=3, по формуле (2.4) будет определятся мера скошенности;

При А – среднем значении, k=4, (2.4) – момент, измеряющий эксцесс.

ОПРЕДЕЛЕНИЕ 2.4. Модой называется это наиболее часто наблюдаемая величина случайной переменной, обозначается М0.

ОПРЕДЕЛЕНИЕ 2.5. Медианой называется значение наблюдения, которое находиться в середине ранжированного ряда данных, т.е. наблюдение, занимающее серединное значение, обозначается как Ме.

ПРИМЕЧЕНИЕ: Для определения медианы, сначала данные группируют в возрастающем порядке, затем берут серединное значение, если число данных четно, то берется среднее арифметическое значение серединных значений.

Пример:

1 1 1 1 2 2

Ме =1 – медиана

 

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...