Статистическое распределение выборки. Эмпирическая функция распределения
⇐ ПредыдущаяСтр 2 из 2 Пусть изучается некоторая случайная величина X. С этой целью над случайной величиной X производится ряд независимых опытов (наблюдений). В каждом из этих опытов величина X принимает то или иное значение. Пусть она приняла n 1 раз значение х 1, n 2 раз - значение x 2,..., nk раз - значение xk При этом - объем выборки. Значения называются вариантами случайной величины X. Вся совокупность значений случайной величины X представляет собой первичный статистический материал, который подлежит дальнейшей обработке, прежде всего - упорядочению. Операция расположения значений случайной величины (признака) по неубыванию называется ранжированием статистических данных. Полученная таким образом последовательность значений случайной величины X (где и ) называется вариационным рядом. Числа , показывающие, сколько раз встречаются варианты в ряде наблюдений, называются частотами, а отношение их к объему выборки - частостями или относительными частотами , т.е.
где .
Перечень вариантов и соответствующих им частот или частостей называется статистическим распределением выборки или статистическим рядом. Записывается статистическое распределение в виде таблицы. Первая строка содержит варианты, а вторая - их частоты (или частости ).
Статистическое распределение выборки является оценкой неизвестного распределения. В соответствии с теоремой Бернулли относительные частоты сходятся при к соответствующим вероятностям , т.е. . Поэтому при больших значениях n статистическое распределение мало отличается от истинного распределения. В случае, когда число значений признака (случайной величины X) велико или признак является непрерывным (т.е. когда случайная величина X может принять любое значение в некотором интервале), составляют интервальный статистический ряд.
В первую строку таблицы статистического распределения вписывают частичные промежутки , которые берут обычно одинаковыми по длине: . Для определения величины интервала (h) можно использовать формулу Стерджеса: , где - разность между наибольшим и наименьшим значениями признака, - число интервалов . За начало первого интервала рекомендуется брать величину . Во второй строчке статистического ряда вписывают количество наблюдений , (), попавших в каждый интервал.
Одним из способов обработки вариационного ряда является построение эмпирической функции распределения. Эмпирической (статистической) функцией распределения называется функция , определяющая для каждого значения х частость события :
Для нахождения значений эмпирической функции удобно записать в виде где n - объем выборки, - число наблюдений, меньших x (x ÎR). Очевидно, что удовлетворяет тем же условиям, что и истинная функция распределения . При увеличении числа n наблюдений (опытов) относительная частота события приближается к вероятности этого события (теорема Бернулли). Эмпирическая функция распределения является оценкой вероятности события , т.е. оценкой теоретической функции распределения случайной величины X.
Теорема 8.1 (Гливенко). Пусть - теоретическая функция распределения случайной величины X, a - эмпирическая. Тогда для любого
Пример 8.1. В результате тестирования группа абитуриентов набрала баллы: 5, 3, 0, 1, 4, 2, 5, 4, 1, 5. Записать полученную выборку в виде: а) вариационного ряда; б) статистического ряда. Решение: а) Проранжировав статистические данные (т.е. исходный ряд), получим вариационный ряд : (0, 1, 1, 2, 3, 4, 4, 5, 5, 5). б) Подсчитав частоту и частость вариантов , , , , , , получим статистическое распределение выборки (так называемый дискретный статистический ряд)
или Пример 8.2. Построить функцию используя условия и результаты задачи 8.1. Решение: Здесь . Имеем при (наблюдений меньше 0 нет). При при (здесь ) и т.д. Окончательно получаем: График эмпирической функции распределения приведен на рис. 8.1. Рис.8.1.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|