Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Элементы математической статистики.




 

1. Теоретические сведения

Математическая статистика — раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых, однородных случайных явлений для выявления сущест­вующих закономерностей.

Пусть требуется изучить данную совокупность объектов отно­сительно некоторого признака.

Совокупность всех подлежащих изучению объектов или воз­можных результатов всех мыслимых наблюдений, производимых в неизменных условиях над одним объектом, называется генеральной совокупностью.

Выборочной совокупностью (выборкой) называется совокуп­ность объектов, отобранных случайным образом из генеральной сово­купности. Более строго: выборка — это последовательность незави­симых одинаково распределенных случайных величин, распределение каждой из которых совпадает с распределением генеральной случай­ной величины.

Число объектов (наблюдений) в совокупности называется ее объемом.

Пусть изучается некоторая С.В. . С этой целью над С.В. про­изводится ряд независимых опытов (наблюдений). В каждом из этих опытов величина принимает то или иное значение.

Пусть она приняла раз значение , раз — значение , …, раз — значение . При этом — объем выборки. Значения называется вариантами С.В. .

Размах выборки W − разность между максимальным и мини­мальным значениями элементов выборки: .

Операция расположения значений случайной величины (при­знака) по неубыванию называется ранжированием статистических данных. Полученная таким образом последовательность значений С.В. и , …, называется вариационным рядом.

Числа , показывающие, сколько раз встречаются варианты в ряде наблюдений, называются частотами, а отношение их к объему выборки — относительными частотами, т.е. , , .

Перечень вариант и соответствующих им частот или относительных частот называется статистическим распределением выборки или статистическим рядом.

Обычно, статистический ряд записывают в виде таблицы (табл.1).

Таблица 1

x i x 1 x 2 ... x k
n i n 1 n 2 ... n k
...

В случае, когда число значений признака (С.В. ) велико или признак является непрерывным (т.е. когда С.В. может принимать любое значение в некотором интервале), составляют интервальный статистический ряд (таблица 2). Для этого весь диапазон значений С.В. от до разбивают на интервалов (обычно от 5 до 20) одинаковой длины , подсчитывают частоты значений выборки, попавших в интервалы. Для определения количества интервалов обычно применяется формула .

Таблица 2

Интервал ...
Середина интервала ...
Частота n 1 n 2 ... nk
Относительная частота ...

Одним из способов обработки вариационного ряда является построение эмпирической функции распределения. Эмпирической (статистической) функцией распределения называется функция , определяющая для каждого значения частость события : . Для нахождения значений эмпирической функции удобно записать в виде

, (1)

где — объем выборки, — число наблюдений, меньших ().

Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами , ,…, ; полигоном относительных частот — с координатами , ,…, .

Гистограммой частот (относительных частот) называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению — плотность частоты ( — плотность относительной частоты). Площадь гистограммы частот равна объему выборки, а площадь гистограммы относительных частот равна единице.

Пусть статистическое распределение выборки объема имеет вид:

Выборочным средним называется среднее арифметическое всех значений выборки:

. (2)

В случае интервального статистического ряда в качестве берут середины его интервалов, а — соответствующие им частоты.

Выборочной дисперсией называется среднее арифметическое квадратов отклонений значений выборки от выборочной средней , (3)

Выборочное среднее квадратичное отклонение выборки определяется формулой .

Исправленная выборочная дисперсия — величина, определяемая по формуле

, . (4)

Величина называется исправленным выборочным средним квадратичным отклонением.

Статистической оценкой (или просто — оценкой ) параметра теоретического распределения генеральнойсовокупности называют его приближенное значение, найденное по выборке. Оценка есть значение некоторой функции результатов наблюдений над случайной величиной.

Функцию результатов наблюдений (т.е. функцию выборки) называют статистикой.

К оценке любого параметра предъявляется ряд требований, которым она должна удовлетворять, чтобы быть «близкой» к истинному значению параметра.

Оценки должны удовлетворять определенным требованиям.

Несмещенной называется статистическая оценка , математическое ожидание которой равно оцениваемому параметру при любом объёме выборки, т.е. . Если , то оценка называется смещенной. Если , то оценка называется асимптотически несмещенной.

Эффективной называется статистическая оценка, которая (при данном объеме выборки) имеет минимально возможную дисперсию.

Состоятельной называется статистическая оценка, которая при стремится по вероятности к оцениваемому параметру, т.е. .

 

Статистические оценки делятся на два класса: точечные и интервальные.

Точечной называют статистическую оценку, которая определяется одним числом. Например, выборочное среднее ,выборочная дисперсия и т. д.

Выборочное среднее несмещенная и состоятельная оценка математического ожидания.

Выборочная дисперсия является смещенной оценкой дисперсии.

Исправленная выборочная дисперсия несмещенная и состоятельная оценка дисперсии.

Эмпирическая функция распределения выборки является несмещенной состоятельной оценкой функции распределения случайной величины.

Точечные оценки неизвестного параметра хороши в качестве первоначальных результатов обработки наблюдений. Недостатком является то, что неизвестно с какой точностью они дают оцениваемый параметр.

Оценка неизвестного параметра называется интервальной, если она определяется двумя числами — концами интервала, покрывающего оцениваемый параметр.

Доверительным интервалом для параметра называется интервал , который покрывает неизвестный параметр с заданной надежностью , т.е. . Число называется доверительной вероятностью, а значение − уровнем значимости. На практике обычно используют уровни значимости: 0.1, 0.05, 0.01.

Доверительный интервал для математического ожидания нормально распределенной случайной величины при данном уровне значимости и известной дисперсии имеет вид

, (5)

где определяется из условия , или и

− функция Лапласа.

При неизвестной дисперсии генеральной совокупности используется формула

, (6)

где определяется с помощью таблицы значений распределения Стьюдента по данному числу степеней свободы и уровню значимости . − оценка среднего квадратического отклонения. Отметим, что при объеме выборки вместо распределения Стьюдента можно пользоваться нормальным распределением.

Под статистической гипотезой (или просто гипотезой) понимают всякое высказывание (предположение) о генеральной совокупности, проверяемое по выборке.

Статистические гипотезы делятся на гипотезы о параметрах распределения известного вида (параметрические гипотезы) и гипотезы о виде неизвестного распределения (непараметрические гипотезы).

Одну из гипотез выделяют в качестве основной (или нулевой) , а другую, являющуюся логическим отрицанием — в качестве конкурирующей (или альтернативной) гипотезы.

Процедура проверки соответствия высказанного предположения (гипотезы) с выборочными данными называется проверкой гипотезы.

Правило, по которому принимается решение принять или отклонить гипотезу , называется статистическим критерием (или просто критерием) проверки гипотезы .

Критерием согласия называют статистический критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

Одним наиболее распространённым критерием проверки непараметрических гипотез о виде функции распределения изучаемой случайной величины является критерий (Пирсона). Данный критерий проверяет гипотезу о возможном законе распределения и применяется для разных распределений.

Схема применения критерия для проверки гипотезы Н о законе распределения изучаемой случайной величины заключается в следующем:

1) Рассматриваем гипотезу Н 0 о законе распределения случайной величины (дискретной или непрерывной);

2) По выборке находим оценки и неизвестных параметров предполагаемого закона распределения;

3) Определяем частоты , , с которыми встречаются в выборке каждое значение дискретной случайной величины или элементы выборки непрерывной случайной величины принадлежащие каждому из заданных интервалов;

4) Находим теоретические вероятности − для дискретной, − для непрерывной случайной величины. Для нормального закона распределения имеем

; (7)

5) Вычисляем наблюдаемое значение критерия :

; (8)

6) Контроль вычислений осуществляется равенством

. (9)

7) Принимаем статистическое решение: гипотеза Н 0 не противоречит выборке наблюдений на данном уровне значимости , если , где − число степеней свободы, а − число параметров распределения.

Если же , то гипотеза Н 0 отклоняется и может быть выдвинута другая гипотеза Н 1, которая проверяется по той же схеме.

 

Поделиться:





Читайте также:

IV. Допустимые элементы и фигуры для участия в турнирах по спортивным бальным танцам класса “D” танцевального мастерства в соответствии с правилами
А. Характеризуя общество как динамичную систему, необходимо показать, как взаимодействуют и развиваются его подсистемы и элементы.
А3.3. Элементы внутренней среды: сильные и слабые стороны
Активные элементы схемы замещения
Активы, обязательства и капитал как элементы, связанные с измерением финансового положения
Анализ производственного потенциала предприятия: понятие, структурные элементы анализа. Основные направления совершенствования анализа ресурсной базы предприятия.
Аналитическая геометрия. Элементы векторной и линейной алгебры.
Базовые оптические элементы
БАЗОВЫЕ ЭЛЕМЕНТЫ ЯЗЫКА
Банковская система: понятие, свойства, типы, уровни, элементы. Банковская система РФ.






Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...