Элементы математической статистики.
Стр 1 из 3Следующая ⇒
1. Теоретические сведения Математическая статистика — раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых, однородных случайных явлений для выявления существующих закономерностей. Пусть требуется изучить данную совокупность объектов относительно некоторого признака. Совокупность всех подлежащих изучению объектов или возможных результатов всех мыслимых наблюдений, производимых в неизменных условиях над одним объектом, называется генеральной совокупностью. Выборочной совокупностью (выборкой) называется совокупность объектов, отобранных случайным образом из генеральной совокупности. Более строго: выборка — это последовательность независимых одинаково распределенных случайных величин, распределение каждой из которых совпадает с распределением генеральной случайной величины. Число объектов (наблюдений) в совокупности называется ее объемом. Пусть изучается некоторая С.В. . С этой целью над С.В. производится ряд независимых опытов (наблюдений). В каждом из этих опытов величина принимает то или иное значение. Пусть она приняла раз значение , раз — значение , …, раз — значение . При этом — объем выборки. Значения называется вариантами С.В. . Размах выборки W − разность между максимальным и минимальным значениями элементов выборки: . Операция расположения значений случайной величины (признака) по неубыванию называется ранжированием статистических данных. Полученная таким образом последовательность значений С.В. и , …, называется вариационным рядом. Числа , показывающие, сколько раз встречаются варианты в ряде наблюдений, называются частотами, а отношение их к объему выборки — относительными частотами, т.е. , , .
Перечень вариант и соответствующих им частот или относительных частот называется статистическим распределением выборки или статистическим рядом. Обычно, статистический ряд записывают в виде таблицы (табл.1). Таблица 1
В случае, когда число значений признака (С.В. ) велико или признак является непрерывным (т.е. когда С.В. может принимать любое значение в некотором интервале), составляют интервальный статистический ряд (таблица 2). Для этого весь диапазон значений С.В. от до разбивают на интервалов (обычно от 5 до 20) одинаковой длины , подсчитывают частоты значений выборки, попавших в интервалы. Для определения количества интервалов обычно применяется формула . Таблица 2
Одним из способов обработки вариационного ряда является построение эмпирической функции распределения. Эмпирической (статистической) функцией распределения называется функция , определяющая для каждого значения частость события : . Для нахождения значений эмпирической функции удобно записать в виде , (1) где — объем выборки, — число наблюдений, меньших (). Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами , ,…, ; полигоном относительных частот — с координатами , ,…, . Гистограммой частот (относительных частот) называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению — плотность частоты ( — плотность относительной частоты). Площадь гистограммы частот равна объему выборки, а площадь гистограммы относительных частот равна единице. Пусть статистическое распределение выборки объема имеет вид:
Выборочным средним называется среднее арифметическое всех значений выборки: . (2) В случае интервального статистического ряда в качестве берут середины его интервалов, а — соответствующие им частоты. Выборочной дисперсией называется среднее арифметическое квадратов отклонений значений выборки от выборочной средней , (3) Выборочное среднее квадратичное отклонение выборки определяется формулой . Исправленная выборочная дисперсия — величина, определяемая по формуле , . (4) Величина называется исправленным выборочным средним квадратичным отклонением. Статистической оценкой (или просто — оценкой ) параметра теоретического распределения генеральнойсовокупности называют его приближенное значение, найденное по выборке. Оценка есть значение некоторой функции результатов наблюдений над случайной величиной. Функцию результатов наблюдений (т.е. функцию выборки) называют статистикой. К оценке любого параметра предъявляется ряд требований, которым она должна удовлетворять, чтобы быть «близкой» к истинному значению параметра. Оценки должны удовлетворять определенным требованиям. Несмещенной называется статистическая оценка , математическое ожидание которой равно оцениваемому параметру при любом объёме выборки, т.е. . Если , то оценка называется смещенной. Если , то оценка называется асимптотически несмещенной. Эффективной называется статистическая оценка, которая (при данном объеме выборки) имеет минимально возможную дисперсию. Состоятельной называется статистическая оценка, которая при стремится по вероятности к оцениваемому параметру, т.е. .
Статистические оценки делятся на два класса: точечные и интервальные. Точечной называют статистическую оценку, которая определяется одним числом. Например, выборочное среднее ,выборочная дисперсия и т. д. Выборочное среднее — несмещенная и состоятельная оценка математического ожидания. Выборочная дисперсия является смещенной оценкой дисперсии. Исправленная выборочная дисперсия — несмещенная и состоятельная оценка дисперсии. Эмпирическая функция распределения выборки является несмещенной состоятельной оценкой функции распределения случайной величины.
Точечные оценки неизвестного параметра хороши в качестве первоначальных результатов обработки наблюдений. Недостатком является то, что неизвестно с какой точностью они дают оцениваемый параметр. Оценка неизвестного параметра называется интервальной, если она определяется двумя числами — концами интервала, покрывающего оцениваемый параметр. Доверительным интервалом для параметра называется интервал , который покрывает неизвестный параметр с заданной надежностью , т.е. . Число называется доверительной вероятностью, а значение − уровнем значимости. На практике обычно используют уровни значимости: 0.1, 0.05, 0.01. Доверительный интервал для математического ожидания нормально распределенной случайной величины при данном уровне значимости и известной дисперсии имеет вид , (5) где определяется из условия , или и − функция Лапласа. При неизвестной дисперсии генеральной совокупности используется формула , (6) где определяется с помощью таблицы значений распределения Стьюдента по данному числу степеней свободы и уровню значимости . − оценка среднего квадратического отклонения. Отметим, что при объеме выборки вместо распределения Стьюдента можно пользоваться нормальным распределением. Под статистической гипотезой (или просто гипотезой) понимают всякое высказывание (предположение) о генеральной совокупности, проверяемое по выборке. Статистические гипотезы делятся на гипотезы о параметрах распределения известного вида (параметрические гипотезы) и гипотезы о виде неизвестного распределения (непараметрические гипотезы). Одну из гипотез выделяют в качестве основной (или нулевой) , а другую, являющуюся логическим отрицанием — в качестве конкурирующей (или альтернативной) гипотезы. Процедура проверки соответствия высказанного предположения (гипотезы) с выборочными данными называется проверкой гипотезы. Правило, по которому принимается решение принять или отклонить гипотезу , называется статистическим критерием (или просто критерием) проверки гипотезы .
Критерием согласия называют статистический критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Одним наиболее распространённым критерием проверки непараметрических гипотез о виде функции распределения изучаемой случайной величины является критерий (Пирсона). Данный критерий проверяет гипотезу о возможном законе распределения и применяется для разных распределений. Схема применения критерия для проверки гипотезы Н о законе распределения изучаемой случайной величины заключается в следующем: 1) Рассматриваем гипотезу Н 0 о законе распределения случайной величины (дискретной или непрерывной); 2) По выборке находим оценки и неизвестных параметров предполагаемого закона распределения; 3) Определяем частоты , , с которыми встречаются в выборке каждое значение дискретной случайной величины или элементы выборки непрерывной случайной величины принадлежащие каждому из заданных интервалов; 4) Находим теоретические вероятности − для дискретной, − для непрерывной случайной величины. Для нормального закона распределения имеем ; (7) 5) Вычисляем наблюдаемое значение критерия : ; (8) 6) Контроль вычислений осуществляется равенством . (9) 7) Принимаем статистическое решение: гипотеза Н 0 не противоречит выборке наблюдений на данном уровне значимости , если , где − число степеней свободы, а − число параметров распределения. Если же , то гипотеза Н 0 отклоняется и может быть выдвинута другая гипотеза Н 1, которая проверяется по той же схеме.
Читайте также: IV. Допустимые элементы и фигуры для участия в турнирах по спортивным бальным танцам класса “D” танцевального мастерства в соответствии с правилами Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|