Доверительный интервал. Доверительная вероятность.
ПРИМЕНЕНИЕ ТЕОРИИ ВЕРОЯТНОСТИ К СТАТИСТИКЕ.
Оглавление. 1. Основные понятия. 2. Определение неизвестной функции распределения. 3. Определение неизвестных параметров распределения. 4. Доверительный интервал. Доверительная вероятность. 5. Применение критерия Стьюдента для сравнения генеральных совокупностей. 6. Элементы теории корреляции. 7. Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона.
Основные понятия. Математическая статистика - это раздел математики, в котором изучаются методы обработки и анализа экспериментальных данных, полученных в результате наблюдений над массовыми случайными событиями, явлениями. Наблюдения, проводимые над объектами, могут охватывать всех членов изучаемой совокупности без исключения и могут ограничиваться обследованиями лишь некоторой части членов данной совокупности. Первое наблюдение называется сплошным или полным, второе частичным или выборочным. Естественно, что наиболее полную информацию дает сплошное наблюдение, однако к нему прибегают далеко не всегда. Во-первых, сплошное наблюдение очень трудоемко, а во-вторых, часто бывает практически невозможно или даже нецелесообразно. Поэтому в подавляющем большинстве случаев прибегают к выборочному исследованию. Совокупность, из которой некоторым образом отбирается часть ее членов для совместного изучения, называется генеральной совокупностью, а отобранная тем или иным способом часть генеральной совокупности - выборочная совокупность или выборка. Объем генеральной совокупности
Объем выборки Отбор в выборку можно проводить случайным способом (по способу жеребьевки или лотереи). Либо планово, в зависимости от задачи и организации обследования. Для того, чтобы выборка была представительной, необходимо обращать внимание на размах варьирования признака и согласовывать с ним объем выборки.
2. Определение неизвестной функции распределения. Итак, мы сделали выборку. Разобьем диапазон наблюдаемых значений
Далее пусть mi - число наблюдаемых значений
которая называется статистическим рядом. Эмпирической (или статистической) функцией распределения случайной величины На практике достаточно найти значения статистической функции распределения F*(x) в точках
Следует заметить, что Часто вместо построения графика эмпирической функции распределения поступают следующим образом. На оси абсцисс откладывают интервалы
Рассмотрим функцию Таким образом на практике определяется вид неизвестной функции распределения случайной величины.
Таким образом мы получили гистограмму, которая дает наглядность. Наглядность представленных результатов позволяет сделать различные заключения, суждения об исследуемом объекте. Однако на этом обычно не останавливаются, а идут дальше, анализируя данные на проверку определенных предположений относительно возможных механизмов изучаемых процессов или явлений. Несмотря на то, что данных в каждом обследовании сравнительно немного, мы бы хотели, чтобы результаты анализа достаточно хорошо описывали бы все реально существующее или мыслимое множество (т.е. генеральную совокупность). Для этого делают некоторые предположения о том, как вычисленные на основе экспериментальных данных (выборке) показатели соотносятся с параметрами генеральной совокупности. Решение этой задачи составляет главную часть любого анализа экспериментальных данных и тесно связано с использованием ряда теоретических распределений, рассмотренных выше. Широкое использование в статистических выводах нормального распределения имеет под собой как эмпирическое, так и теоретическое обоснование. Во-первых, практика показывает, что во многих случаях нормальное распределение действительно является довольно точным представлением экспериментальных данных. Во-вторых, теоретически показано, что средние значения интервалов гистограмм распределены по закону, близкому к нормальному.
Однако следует четко представлять, что нормальное распределение - это лишь чисто математический инструмент и совсем необязательно, чтобы реальные экспериментальные данные точно описывались нормальным распределением. Хотя во многих случаях, допуская небольшую ошибку, можно говорить, что данные распределены нормально. Ряд показателей, такие как среднее, дисперсия и т.д., характеризуют выборку и называются статистиками. Такие же показатели, но относящиеся к генеральной совокупности в целом, называются параметрами. Таким образом, можно сказать, что статистики служат для оценки параметров. Генеральной средней Выборочной средней
или
если выборка имеет вид таблицы. Выборочную среднюю принимают в качестве оценки генеральной средней. Генеральной дисперсией Генеральным средним квадратическим отклонением Выборочной дисперсией Выборочное среднее квадратическое отклонение Для лучшего совпадения с результатами экспериментов, вводят понятие эмпирической (или исправленной) дисперсии Для оценки генерального среднего квадратического отклонения служит исправленное среднее квадратическое отклонение, или эмпирический стандарт
В случае, когда все значения выборки
Доверительный интервал. Доверительная вероятность. Различные статистики, получаемые результате вычислений, представляют собой точечные оценки соответствующих параметров генеральной совокупности. Если из генеральной совокупности извлечь некоторое количество выборок и для каждой из них найти интересующие нас статистики, то вычисленные значения будут представлять собой случайные величины, имеющие некоторый разброс вокруг оцениваемого параметра.
Но, как правило, в результате эксперимента в распоряжении исследователя имеется одна выборка. Поэтому значительный интерес представляет получение интервальной оценки, т.е. некоторого интервала, внутри которого, как можно предположить, лежит истинное значение параметра. Вероятности, признанные достаточными для уверенных суждениях о параметрах генеральной совокупности на основании статистик, называются доверительными. Для примера рассмотрим Известно, что если выборки извлекаются из генеральной совокупности с параметрами: то распределение выборочных средних Для такого распределения, как известно,
где С надежностью Но истинное значение параметра генеральной совокупности
Но здесь параметр
Пример. Найти доверительный интервал для оценки математического ожидания Решение. Имеем
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|