Распределение Стьюдента.
· Биномиальный закон распределения.
Пусть производится n независимых испытаний, в каждом из которых событие А может появиться либо не появиться. Вероятность наступления события во всех испытаниях постоянна и равна р (тогда вероятность непоявления q= 1 -p). Рассмотрим в качестве дискретной случайной величины Х число появлений события А в этих испытаниях. Поставим перед собой задачу: найти закон распределения величины Х. Для ее решения требуется определить возможные значения Х и их вероятности. Очевидно, событие А в n испытаниях может либо не появиться, либо появиться 1 раз, либо 2 раза, …, либо n раз. Таким образом, возможные значения Х таковы: , , , …, . Остается найти вероятности этих возможных значений, для чего достаточно воспользоваться формулой Бернулли (1654-1705, его работы способствовали развитию применений только что возникших дифференциального и интегрального исчислений; название «интеграл» впервые появилось в трудах Якоба Бернулли) (по ней находится вероятность появления k раз события А в n испытаниях): , . (*) Формула (*) и является аналитическим выражением искомого закона распределения. Биномиальным называется распределение вероятностей, определяемое формулой Бернулли. Закон назван «биномиальным» потому, что правую часть равенства (*) можно рассматривать как общий член разложения бинома Ньютона: . Таким образом, первый член разложения определяет вероятность наступления рассматриваемого события n раз в n испытаниях; второй член определяет вероятность наступления события n- 1 раз;…; последний член определяет вероятность того, что событие не появится ни разу. Напишем биномиальный закон в виде таблицы:
Таблица 11.3
Пример: [3] В партии 10% нестандартных деталей. Наугад отобраны 4 детали. Написать биномиальный закон распределения дискретной случайной величины Х – числа нестандартных деталей и построить многоугольник полученного распределения. Биномиальный закон действует и в биологических совокупностях: по нему распределяются альтернативные, дискретно варьирующие признаки. Для примера возьмем соотношение между численностью мужских и женских особей в популяциях животных, которое равно примерно 1:1 или приближается к этому отношению. Какова вероятность, что из 10 новорожденных три окажутся мужского пола? По условию задачи имеем: k =3, n =10, p = q =1/2, откуда . Если вычислить вероятности всех возможных случаев осуществления ожидаемого события, т.е. вероятность появления мужского пола в каждом из 10 случаев появления на свет потомства, то результаты распределяются следующим образом: Таблица 11.4
Видно, что с увеличением числа m вероятность сначала быстро возрастает, достигая максимума при , а затем в такой же последовательности убывает. Эти данные показывают, что слишком мала вероятность ожидать, чтобы все десять новорожденных оказались мужского пола. Наиболее вероятный исход – равное отношение полов среди новорожденных. Формула Бернулли дает абсолютно точный ответ для вероятности . Но, при больших n, абсолютная точность не упрощает, а усложняет получение ответа в большинстве приложений. Но раз точные ответы для вероятности вычислить сложно, то, может быть, существуют те или иные способы приближенных вычислений? Да, такие приближения действительно возможны! Более того, удивительным образом оказалось, что в огромном числе различных ситуаций все эти приближения могут быть произведены с помощью одной-единственной функции , с которой мы познакомимся чуть позже.
· Закон распределения Пуассона.
Пусть производится n независимых испытаний, в каждом из которых вероятность появления события А равна р. Для определения вероятности k появлений события в этих испытаниях используют формулу Бернулли. Если же n велико, то пользуются асимптотической формулой Лапласа (1749-1827, крупнейший французский математик, механик и астроном. Отношение Пьера Симона Лапласа к науке ярко передает следующий эпизод. Когда Наполеон, бывший большим почитателем таланта Лапласа, обратился к ученому с вопросом, почему в опубликованной им «Небесной механике» нет даже упоминания о боге, Лаплас ответил фразой, ставшей впоследствии знаменитой: «Эта гипотеза мне не понадобилась»). Однако эта формула непригодна, если вероятность события мала (). В этих случаях (n велико, р мало) прибегают к асимптотической формуле Пуассона (1781-1840, выдающийся французский математик и физик). Итак, поставим перед собой задачу найти вероятность того, что при очень большом числе испытаний, в каждом из которых вероятность события очень мала, событие наступит ровно k раз. Сделаем важное допущение: произведение np сохраняет постоянное значение, а именно . Это означает, что среднее число появлений события в различных сериях испытания, т.е. при различных n, остается неизменным. Воспользуемся формулой Бернулли для вычисления интересующей нас вероятности: . Так как , то . Приняв во внимание, что n имеет очень большое значение, вместо найдем . При этом будет найдено лишь приближенное значение отыскиваемой вероятности: n хотя и велико, но конечно, а при отыскании предела мы устремим n к бесконечности. Заметим, что поскольку произведение np сохраняет постоянное значение, то при вероятность . Итак, . Таким образом, . Эта формула выражает закон распределения Пуассона вероятностей массовых (n велико) и редких (р мало) событий. Пример: [4]Завод отправил на базу 5000 доброкачественных изделий. Вероятность того, что в пути изделие повредится, равна 0,0002. Найти вероятность того, что на базу прибудут 3 негодных изделия. Имеются специальные таблицы, пользуясь которыми можно найти , зная k и (см. Приложение 3). Обратите внимание на то, что чем больше , тем больше m, для которых значения вероятностей не равны нулю, т.е. тем длиннее таблица.
Распределение Пуассона часто используется, когда мы имеем дело с числом событий, появляющихся в промежутке времени или пространства. Оно описывает число событий k, происходящих за одинаковые промежутки времени при условии, что события происходят независимо друг от друга с постоянной средней интенсивностью. Например, число покупателей, посетивших супермаркет в течение часа, число аварий на отрезке дороги, число дефектов на участке водопровода, число посетителей музея в неделю. Формула Пуассона описывает также очень многие явления, с которыми биологи встречаются в своей работе. Наиболее часто такие редкие случайные события наблюдаются в области микробиологии, радиобиологии, биофизики и других отраслях биологической науки.
· Равномерный закон распределения.
При решении задач, которые выдвигает практика, приходится сталкиваться с различными распределениями непрерывных случайных величин. Плотности распределений непрерывных случайных величин называются также законами распределений. Равномерное распределение непрерывной случайной величины встречается в тех ситуациях, когда мы имеем дело с различными циферблатами (часы, весы, физические приборы и т.д.). Также равномерное распределение возникает как распределение ошибок при округлении чисел. Распределение вероятностей называется равномерным, если на интервале [ a; b ], которому принадлежат все возможные значения случайной величины, плотность распределения сохраняет постоянное значение, а вне его равна нулю: Так как все возможные значения случайной величины принадлежат интервалу [ a; b ], то должно выполняться соотношение или , тогда . Тогда искомая плотность вероятности равномерного распределения График плотности равномерного распределения: Рис. 11.3 [4, с. 123]
Найдем функцию распределения F (x) на отрезке [ a; b ]: . Тогда График функции равномерного распределения: Рис. 11.4 [4, с. 123]
Для того чтобы случайная величина подчинялась закону равномерного распределения необходимо, чтобы ее значения лежали внутри определенного интервала, и внутри этого интервала значения этой случайной величины были бы равновероятны. Вероятность попадания случайной величины в заданный интервал: . Пример: [10] Непрерывная случайная величина задана функцией распределения Найти: 1) значение А; 2) вероятность того, что в результате испытания Х примет значение в интервале (0;2); 3) плотность вероятности .
· Показательный закон распределения.
Показательное распределение встречается, когда имеют дело с распределением времени совершенно случайных событий. Показательным (экспоненциальным) называется распределение вероятностей непрерывной случайной величины Х, которое описывается плотностью где - постоянная положительная величина. Мы видим, что показательное распределение определяется одним параметром . Эта особенность показательного распределения указывает на его преимущество по сравнению с распределениями, зависящими от большего числа параметров. Найдем функцию распределения показательного закона: .
Таким образом, .
Графики плотности вероятности и функции распределения приведем на рисунке: Рис. 11.5 [10, с. 143]
Пример: [4] Написать плотность и функцию распределения показательного закона, если параметр =8.
Найдем вероятность попадания в интервал (а; b) непрерывной случайной величины Х, которая распределена по показательному закону, заданному функцией распределения . Используем формулу . Учитывая, что , , получим . Пример: [4] Непрерывная случайная величина Х распределена по показательному закону . Найти вероятность того, что в результате испытания Х попадает в интервал (0,3;1).
· Нормальный закон распределения.
Нормальный закон занимает центральное место в теории вероятностей. Это обусловлено тем, что этот закон проявляется во всех случаях, когда случайная величина является результатом действия большого числа различных факторов. К нормальному закону приближаются все остальные законы распределения. Оказывается, что такому же закону распределения подчиняется распределение и горошин по размеру, и новорожденных младенцев по весу, и частиц газа по скоростям движения, и огромное количество других явлений окружающего мира. Подобно тому, как графики всех парабол получаются с помощью преобразований из одной-единственной параболы , так и все эти кривые распределения получаются из одной-единственной кривой. Ее называют кривой нормального распределения или, в честь немецкого математика Карла Гаусса, гауссовой кривой – она изображена на рисунке:
Рис. 11.6 [8, с. 74]
Для наглядной демонстрации нормального (гауссова) закона распределения иногда используют специальное устройство, названное по имени его изобретателя доской Гамильтона. В нем падающие сверху шарики распределяются между правильными шестиугольниками и в результате попадают на горизонтальную поверхность, образуя картинку, похожую на «подграфик» гауссовой кривой. Вот еще одна иллюстрация нормального закона распределения. Пассажиры метро бегут по переходу, выходящему на середину станции. Бегут они на поезд, стоящий напротив выхода из перехода. Платформа, у которой стоит поезд, равномерно разделена колоннами. Ясно, что большинство пассажиров войдет в средние вагоны, а по мере удаления вагонов от центра количество садящихся в них людей будет уменьшаться. Распределение пассажиров по вагонам снова напоминает нормальное, или гауссово, распределение. Рис. 11.8 [8, с. 76] Напомним, что выше говорилось о возможности использования функции для приближенных вычислений вероятности в испытаниях, проводимых по схеме Бернулли.
Пример: [8] Вероятность рождения мальчика примем равной 50%. Найти вероятность того, что среди 200 новорожденных будет ровно: а) 110 мальчиков; б) 80 мальчиков. Рассмотрим внимательнее неравенство из первого пункта приведенного алгоритма. Так как q =1- p, то pq = p (1- p) и наибольшее значение этого квадратичного выражения (относительно ) достигается при p =0,5. Само наибольшее значение равно 0,25. Значит, 0,25 n npq >10. Поэтому 0,25 n >10, т.е. n >40. Следовательно, указанный алгоритм дает хорошую точность приближения, когда данное испытание независимо повторяется, как минимум, несколько десятков раз. На практике чаще всего рассматривают сотни повторений. При меньшем числе повторений точность приближения ухудшается. Рассмотрим пример, в котором сравним точные вычисления по теореме Бернулли и приближенные вычисления с помощью кривой нормального распределения. Пример: [8] Какова вероятность того, что при 10 бросаниях игрального кубика «четверка» выпадет ровно три раза? В общем виде нормальным называется распределение вероятностей непрерывной случайной величины, которое описывается плотностью . Мы видим, что нормальное распределение определяется двумя параметрами а и . График плотности нормального распределения называется нормальной кривой (кривой Гаусса). Рис. 11.9 [7, с. 86] - Изменение величины параметра а не изменяет формы нормальной кривой, а приводит лишь к ее сдвигу вдоль оси Ох. График функции симметричен относительно прямой х=а. - С возрастанием максимальная ордината нормальной кривой убывает, а сама кривая сжимается к оси Ох; при убывании нормальная кривая становится «островершинной» и растягивается в положительном направлении оси Оy. Напомним, что при а =0 и нормальную кривую называют нормированной (гауссовой кривой). Величину называют стандартно нормальной. Найдем функцию нормального распределения : . Подстановкой интеграл приводится к виду . Поэтому для удобства вводится нечетная функция , называемая функцией Лапласа. График этой функции представлен на рисунке: Рис. 11.10 [8, c. 97] Для значений функции Лапласа имеются подробные таблицы, одна из которых приведена в Приложении 2. Графически функция так связана с : если х 0, то значение равно площади «под гауссовой кривой» на отрезке от х до 0: Рис. 11.11 [8, c. 96]
Вероятность попадания в интервал непрерывной случайной величины, распределенной по нормальному закону, можно найти с помощью функции Лапласа по формуле: . Пример: [4] Случайная величина Х распределена по нормальному закону ( =10, а =30). Найти вероятность того, что Х примет значение, принадлежащее интервалу (10,50).
Пример: [4] Используя таблицу значений функции , найдите: a) b) c) х, если х >0 и =0,1781; d) х, если х <0 и =0,0116.
Пример: [4] Используя таблицу значений функции , найдите: a) b) c) d)
Пример: [4] Используя таблицу значений функции , найдите х, если известно, что: a) =0,3461; b) =0,4441; c) =0,004; d) =0,4901.
· Распределение Пирсона (хи-квадрат).
Нормальное распределение является исключительным в теории вероятностей, поскольку при достаточно общих условиях многие распределения стремятся по вероятности к нормальному. Кроме рассмотренных законов распределения непрерывной случайной величины, на практике чаще всего применяют два «специальных» закона распределения, получаемые из нормального – распределения Пирсона (хи-квадрат) и Стьюдента. Карл Пирсон был сыном юриста и изучал математику в Кембриджском университете. Значительную часть своих усилий он употребил на разработку и применение статистических методов в биологии. Он считается одним из отцов современной статистики. В молодости у него появился интерес к проблемам наследственности, общим вопросам биологии и возможности применения методов статистики для их изучения. Пусть независимые случайные величины являются стандартно нормально распределенными величинами, т.е. где . Тогда сумма квадратов этих величин распределена по закону (хи-квадрат) с k степенями свободы. Распределение хи-квадрат определяется одним параметром – числом степеней свободы k. Значения - распределения, зависящие лишь от степени свободы, табулированы (см. Приложение 4).
· Распределение Стьюдента.
Распределение Стьюдента было введено в 1908 г. английским статистиком В. Госсетом, работавшим на пивоваренных заводах Гиннесса. Одна из его обязанностей заключалась в том, чтобы анализировать поступающие друг за другом партии бочонков только что сваренного портера. Госсет экспериментировал с идеей существенного сокращения числа проб, отбираемых из очень большого количества бочек, находящихся на складах пивоварни, для выборочного контроля качества портера. Вероятностно-статистические методы использовались для принятия экономических и технических решений на этой фабрике, поэтому ее руководство запрещало В. Госсету публиковать научные статьи под своим именем. Таким способом охранялась коммерческая тайна, «ноу-хау» в виде вероятностно-статистических методов, разработанных В. Госсетом. Однако он имел возможность публиковаться под псевдонимом «Стьюдент». История Госсета-Стьюдента показывает, что еще сто лет назад менеджерам Великобритании была очевидна большая экономическая эффективность вероятностно-статистических методов. Пусть Z и V – независимые случайные величины, причем а . Тогда распределение случайной величины называется t -распределением Стьюдента с k степенями свободы. Характерным для t -распределения Стьюдента оказывается то, что оно строго симметрично относительно нулевой точки в системе координат, где =0; оно зависит от двух величин: нормированного отклонения и объема выборки , который берется числом степеней свободы; степень различия -распределения Стьюдента от нормального распределения определяется только числом степеней свободы k; с увеличением распределение Стьюдента быстро приближается к нормальному с параметрами а =0 и =1 и уже при практически не отличается от него. Таблица 11.5
В таблице приведены значения функции нормального распределения и распределения Стьюдента для разных значений (значения функции даны трехзначными числами после запятой). Из этой таблицы видно, что, начиная с =30, распределение критерия Стьюдента практически уже не зависит от . Наглядное представление об особенностях -распределения дает рисунок, на котором на фоне нормальной кривой (менее плоской) нанесена кривая -распределения при =3. Рис. 11.12 [6, с. 104] Таким образом, распределение Стьюдента – это всего лишь частный случай нормального распределения; оно отражает специфику малой выборки, распределяющейся по нормальному закону в зависимости от . Для практических расчетов, связанных с распределением Стьюдента, составлена специальная таблица, облегчающая решение практических задач (см. Приложение 5).
Читайте также: Барометрическая формула. Распределение Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|