Главная | Обратная связь | Поможем написать вашу работу!

Графическое представление статистических выборок.

Более полными характеристиками выборки по сравнению с рассмотренными выше являются эмпирическая функция распределения, гистограмма и полигон.

Эмпирическая функция распределения (статистическая функция распределения, кумулятивная кривая, функция накопленных частостей) является статистическим аналогом функции распределения генеральной совокупности (теоретической функции распределения)

Эмпирическая функция распределения определяет для каждого х_i частость (статистическую вероятность) события, заключающегося в том, что исследуемая случайная величина х примет значение, меньшее х_i:

F_n (x_i) = P (x < x_i).

Статистическая вероятность F_n (x_i) = (1/n) ∑ m_z,

^z<ⁱ

где n –общее число наблюдений;

∑m _z - накопленная частота, т.е. число вариант со значением, меньшим х_i.

^z<ⁱ

Для интервального вариационного ряда эмпирическая функция раcпределения имеет вид ступенчатой кривой. Ширина каждой ступеньки соответствует длине интервала, а её высота – значению накопленной частоты.

Для дискретного вариационного ряда эмпирическая функция распределения имеет вид ломаной линии, отрезки которой соединяют точки с координатами [ x_i; F_n (x_i)]

. Гистограмма является графическим представлением интервального статистического ряда.

Гистограмму строят по следующему правилу:

- размах вариационного ряда (разность между крайними членами вариационного ряда) разбивают на ряд интервалов;

- над каждым интервалом строят прямоугольник высотой f(x_i) = m_i / n h_i,

- где m_i - число членов выборки, попавших в данный интервал; h_i - длина интервала.

Построенную таким образом гистограмму называют гистограммой

относительных частот. Площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.

Если при построении гистограммы над каждым интервалом строят прямоугольник высотой m_i /h_i, то такую гистограмму называют гистограммой частот. Площадь гистограммы частот равна сумме всех частот, т.е. объёму выборки n.

Полигон является графическим представлением дискретного статистического ряда.

Для построения полигона относительных частот необходимо соединить прямыми точки с координатами (х_i, р_i), где х_i -варианта, а р_i -её частота.

При построении полигона частот соединяют точки с координатами (х_i, m_i), где m_i -частота варианты х_i.

Иногда строят полигон и для интервального вариационного ряда, соединяя отрезками середины верхних сторон прямоугольников гистограммы.

Пример первичной обработки экспериментальных данных.

Определить основные статистические характеристики по данным ресурсных испытаний распределения наработки до предельного состояния тормозных колодок автомобиля ВАЗ–2110. Наработки (варианты) и их частоты представлены в табл.1, то есть уже произведено упорядочивание выборки (ранжирование выборки).

Таблица 1. Исходные данные

x_i, км │ m_i ║ x_i, км │ m_i ║ х_i, км │ m_i

2500 1 26000 10 52000 1

6300 3 28000 4 54500 2

9900 2 31000 7 57000 3

10100 1 33000 6 59000 1

11000 5 35000 7 64000 2

11500 5 38000 2 79500 1

14000 12 41500 3

18500 3 43500 4

22000 5 47500 3

24000 6 49100 1

2.5.1. Определяем число интервалов r и длину интервалов h:

1) число интервалов по правилу Старджеса

r = 1 + 3,3 lg n = 1 + 3,3 100 = 7,6,

где n – объём выборки,

n = ∑ m_i = 100, принимаем r = 8;

ⁱ

2)длина интервала

h = (x_max – x_min) / r = (79500 – 2500) / 8 = 9625 км.,

принимаем длины всех интервалов одинаковыми

h = 10000 км.

2.5.2. В таблице 2 заполняем первые четыре графы

Таблица 2. Расчётные данные

Номер Интервал, Середина Частота, u_i m_i u_i m_i u_i² m_i u_i³ m_i u_i⁴

интер- h_i, км. интервала, m_i

вала х_i, км.

1 2 3 4 5 6 7 8 9

1 0 ÷10000 5000 6 −3 −18 54 −162 486

2 10001÷20000 15000 26 −2 −52 104 −208 416

3 20001÷30000 25000 25 −1 −25 25 −25 25

4 30001÷40000 35000 22 0 0 0 0 0

5 40001÷50000 45000 11 1 11 11 11 11

6 50001÷60000 55000 7 2 14 28 56 112

7 60001÷70000 65000 2 3 6 18 54 162

8 70001÷80000 75000 1 4 4 16 64 256

Суммы → 100 −60 256 −210 1468

2.5.3. Вычисляем начальные и центральные эмпирические моменты.

Для удобства переходим к условным вариантам

u_i = (x_i − C) / h, где С – постоянная величина (условный нуль).

За условный нуль принимают обычно значение х_i с наибольшей частотой, или значение х_i, равноудалённое от краевых значений. Примем С = 35000 км.

Так как интервалы все равны, то h = 10000км. и

u_i = (x_i − 35000) / 10000.

Тогда

u₁ = (5000 − 35000) / 10000 =− 3; u₂ = (15000 − 35000) / 10000 = −2 и т.д.

Все u_i записываем в пятую графу таблицы 2.

Для подготовки вычислений начальных моментов определяем для каждого интервала m_i u_i, m_i u_i², m_i u³_i, m_i u_i⁴ и записываем эти результаты соответственно в шестую, седьмую, восьмую и девятую графу таблицы 2. Вычисляем начальные моменты для условных вариант (условные эмпирические моменты)

a_k = (1/n) (∑ m_i u_i^k), где k – 1, 2, 3, 4;

ⁱ

a₁ = (−60)/100 = −0,6; a₂ =256/100 = 2,56; a₃ =(−210)/100 = −2,10;

a₄ = 1468 /100 = 14,68.

Вычисляем центральные моменты для условных вариан т

μ₂ = a₂ – a₁² = 2,56 – 0,60² = 2,20;

μ₃ = a₃ – 3a₂ a₁ + 2a₁³ = – 2,10 + 3•2,56•0,60 – 2•0,60³ = 2,07;

μ₄ = a₃ – 4 a₃ a₁ + 6 a₂ a₁² – 3 a₁⁴ = 14,68 – 4•2,10•0,60 + 6•2,56•0,60² –

– 3•0,60⁴ = 14,78.

2.5.4. Выполняем обратный переход от условных вариант к действительным и определяем среднее значение наработки тормозных колодок до предельного состояния и среднее квадратическое отклонение наработки тормозных колодок до предельного состояния

x = a₁ h + C = – 0,60•10000 + 35000 = 29000км.;

s = h √ μ₂ =10000 √2,20 = 14800км.

2.5.5. Определяем коэффициент асимметрии A(x) и эксцесс E(x)

A(x) = μ₃ / μ₂^3/2 = 2,07 / (2,20)^3/2 = 0,63;

E(x) = μ₄ / μ₂² – 3 = 14,78 /(2,20)² – 3 = – 0,05.

Так как А(х) > 0, то распределение имеет положительную асимметрию,

то есть вершина кривой сдвинута влево и правая сторона более пологая.

Так как Е(х) < 0, то кривая более пологая, чем при нормальном распределении.

Вывод по ресурсным испытаниям.

Тормозные колодки ресурсные испытания не выдержали (не прошли) из-за низкой средней наработки до предельного состояния и большого значения среднего квадратического отклонения.

ВЕРОЯТНОСТНЫЕ РАСПРЕДЕЛЕНИЯ, ИСПОЛЬЗУЕМЫЕ

ПРИ АНАЛИЗЕ И РАСЧЁТАХ НАДЁЖНОСТИ

Общие замечания.

Если выборка (число объектов, подвергающихся испытаниям) растёт, то при этом мы можем от статистических закономерностей перейти к вероятностным, так как при этом

_∞

p_i → p; X → MX; σ² = D →σ² =D; MX = ∫ x f(x) dx

⁰

Выбор (построение) такого теоретического (вероятностного) распределения, которое наилучшим образом воспроизводило бы характерные признаки (особенности) экспериментального ряда, является одной из основных и часто выполняемых задач статистической обработки результатов испытаний.

Такой переход от статистической модели к вероятностному распределению необходим, если необходим прогноз развития ситуации (например, проведены испытания автомобилей до наработки 50000 км, а необходимо сделать прогноз надёжности этих машин при наработке до 100000 км).

Кроме того, переход от статистической модели к вероятностному распределению позволяет использовать статистическую информацию об аналогах при расчёте надёжности проектируемых новых устройств и систем.

C учётом того, что случайная величина в надёжности (наработка, время устранения отказа) положительна, то интегральная функция распределения

имеет вид F(x) = ∫ f(x) dx, (1)

⁰ дифференциальная функция (функции плотности распределения) имеет вид

f(x) = dF(x)/dx, (2)

_∞

при этом должны выполняться условия f(x) ≥ 0; ∫ f(x) dx = 1 (3)

⁰

Площадь под кривой плотности вероятностей над каким-нибудь участком оси абсцисс (оси наработок) представляет собой вероятность попадания случайной величины в этот участок. Поэтому для некоторого значения наработки х₁ площадь под кривой, лежащая слева от точки х₁, определяет

вероятность F(x₁) появления отказов на интервале (0; х₁), а площадь, лежащая справа от х₁, определяет вероятность P(x₁) того, что на том же интервале отказов не будет.

Можно найти различные функции, удовлетворяющие условиям (3).

При выборе функции рассматривают не любые произвольные распределения, а такие, которые однозначно определяются небольшим числом параметров. Обычно предпочтение отдают одно-, двухпараметрическим распределениям. Иногда используют распределение с тремя-четырьмя параметрами. Если из опыта определяется много параметров для одной функции распределения, то, как это эмпирически замечено, любые данные наблюдений можно подогнать под многопараметрический закон распределения, однако, он может быть далёк от физической сути описываемых явлений.

При выборе параметров законов распределения процессов и событий необходимо прежде всего учитывать физическую сущность этих явлений. Хотя в математике и существуют различные критерии (см. критерии согласия в разделе 7 настоящего пособия) проверки соответствия выбранного теоретического распределения и экспериментального распределения, однако, следует иметь в виду, что процедура проверки гипотезы о виде функции распределения по любому из критериев является проверкой на отвержение, а не на принятие гипотезы. Эта процедура даёт возможность получить ответ только одного из двух типов: 1) нет достаточно серьёзных оснований отвергнуть гипотезу; 2) есть достаточно серьёзные основания отвергнуть гипотезу.

При анализе надёжности (времени безотказной работы, времени восстановления, и т. д.) используют различные непрерывные и дискретные распределения: нормальное, экспоненциальное, логарифмически-нормальное, гамма распределение, распределение Вейбулла, хи-квадрат распределение, распределение Рэлея, распределение Рейса, распределение Эрланга, распределение Пуассона, биномиальное, равномерное и др.

Разные условия связи элементов в объекте, физической сущности отказов и особенностей восстановления приводят к различным распределениям.

Ниже приведены основные сведения по наиболее употребительным распределениям, используемым при анализе и расчётах надёжности колёсных и гусеничных машин.

3.2.Нормальное распределение является основным распределением математической статистики. Образуется тогда, когда действует большое число относительно равноправных факторов. В теории надёжности нормальное распределение принимают как распределение наработки отказов элементов вследствие износа и старения (постепенных отказов), когда коэффициент вариации v = s/x не превышает примерно 0,3 – 0,4.

Для нормального распределения:

плотность распределения f(x) = (1/σ√2π)/ exp [- (x – x)² / 2σ² ], (4)

где x = M[x]; σ²= D[x];

функция распределения

F(x) =(1/σ√2π) ∫ exp [ - (x – x)² / 2σ² ] dx (5)

⁰

Вероятность безотказной работы можно определить, воспользовавшись тем свойством, что сумма вероятности отказа и вероятности сохранения работоспособности равна 1, т.е. F(x) + P(x) = 1.

Если имеем кривые вероятности F(x) или P(x), то можно решать различные практические вопросы.

Например, если требуется, чтобы вероятность сохранения работоспособности была не ниже [P(x)], то, воспользовавшись этими кривыми вероятностей, можем определить, что наработка при этом не должна превышать х₁. Для подсчёта вероятности того, что случайная величина, распределённая по нормальному закону, находится в тех или иных пределах, пользуются табулированным интегралом

Ф(t) = (1/√2π) ∫ exp (- t² /2) dt, (6)

где ⁰

t = (x – x)/σ; dt = dx/σ.

Вероятность того, что случайная величина при испытаниях примет значение в пределах от х₁ до х₂:

P (x₁ < x < x₂) = Ф(t₂) – Ф(t₁) = Ф[ (x₂ –x)/σ] – Ф[ (x₁ – x)/σ]. (7)

Табличный интеграл Ф(t) соответствует площади под кривой, заключённой между осью симметрии и ординатой, соответствующей значению t, и определяет вероятность того, что значение случайной величины находится в пределах от 0 до t. Так, например, для х = 3σ и t = 3 из таблиц значений интеграла вероятностей Ф(t) находим, что Ф(3) = 0,49865, т.е. 2Ф(3) = 0,997, и, следовательно, подтверждается, что с вероятностью 0,997 случайная величина лежит в пределах ±3σ.

3.3.Экспоненциальное распределение является распределением времени между независимыми событиями, появляющимися с постоянной интенсивностью. В теории надёжности экспоненциальное распределение описывает распределение внезапных отказов.

При рассмотрении внезапных отказов элементов изделия исходят из того, что каждый такой отказ является следствием случайного неблагоприятного сочетания внешних и внутренних факторов и может не зависеть от состояния элемента (например, отказ из-за прокола шины при наезде на гвоздь мало зависит от того, новая это шина или изношенная).

Экспоненциальное распределение применяют также для описания наработки сложных систем, прошедших период приработки, и для описания времени безотказной работы системы с большим числом последовательно соединённых элементов, если каждый из элементов в отдельности не оказывает большого влияния на отказ системы.

Плотность распределения

f(x) = λ exp (- λx), (8)

где λ – параметр распределения, λ= 1/M[x].

Функция распределения

1 – exp (- λx), x ≥ 0;

F(x) = { (9)

0, х < 0.

Здесь, как и для всех законов распределения при их использовании для описания распределения времени работы до отказа, функция распределения

F(x) = P(X < x) определяет вероятность отказа изделия до наступления наработки х. Вероятность безотказной работы в течение наработки х будет P(x) = 1 – F(x). Подставляя значение F(x), получим (при х = t)

P(t) = exp (- λt) (10)

Математическое ожидание и дисперсия

М[x] = 1/λ; σ² [x] = 1/λ², (11)

Таким образом, математическое ожидание М[x] и среднее квадратическое отклонение σ для экспоненциального закона распределения равны между собой, что является существенным при проверке соответствия экспериментального распределения выбранному теоретическому экспоненциальному распределению.

3.4.Логарифмически – нормальное распределение – это распределениеслучайной величины, логарифм которой распределён по нормальному закону. Применяют, когда значение случайной величины составляет случайную долю ранее наблюдавшегося явления.

В теории надёжности логарифмически – нормальное распределение используют для описания: процессов восстановления; износовых отказов, когда приращение износа пропорционально мгновенному значению износа; наработки при быстром “выгорании” ненадёжных элементов; отказов, появляющихся в результате усталости материала.

Плотность вероятности по этому распределению

1/(σx√2π) exp [ - (ln x – a)² /2σ² ], при х ≥ 0;

f(x) = { (12)

0, при х < 0.

σ > 0; ─ ∞ < a < ∞.

Функция распределения

_х

F(x) = (1/ σ√2π) ∫ (1/x) exp [ - (lnx – a)² /2σ² ] dx.

⁰

Математическое ожидание и дисперсия

M[x] = e ^a+σ/2; D[x] =[ exp (2a + σ²)] (exp σ² - 1). (13)

3.5.Гамма-распределение является основным распределением математической статистики для случайных величин, ограниченных с одной стороны (0 ≤ х < ∞). Когда α – целое число, гамма–распределение описывает время, необходимое, для появления ровно α событийпри условии, что они независимы и появляются с постоянной интенсивностью λ.

Гамма-распределение служит для описания: износовых отказов, отказов вследствие накопления повреждений, наработки системы с резервными элементами, распределения времени восстановления.

При различных параметрах гамма-распределение принимает самые разнообразные формы, что и объясняет его широкое распространение.

Плотность вероятности гамма-распределения

[λ^α/Г(α)] x^α^–1 е^–^λх, х≥ 0;

f(x) = { (14)

0, х< 0

при λ > 0; α > 0.

Функцию распределения

_х

[λ^α/Г(α)] ∫x^α^–1 е^–^λх dx, х≥ 0;

F(x) = { ⁰ (15)

0, x< 0

при λ> 0; α> 0 называют неполной гамма-функцией.

Математическое ожидание и дисперсия

M[x] = α/λ; D[x] = α/λ². (16)

При изменении параметра λ форма распределения не изменяется, а меняется только масштаб, при изменении α изменяется форма распределения; таким образом, α – параметр формы, λ – параметр масштаба.

При α < 1 интенсивность отказов монотонно убывает, что соответствует ситуации, когда происходит быстрое «выгорание ненадёжных элементов».

При α > 1 интенсивность отказов возрастает, что характерно для постепенных изнашиваний и старения элементов.

При α = 1 гамма-распределение совпадает с экспоненциальным, при α > 10 гамма-распределение практически совпадает с нормальным распределением.

Если α – произвольное целое положительноечисло, то такое гамма-распределение называют распределением Эрланга.

Если λ = ½, а значение α кратно ½, то гамма-распределение совпадает с распределением ХИ-квадрат (χ² – распределение). Таким образом, распределение ХИ-квадратс однопараметрическое.

Целое число γ = 2α обычно называютчислом степеней свободы. Распределение ХИ-квадрат является одним из критериев проверки согласия эмпирических данных с гипотетической функцией распределения F(x).

3.6. Распределение Вейбулла используют для описания характеристик усталостной прочности металла. В теории надёжности оно является наиболее общим распределением времени безотказной работы элементов, времени работы до предельного состояния машин, для описания распределений сроков службы других различных устройств.

Плотность вероятности распределения Вейбулла

f(t) = b/a (t/a)^b–1 exp [ – (t/a)^b ] (17)

при a> 0; b> 0.

Функция распределения

F(t) = 1 – exp [ – (t/a)^b ]. (18)

Математическое ожидание и дисперсия

M[t] = aK_b; σ[t] = aC_b, (19)

где

К_b= Г(1 + 1/b); C²_b= Г(1 + 2/b) –K²_b.

При b = 1 распределение Вейбулла совпадает с экспоненциальным распределением.

⇐ Предыдущая 123 Следующая ⇒

Воспользуйтесь поиском по сайту: