Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Вычисление параметров распределения

Семь инструментов контроля качества.

Гистограммы

Вычисление параметров распределения

Проанализировать результаты статистических данных о возрасте пострадавших от травм и несчастных случаев при различных видах деятельности

1) Обработать данные, разбив их на диапазоны с границами 13-17, 18-22 и т.д.

2) Вычислить параметры распределения несчастных случаев: среднее арифметическое, моду, медиану, СКО, размах.

3) Построить гистограмму значений, пользуясь диапазонами с теми же границами.

4) Прокомментировать форму гистограмм, сделать выводы.

5) Определить предельные значения, в которых находится примерно 95 % наблюдений (95 %-е доверительные пределы).

6) Сравнить «диапазон» наблюдений с предельными значениями, содержащимися в пределах 3-х стандартных отклонений (СКО) от среднего арифметического.

 

Таблица 1- Возраст пострадавших от травм и несчастных случаев при различных видах деятельности

 

           
           
           
           
           
           
           
           
           
           
           
           

Решение:

1. Определяются наибольшее Xmax и наименьшее Xmin значения из всех полученных данных и вычисляется размах R:

R =Xmax - Xmin=81-14=67

Размах характеризует разброс контролируемой величины, он определяет ширину гистограммы.

2.Обрабатываем данные, разбив их на диапазоны с границами 13-17, 18-22 и т.д. (табл.2).По полученным данным строится гистограмма - столбчатая диаграмма,высота столбиков которой соответствует частоте (рис.1).

Таблица 2 – Диапазоны значений

Номер интервала, j Диапазон Частота mj
Xi min Xi max
1.      
2.      
3.      
4.      
5.      
6.      
7.      
8.      
9.      
10.      
11.      
12.      
13.      
14.      

3. Полезную информацию о возможном характере распределения можно получить, взглянув на рис.2 (а-ж). Формы, представленные на этом рисунке, типичны, и ими можно воспользоваться как образцами при анализе гистограмм.

Рис. 1 Гистограмма


 


а) Обычный тип(симметричный). Гистограмма с таким распределением встречается чаще всего. Она указывает на стабильность процесса.
б) Гребенка(мультимодальный тип). Здесь классы через один имеют более низкие частоты. Такая форма встречается, когда число единичных наблюдений, попадающих в класс, колеблется от класса к классу или, когда действует определенное правило округления данных.
в) Положительно (отрицательно) скошенное распределение.Среднее значение гистограммы локализуется слева (справа) от центра размаха. Частоты довольно резко спадают при движении влево (вправо) и, наоборот, медленно вправо (влево). Такая (асимметричная) форма встречается, когда невозможно получить значения ниже определенного, например для диаметра деталей и т.д.
г) Распределение с обрывом слева (справа).Это одна из тех форм, которые часто встречаются при 100%-ном контроле изделий из-за плохой воспроизводимости процесса, а также когда, например, отобраны и исключены из партии все изделия с параметрами ниже контрольного нормативы (или выше, или и те и другие).
д) Плато (равномерное и прямоугольное распределение). Такая гистограмма получается в случаях, когда объединяются несколько распределений, в которых средние значения имеют небольшую разницу между собой. Анализ такой гистограммы целесообразно проводить, используя метод расслоения.
е) Двухпиковый тип(бимодальный тип). Такая форма встречается, когда смешиваются два распределения с далеко отстоящими средними значениями, например, в случае наличия разницы между двумя видами материалов, двумя операторами и т.д. В этом случае можно провести расслоение по двум видам фактора, исследовать причины различия и принять соответствующие меры для его устранения.
ж) Распределение с изолированным пиком. Рядом с распределением обычного типа появляется маленький изолированный пик. Это форма появляется при наличии малых включений данных из другого распределения, появления ошибки измерения или просто включения данных из другого процесса.

Рис. 2 Формы гистограмм

 

По результатам анализа гистограммы можно сделать вывод, что в нашем случае получился двухпиковый тип(бимодальный тип). Такая форма встречается, когда смешиваются два распределения с далеко отстоящими средними значениями, например, в случае наличия разницы между двумя видами материалов, двумя операторами и т.д. В этом случае можно провести расслоение по двум видам фактора, исследовать причины различия и принять соответствующие меры для его устранения

 

 

В качестве характеристик, получаемых в результате измерений значений иссле­дуемого параметра, используют числовые характеристики, которые называютсяста­тистическими мерами (см. рис. 3). Статистические меры служат для описания и сравнения получаемых эмпириче­ских распределений. Важнейшей и чаще всего применяемой на практике статистической характери­стикой является мера положения, которая определяет положение центра группиро­вания исследуемого параметра на числовой оси. Мера положения определяется средним значением параметра, описывающим одним числом результаты некоторого ряда измерений. Для статистических исследований на практике используют следующие средние значения: среднее арифметическое, медиана, мода и среднее геометрическое. Параметр, характеризующий ширину распределения исследуемого признака на числовой оси, называетсямерой рассеяния. К мерам рассеяния эмпирического рас­пределения относятся размах, дисперсия и среднеквадратическое отклонение.

Рис. 3. Классификация статистических мер

4. Среднее арифметическое или математическое ожидание рассчитывается по формуле где n- количество случайных величин

n= 6·12=72 (6-количество столбцов, 12- количество строк),

Xi – значения случайных величин (см табл.3).

 

Таблица 3 - Расчет суммы значений случайных величин

  1. 2. 3. 4. 5. 6.
1.            
2.            
3.            
4.            
5.            
6.            
7.            
8.            
9.            
10.            
11.            
12.            
Сумма            
Общая сумма  

5.Медиана - серединное значение.

Важной характеристикой эмпирического распределения для ря­да измерений исследуемого параметра является медиана или срединное значение. Если имеется ряд измерений объемом n, то для вычисления медианы необходимо все значения результатов измерений расположить в порядке возрастания или убы­вания. Если число результатов измерений будет нечетным числом (n=2k+l), то медиа­ной будет член упорядоченного ряда под номером: k+1, При четном числе результатов измерений (n=2k) медианой будет полусумма двух членов упорядоченного ряда под номерами k и k+1:

 

 

Таблица 4 - Нахождение медианы и моды

n i                                                                        
Х i               24 24 24 24 24                                                
                5                          
mj            
                                                                         
n i                                                                        
Х i                                                                          
                                                 
mj                  

 

В данном случае n= 6·12=72 – чётное число результатов наблюдений. При четном числе результатов измерений (n=2k) медианой будет полусумма двух членов упорядоченного ряда под номерами k и k+1:

где k= 72/2=36, а k+1=36+1=37, соответственно Xk = X36 =39, а Xk+1 = X37 =40 и

 

6. Мода М0. это наиболее часто встречающееся значение случайной величины. Возможно, что среди полученных значений имеется не одна, а две или более мод. Такое распределение называют двумодальным или полимодальным. Возможно, что распределение не имеет моды, это равномерное распределение. По таблице 4 находим наиболее часто встречающееся значение дискретной случайной величины. М0=24.

 

7. Дисперсия с реднее значение квадратов отклонений

Среднеквадратическое отклонение - квадратный корень из дисперсии.

20,0544

 

Таблица 1- Возраст пострадавших от травм и несчастных случаев при различных видах деятельности

           
           
           
           
           
           
           
           
           
           
           
           

Решение:

5. Предельные значения, в которых находится примерно 95 % это границы 2σ μ - 2σ и μ + 2σ ( - 2S и + 2S), которые охватывают 95,44% всех значений.

- 2S=45.375 – 2*20,0544=5,2662

+ 2S=45.375 + 2*20,0544=85,4838

6. Между 3σ границами (μ - 3σ; μ + 2σ) находится 99,73% всех наблюдений. Всего n= 6·12=72 (6-количество столбцов, 12- количество строк).

72·0,9973=71,8 наблюдений - 3S=45.375 -3*20,0544= -14,7882 + 3S=45.375 +3*20,0544= 105,5382 Δ=105,5382-(-14,7882)=120,3264 R =Xmax - Xmin=81-14=67  

Вывод: Законы распределения определяются физическим содержанием случайной величины и для многих случаев они могут быть найдены в результате теоретического анализа. Однако при таком анализе не могут быть учтены многочисленные факторы, неизбежно оказывающие влияние на эту величину. Поэтому реальные законы распределения всегда несколько отличаются от теоретических.

 

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...