Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Графический анализ. Диаграмма «Короб с усами».




Проверка согласованности данных с нормальным распределением

 

Программ РAST (путь)

1) Ввод данных:

Выделите необходимые столбцы, скопируйте, перейдите в рабочее меню программы PAST, на вкладке Edit выберите команду Paste. Также можно использовать стандартные команды обмена данными (Ctrl + C; Ctrl + V). Для того, чтобы присвоить столбцам имена, отметьте флажок Edit labels. Поля в первой строке станут доступными для изменения. Введите имена столбцов. Снимите флажок.

Ваша форма должна выглядеть так, как показано на рис.1.

 

 

Рисунок 1 Ввод данных в программу PAST.

 

2) Гистограмма.

На главном меню найдите вкладку Plot(график). Эта вкладка содержит все возможные графики, которые строятся в программе PAST. Выделите нужный столбец, выберите Histogram. Откроется форма, представленная на рисунке 2. Отметьте флажок Fit normal, для того чтобы отобразилась кривая распределения.

 

Рисунок 2 Гистограмма для первой выборки

 

X Start и X End – соответственно наименьшее и наибольшее значение в исследуемой выборке.

Bins – количество столбцов. Здесь столбцы обозначают количество наблюдений в определенном интервале.

 

Проанализируйте получившийся график. Насколько кривая приближается к нормальному распределению?

 

Закройте окно с диаграммой.

 

3) Сравнение значений с нормальным распределением.

Откройте вкладку Plot. Команда Normal probability plot.

Проанализируйте график: красная линия изображает нормальное (гауссово) распределение. Чем ближе точки к данной линии, тем больше распределение выборки приближается к нормальному. См Рисунок 3.

 

Рисунок 3 График сравнения значений с нормальным распределением.

 

Анализ по критериям. Для проверки согласованности закона распределения используются следующие критерии:

Шапиро – Уилкоксона – наиболее мощный критерий;

Жарка – Бера – критерий проверки симметрии распределения:

Монте – Карло

Хи – квадрат – для выборок большого объема.

Выделите столбец с данными. Выберите: Past – Statistics - Normality test.

 

 

Таблица 1. Критерии согласованности с нормальным распределением.

 

N, объем выборки.  
Shapiro-Wilk W 0,933
p(normal) 0,1971
Jarque-Bera JB 0,8963
p(normal) 0,6388
p(Monte Carlo) 0,4794
Chi^2 0,57895
p(normal) 0,44673
Chi^2 OK (N>20) NO

 

 

Проанализируйте получившиеся p – значения. Если величина p <0,05, то распределение выборки отлично от нормального. Наиболее показательно p- значение для критерия Шапиро – Уилкоксона, но и p- значения для других критериев стоит учитывать. Для нашего примера критерии представлены в таблице 1. Мы видим, что p – значения достаточно велики, что бы утверждать о нормальном распределении выборки.

 

Далее определим, насколько отличаются наши выборки, иными словами, можно ли утверждать о принадлежности данных по матерям и детям к разным генеральным совокупностям. Для этого проведем графический анализ с помощью диаграммы «boxplot».

Графический анализ. Диаграмма «Короб с усами».

Программа InStat

  1. По умолчанию количество строк в каждом столбце 100. Однако количество данных скорее всего гораздо больше 100. Чтобы увеличить количество строк необходимо: Manage — Resize Worksheet. В появившемся окне (Рисунок 4) изменить 100 в графе Length на необходимое значение (максимальное количество в большей выборке)
  2. Вставьте свои данные в соответствующие столбцы.

Рисунок 4 Окно для изменения длины столбца (количества строк)

  1. На вкладке Graphics, выберете Boxplot
  2. Отметьте флажки, как показано на рисунке 4:

· Данные (Plot data points)

· Размах значений (with jitter)

· Усы (show outliers)

· Доверительный интервал для медиан (Show confidence limits for medians)

· Соединить медианы (Connect medians)

· Средние значения(Show means)

· Доверительный интервал для средних (Show 1 devs from mean)

 

Рисунок 5 Окно для построения «Короба с усами»

 

На полученном графике (рисунок 6), точкам соответствуют данные выборок. Голубые прямоугольником («коробом») обозначен интервал от первой до третьей квартили.

Медиана изображена синей пунктирной линией.

Короткая жирная линия указывает на среднее значение по выборке, а зеленые короткие черточки – доверительные интервалы для средних.

Так как объем выборок большой, то данные могут полностью закрыть «короб с усами». Для редактирования размера точек: Chart – Series. В появившемся окне Editing (Рисунок 6) надо выбрать X1, проконтролируйте обозначение — серая точка.

Рисунок 6 Окно для редактирования графика «короб с усами»

 

Далее на вкладке Points изменимграфы Width и Height:

Рисунок 7 Редактирование точек на «коробе с усами»

Аналогично изменить размер точек для второй выборке X2.

На рисунке 8 изображена диаграмма «boxplot» для наших данных.

Рисунок 8 Диаграмма «boxplot»

 

Чем дальше друг от друга расположены медианы и средние, тем сильнее различия между исследуемыми выборками значений. Основной критерий для предположения о различии выборок: среднее значение одной выборки не входит в доверительный интервал для среднего значения другой.

 

Мы можем наблюдать, что доверительные интервалы для средних не включают в себя средние значения сравниваемых выборок. Следовательно, можно предположить, что различия между выборками статистически значимы. Для доказательства проведем дальнейший анализ.

 

Доказательная статистика.

Плагин ESCI JSMS.

1) Ввод данных

Откройте программу ESCI JSMS.xls. В правом окне (в желтой области) очистите содержимое ячеек от данных, вставьте ваши данные в два столбца соответственно.

2) Работа с графиком

Посмотрите на полученный график (Рисунок 9).

Синие прозрачные точки – наши данные.

Черная точка – среднее значение, черная линия – 99% доверительный интервал для среднего значение.

Красный треугольник – разница между средними значениями, а красная линия – 99% интервал для разности.

Важно: если доверительный интервал для разности накрывает ноль – различия между выборками статистически не значимы. На рисунке 9 показано: ДИ для разности не накрывает ноль, что говорит о найденном статистически значимом различии между выборками.

 

Рисунок 9 Различия между двумя выборками.

 

 

3) Работа с таблицей:

Обратите внимание на таблицу «Описательная статистика» (Descriptive statistics).

 

Рисунок 10 Описательная статистика

 

n1, n2 – объем выборки.

M1, M2 – средние значения (Mean)

Сl- to - доверительный интервал для средних

SD – стандартное отклонение

Effect Size – размер эффекта – показывает разницу между средними значениями выборок.(измеряется в единицах выборки).

t- критерий Стъюдента

p – двухстороннее p- значение

Pooled s – совокупное стандартное отклонение

Сohen’s d - Размер эффекта по Коэну

Cl on the difference – 99%ый ДИ для размера эффекта

 

Все данные показатели нужны для доказательства или опровержения различия между двумя исследуемыми выборками. Заполните поля в Вашей таблице (Шаблон).

 

 

Интерпретация некоторых показателей:

Традиционная интерпретация P -значений (шкала Michelin)

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...