Главная | Обратная связь | Поможем написать вашу работу!

Порівняння двох динамічних рядів

Динамическим рядом називають послідовність спостережень одого показника, упорядковану у відповідності із зростанням або спаданням іншого показника. Якщо упорядкуіання здійснюється по часу, те такий динамічний ряд називається часовим рядом. Елементи ряду прийнято називати рівнями. При існування тенденції в часовому ряді кажуть, що він має трецд, тобто зміну, яка визначає загальнийа напрямок розвитку.

Нехай задані два динамічних ряда , які отримані незалежно один від одного. Кожний -й член ряду належить одному і тому ж досліду. Потрібно вияснити, чи є розбіжність між динамічними рядами.

Якщо обидва ряду однакові, різниці будуть безладно розсіюватися навколо нульового значення. Слід перевірити, чи належить середня різниця генеральній сукупністі з параметром . Одержується наступна схема розрахунку ("розширений критерій"):

Різниці не повинні залежати від величин х і у, що вимірюються. Це перевіряється графічно. Відхилення середнього від очікуваного значення, яке дорівнює нулю, перевіряється у відповідності з рівняннями розподілу Ст’юдента по квантилю

і дисперсії

з ступенем свободи.

Проводять порівняння звичайним способом по] процентним точкам -розподілу. При можна констатувати різницю між серіями.

Приклад. Для перевірки впливу реклами на рівень продажів визначали маржинальний доход до (х) та після (у) рекламної кампанії. Необхідно встановити, чи суттєва різниця між обома серіями продажів.

Вихідні дані і проміжні розрахунки зведені в таблицю.

x	y	d=x-y
100,1	96,6	-3,5
115,1	115,6	+0,5
130,0	125,5	-4,5
93,6	94,0	+0,4
108,3	103,3	-5,0
137,2	134,4	-2,8
104,4	100,2	-4,2
97,3	97,3	0

Розрахунок дисперсії разности дасть величину =2.32 при ступенях свободи:

Так як , між обома серіями можна припускати різницю такого порядку, що результати продажів після рекламної кампанії в середньому нижче, чим до неї.

Для порівняння двох більших серій вимірів можна скористатися непараметричним "критерієм знаків", що спираються на знаки різниць .

По сукупності всіх t різниць визначають:

- число значень з d > 0;

- число значень з d < 0.

У випадку рівності та серії можуть розрізнятися лише в межах випадкової

помилки, отже, потрібне перевірити нульову гіпотезу для рівності P (d>0) = P (d<0) = 0.5. Для відповіді на питання, чи значущо одна серія вимірів більше другої, підраховують число різниць з d > 0 і застосовують критерій Фишера (див. далі). Нкльову гіпотезу потрібно відхилити при

де - числа ступенів свободи у відношенні дисперсій по серіям.

При зворотному процесі (тобто, чи значно одна серія менше другої) для перевірки користуються формулою

де - числа ступенів свободи.

Непараметричний критерій знаків вимагає тільки неперевності деякої функції розподілу генеральної сукупності. Він простий і не пов’язаний передумовами, його зручно застосовувати для швидкої наближеної оцінки значимості двох серій вимірів. Проте при серіях великого об’єму критерій знаків дає мало інформації (див. табл. 2.1).

Різниці , які виникають при порівнянні двох рядів вимірів, повинні мати нерегулярне чередування позитивних і негативних знаків. Але інколи спостерігаються то короткі, то більш довгі серії різниць . Тоді виникає питання чи потрібно вважати таку часту появу однакових знаків все ще випадковою? На це питання легко відповісти, застосувавши непараметричний критерій серій Вальда – Вольфовіця.

Таблиця 2.1. Мінімальне число (або ) для значущої розбіжності по критерію знаків

m ≥(або ≥)

P=0,95 P=0,99

-

-

Визначають число різниць з позитивними і негативними знаками (). Число серій N в експериментально отриманих даних потрібно порівняти зі значеннями з табл.2.2. Нульова гіпотеза - розсіювання знаків цілком випадково - приймається, якщо при даному число серій N менш або більше, ніж означені в табл. 2.2 границі.

Приклад. При порівнянні двох серій вимірів були отримані різниці зі знаками ++++- - - - ++. Отже, . По табл. 2.2. визначаємо, що для число серій повинно бути N < 4 і N> 11, коли нульова гапотеза при =0.95 відкидається. В даному випадку при N=3 це якраз має місце, тому нульову гіпотезу слідує відкинути та припустити, що можливf періодичність у поведінці показника, що вивчається.

Таблиця 2.2.

Нульова гіпотеза приймається для

N менше, ніж N, більше ніж

12...20 -

6...14 -

15...20 -

5...6

-

8...15 -

16...20 -

7...8

9...10 -

11...17 -

7...8

9...12

13...18 -

10...12

10...11

12...15

Риска в графі 4 табл. 2.2 означає, що критерій не може бути застосованим.

2.7. - розподіл

Нехай є незалежних випадкових величин , кожна з яких розподілена по нормальному закону розподілу з параметрами та . Для кожної випадкової величини складемо вираз:

Тоді сума квадратів випадкових величин має закон розподілу, що називається -розподілом з тупенем свободи.

З того, що величина утвориться як сума квадратів, видно, що вона зв'язана з дисперсією деякої випадкової величини. Таблиця -розподілу цредставдена в додатку 3.

Нехай даний ряд з вимірів. В доповнення до графічних методів важливо встановити, чи можна описати ці значень за допомогою прийнятої теоретичної моделі. Для перевірки тоді висувають нульову гіпотезу про те, що між емпіричним розподілом та емпіричною моделлю немає жодноїрозбіжності. З значень ( > 50) обчислюють середнє та стандартне відхилення , а після цього розбивають значень на класів. Для кожного отриманого класу визначають абсолютну частоту h потрапивших у нього значень і зіставляють її з частотою , яка теоретично очікується у відповідності до моделі. Для різних теоретичних розподілів частоти протабульовані при . Тому насамперед для їхнього розрахунку стандартизують класи по формулі . Для таких нормованих значень в таблиці розподілу Гаусса знаходять відповідні їм ординати. Зважаючи на число вимірів , ширину класу і стандартне відхилення , обчислюють теоретичні очікувані абсолютні частоти попадания в окремі класи. З емпіричних і теоретичних частот складають вираз:

Якщо теоретичні значення для окремих класів дрстатньо великі ( > 5), то знайдений буде підпорядкований -розподілу з ступенем свободиволі. При цьому являє собою число параметрів, необхідних для опису вибірки. Для нормального (гауссового) розподілу (середнє , стандартне відхилення і об'єм вибірки ), для розподілу Пуассона (середнє , об’єм вибірки ). Потрібне для окремих класів значення > 5 можна отримати, об'єднуючи декілька сусідніх класів. Якщо при перевірці одержується, що , то гіпотеза, що перевіряється, відкидається – між емпіричним і теоретичним розподілом існує значуща розбіжність. Розбіжність незначима, якщо (хі-квадрат-критерій).

Розподіл Фішера

Нехай існують дві системи незалежних спостережень випадкової величини :

із кількостями вимірів і та вибірковими дисперсиями і відповідно. Якщо генеральні дисперсії і , які відповідають вибірковим даним, відповідають одній і тій же генеральній дисперсії, тобто має місце рівність

то відношення вибіркових дисперсий

є випадковою величиною, що підпорядковується закону розподілу, що носить назву "розподіл Фішера". Ця фуйкция має два параметри і - числа степенів свободи дисперсий і відповідно.

Має місце наступна властивість функції розподілу Фішера:

де

Тому для запобігання неоднозначності будемо притримуватися правила згідно якого в чисельникові будемо записувати більшу із порівнюваних дисперсій. У відповідності до цього за потрібно приймати число ступенів свободи більшої із дисперсій, а за - для меншої.

Таблиця величина дли різних імовірностей наведена в додатку 4.

Якщо перша система випадкових величин відповідає результатам моделювання по] моделі А, а друга – по моделі В, то, в силу того, що дисперсія в певній мірі характеризує точність моделювания (в сенсі його адекватності реальному процесу), з виразу длл випливає, що їм співвідносяться ступені адекватності моделей А і В. Якщо ж , то можна припускати, що моделі А і В однаково описують реальний процес. Однак питання про те, наскільки точний цей опис, залишається за межами математики і вимагає інших міркуваннь.

Приклад 1. Моделювання тривалості іноваційного проекту проведене двома способами: методом мережевого планування і управління (МПУ) і методом Монте-Карло. При Цьому отримані наступні значення вибіркових дисперсий часу зшершения проекту: = 28,4 дн.² (для методу МПУ з трьох модельных прогонів) і = 16,5 дн.² (для методу Монте-Карло з 13 прогонів). Оцінимо гіпотезу про однакову адекватність моделей, тобто про те, що вони одинаково точно описують реальныйпроцесс. В якості статистичної гіпотези будемо розглядати нуль-гіпотезу про рівність відповідних генеральних дисперсій і .

Якщо вибіркові дисперсії і відповідають одній і тій же генеральній дисперсії (тобто моделі володіють однаковою адекватністю), то відношення підпорядковується розподілу Фішера. Отже, оцінка гіпотези повинна полягати у перевірці сумісності експериментального відношення дисперсій з функцією розподілу Фішера. У відповідності з викладеною теорією отримане значення реалізації випадкової величини необхідно зіставити зі значенням , обчисленим за допомогою розподілу Фішера для заданого рівня значимости і чисел ступенів свободи і .

Оцінюємо спочатку можливість прийняття гіпотези. Для цього вибираємо рівень значимости 0.05 і по таблиці додатку 4 знаходимо . Так як 1,73 < 3.89, то висуну гіпотезу слід прийняти.

Таким чином, застосування статистичного критерію показує, що генеральні дисперсії, що відповідають вибірковим дисперсиям = 28,4 і = 16,5 дорівнюють одна одній, тобто дисперсії і потрібно признати однорідними, а відповідні модеді – таким, що мають рівну адекватність до реального процесу.

Приклад 2. В умовах попереднього прикладу маємо = 20,68 і = 1,75 з числом ступенів свободи, яке дорівнює 5 в обох випадках (тобто по б модельних прогонів). Вимагається оцінити гіпотезу про рівну адекватність моделей, тобто, як ми вже домовились дати оцінку гіпотезі : = .

Вчинивши] так же, як і у попередньому прикладі, знайдемо

Вибираємо рівень значимості і встановлюємо, що . Оскільки 11,84 >5,05 то з 5% рівнем значитмості перевіряема гіпотеза прийнята бути не може.

Оцінимо тепер можливість відхилення гіпотези. Для цього вважаємо рівень значимости 0,01 і по таблицям Фішера знайдемо . Оскільки 11.84>10,97, тo гіпотеза, що оцінюється, повинна бути відкинута із 1% рівнем значимості. Таким чином, моделі, що зіставляються не можна вважати рівно адекватними реальному процесу. В силу того, що =20,68 і =1,75, можна припустити (але зовсім не можна стверджувати), що метод Монте-Карло моделює процес більш адекватно, ніж метод

МПУ(природньо, лише для даного прикладу).

Розглянуті нами теоретичні розподілу на перший погляд здаються абсолютно різними і не звя’занними. Проте це не так. Наприклад, розподіл Пуасона стає близьким до нормального, коли виконується умова . Можна показати, що t-розподіл переходить в гауссовий при . Подібні зв'язки існують також і поміж іншими розглянутими розподілами

⇐ Предыдущая 28 29 30 31 323334 35 36 37 Следующая ⇒