Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Найпростіші випадки криволінійної кореляції. Линеаризация




 

Нами бшо розглянуте поняття і застосування лінійної кореляції. Розглянемо тепер більш складні випадки.

Нехай результати спостережень над випадковими величинами та представлені у вигляді табл. 3.3 або в вигляді кореляційної табл. 3.4.

Побудуємо в системі координат точки . Припустимо, що всі вони розмістилися всередині деякого контура. Можна припустити існування лінії, по обидві сторони якої знаходяться ці точки . Щлб визначити цю лінію, вчиняють наступним чином. Розбивають фігуру на полосок і обчислюють середні значення , для всіх точок, що потрапили у -ту полоску, 1.2, 3,..., , по наступним формулам:

де -кількість тощок, що потрапили в -ту полоску.

Далі обчислюють абсциси точок у середині кожного часткового інтервалу:

 

В результаті отримують ряд точок , Побудувавши ці точки в системі координат і з’єднавши плавною лінією побачимо, що всі точки тяжіють до цієї лінії, що має назву "лінії регресії". В даному випадку має місце криволінійна кореляція.

В теорії криволінійної кореляції вирішуються ті ж основні питання, що і у випадку прямолінійної кореляції. Емпіричну лінію регресій природно замінити уже не прямою лінією, а, наприклад, параболою другого або третього ступеню, тобто припустити, що рівняння теоретичної лінії регресії на X має вигляд

 

, (44)

або

. (45)

 

Можливі і інші типи рівнянь, наприклад , або , де - постійні, що підлягають визначенню.

Отже, нехай по формі емпіричної лінії регресії, враховуючи особливості процесу, що вивчається, ми вирішили, що залежність між випадковими величинами X та У має вигляд . З цієї pівності слідує, що

. (46)

Але в результаті подстановки в (46) замість та , результату спостережень ми отримаємо не нуль, а деяке число , тобто має місце відхилення. Коефіцієнти знаходять за умови, що сума квадратів відхилень є найменшою. Для цього складають функцію і досліджують її на екстремум. В результаті одержують систему:

 

(47)

 

Результати спостережень подставляют до цієї системи і розв’язуючи її отримують ці коефіцієнти. Тіснота або сила залежності між величинами X та У у випадку криволінійної кореляції визначається вибірковим кореляційним відношенням , яке завжди береться зі знаком "+":

- де оцінка кореляційного відношення для всієї досліджуваної сукупності:

 

Якщо попередній аналіз даних призводить до вибору ступеневої, експоненційної або гіперболічної залежностей, необхідна лінеаризація моделей. Ступенева і експоненційна залежності лінеаризуються шляхом логарифмовання обох частин рівняння:

а гіперболічна – заміною .

Не існує загального правила для вибору підхожого вигляду емпіричної формули: можна лише здогадуватися про підхожу форму рівняння по формі кривої, що зображає дані. Проте існують способи, за допомогою яких можна перевірити, чи є здогадка вдалою, чи ні.

Для залежностей із двома параметрами, що найбільш часто зустрічаються, емпіричну формулу можна вибирати за допомогою таблиці. Використовуючи вхідні дані, знаходять значення та .. Після цього порівнюють , яке відаовідає у вхідних даних, зі значенням . Якщо не знаходиться серед вхідних даних , то відповідне значення можна визначити за допомогою лінійної інтерполяції:

де та - проміжні значення, між якими міститься . Якщо величина велика, тo відповідна емпірична формула непридатна.

Залежності I-VII, наведені в таблиці, монотонні і, отже, придатні лише в тому випадку, якщо у вхідних даних , а має постійний знак.

Приклад. Визначити вид емпіричної формули, що відповідає наступній таблиці:

 

                 
                 

 

Номер формули Вид емпіричної формули
I
II
III
IV
V
VI
VII

 

Проводимо проміжні розрахунки і здійснюємо підбір відповідної формули:

Номер формули Вид емпіричної формули
I =6 =406     не піднодить
II =4,4 = 98 98,5 0,5 підходить краще інших
III =6 =98     не підходить
IV =3,3 =406     не підходить
V =6 =23,6   186,4 не підходить
VI =3,3 =23,6   23,4 не підходить
VII =4,4 =406 98,5 307,5 не підходить

 

В усіх розглянутих випадках оцінку якості вибраної регресійної моделі можна здійснити у відповідності з викладеною вище теорією оцінки адекватності лінійної регрессии (якщо проводилась попередня лінеарізація) або шляхом розрахунку кореляційного відношення.

 

Множинна кореляція

Кореляційну залежність міждекількома значеннями ознак називають множинною кореляцією.

Розглянемо найпростіший випадок, коли по суті явища, що вивчається можна вважати з достатньо великою імовірністю, що між X, У, Z є лінійна залежність, яку можна представити рівнянням

 

. (48)

 

В цьому випадку потрібне вирішити наступні задачі:

по даним кореляційної таблиці знайти коефіцієнти так, щоб функція (48) найкращим чином відбивала найваживіші властивості явища, що вивчається;

виразити у вигляді числа міру чи тісноту залежності між значеннями ознак X, У, Z;

виразити у вигляді числа міру чи тісноту зв'язків між Z та X при фіксованому Y, між Z та Y при фіксованому X.

Коефіцієнти знаходять за допомогою способу найменших квадратів, тобто

Як відомо, для цього необхідно знайти часткові похідні по аргументам . Маємо

Прирівнявши усні похідні даної функції до нуля та перегрупував доданки ми приходимо до системи з трьох рівнянь з трьома невідомими:

Міра або тіснота зв’язку значення ознаки зі значеннями ознак оцінюється по формулі

де - повний коефіцієнт кореляції.

Величина завжди вважається додатньою, вона може приймати значення на множині [0,1].

Можна довести, що тіснота

Властивості є аналогічними до властивостей вибіркового коефіццєнта кореляції.

При побудові рівняння множинної регресії можливий тісний лінійний зв’язок чинників, що досліджуються.

Вважають, що дві змінні колінеарнй, тобто знаходяться між собою в лінійній залежності, якщо . Парні коефіцієнти кореляції виявляють лише явну колінеарність факторів. Найбільша ж трудність у використанні апарату множинної регресії виникає за наявності мультиколінеарності чинників. Для оцінки її використовують визначник матриці парних коефіцієнтів кореляції.

Якщо б чинники не корелювали між собою, то матриця париих коефіцієнтів кореляції була б одиничною, оскільки всі її диагональні елементи дорівнювали б нулю. Так, для регресивної моделі, що мястить три змінних

матриця коефіцієнтів кореляції була б одиничною і визначник її дорівнював би 1.

 

Поделиться:





Читайте также:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...