Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Глава 3. Кореляційно-регресивний аналіз в економетриці




 

Як знайти у вигляді формули залежність між двома випадковими величинами, одержаними в результаті спостережень, якщо кожному значенню однієї величини відповідає декілька значень іншої? Як знайти параметри цих формул за умови, щоб вони відображали сутність процесу, що вивчається і "зглажували" вплив випадкових, не характерних для даного процесу факторів? Наскільки сильно впливає зміна однієї величини на зміну іншої? Відповіді на ці питання складають зміст цієї глави.

 

3.1. Поняття кореляційної залежності. Кореляційна таблиця

 

Проведене спостереження двох ознак у 15 колосків пшениці – вімиряна довжина кожного колосу X (см) і підрахована кількість зернинок Y. По цим даним наступна таблиця:

                             
                             

 

Інтуітивно можна припустити, що більшій довжині колосу відповідає чает більша кількість зернин у ньому. Упорядкуємо ці первинні] дані, помістивши їх до таблиці. У першому стовбчикові запишемо в порядку зростання значення 8, 9, 10, 11,..., а у першому рядку – в тому ж порядку значення :18, 20, 24, 27, 30. На перетині рядків і стовбчиків запишемо число повторень однакових пар (; ) в раді спостережень (табл. 3.1).

Таблиця 3.1

Y   X          
             
             
             
             
           

 

Вимагається встановити і оцінити залежність випадкової величини У від величини Х. Ці задачі є основними в теорії кореляції і формулюються так:

■ визначення залежності між випадковими величинами у вигляді формули;

■ Визначення сили або тісноти цієї залежності.

Дл того щоб їхн вирішити, необхідно побудувати відповіднийий апарат.

Нехай існують два ряди спостережень залежних між собою величин X та У. Якщо та зустрічаються по одному разу, то їх записують у вигляді табл. 3.2:

Таблиця 3.2

      ... ...
... ...
... ...

 

де - спостережні значення пов’язаних між собою ознак ; - номер спостереження.

Якщо кожному значенню відповідає декілька значень величини , а кожному занченню - декілька , то ці дані потрібно упорядкувати і записати у вигляді таблиці 3.3.

Таблиця 3.3

Y   X ...
...
...
...
... ... ... ... ... ... ...
...
...

 

Тут числа - частоти, що показують, скільки раз повторюються парні значення . Таблиця 3.3, в якій записані результати спостережень в порадку зростання з вказівкою частот, називається кореляцйною. Кореляційна таблиця може бути складена як для дискретних ознак, так і для неперервних. В останньому випадку ознаки поділяються на ряд частотних класів.

З табл. 2.3 видно, що кожному значенню ознаки X відповідає розподіл ознаки , і навпаки. Але на відміну від функціональної залежності тут немає точногї відповідності між X та У, але можна знайти відповідність між значеннями однієї і середнім значенням другої величини.

Означення 1. Залежність між випадковими величинами X та У, яка полягає в тому, що кожному значенню однієї величини відповідає розподіл іншої, називається статистичною.

Статистична залежність показує, що якщо величина X приймає одне значення або потрапляє до певного інтервалу, то при цьому друга величина У приймає декілька значень із певними частотвми. Кожному значенню X співставляється розподіл У.

Особенно важливим є окремий випадок статистичної залежності, коли кожному можливому значенню однієї величини співставляєтся яка-небуть числова характеристика відповідного розподілу другої. Така залежність називається статистичною кореляцією або просто кореляційоною залежністю.

Означення 2. Середнє арифметичне значення величини обчислене за умови, що приймає фіксоване значення, називається умовним середнім і позначається . Аналогічно визначається умовне середнє .

На підставі даних таблиці 3.1 можна обрахувати умовні сердні для всіх значень випадкової величини . Маємо:

.

Далі при інших значеннях аналогоічно знаходимо

,

 

,

 

.

Таким чином отримана наступна нова таблиця:

       
19,3 22,2 25,5  

Ця таблиця показує залежність між значеннями та умовними середніми . Побудуємо в декартовій системі координат точки і з’єднаємо їх відрізками прямихх. Отримана лінія називається емпірічною лінією регресії на (рис. 4).

З таблиці 3.1 можна скласти ще одну таблицю, яка показує відповідність між значеннями та умовними середніми :

         
  8,6 9,7 10,2  

 

Ламана лінія з вершинами називається емпірічною лінією регресії на (рис. 5).

Рис. 4 Рис. 5

 

Вивчаючи лінія, що побудована по даним наведених вище таблиць, можна "намітити" деяку плавну криву, що "зглажує" цю залежність, біля якої групуються, або до якої тяжіють, точки або . Таку лінію називають теоретичною лінією регресії, а відповідне рівняння цієї лінії називають рівнянням регресії. Найбільш простим є рівняння прямої лінії. Як же знайти рівняння лінії регрессии?

Форма лінії регресії і відповідне рівняння часто підказуються емпірічною лінією регресії. Якщо точки Mі або Nі розташуються вздовж прямої, то лінія регресії називається прямою регресії і операція "зглажування" ломаної зводиться до знаходження параметрів і функції

.

Кореляційона залежність чи просто кореляція, називається прямою, якщо більшому значенню відповідає баяьшее значення і зворотною, якщо із зростанням значення спадає. Для прямої кореляції в рівнянні , а для зворотної < 0. Функція є математичною моделлю залежності, що вивчається, яка при правильній її побудові буде виявляти найголовніші властивості процесу, що вивчається і виключати окремі "збурений", викликані випадковими, не характерними для даного явища факторами.

Поделиться:





Читайте также:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...