Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Методы изучения корреляционной связи




Исследование зависимостей и взаимосвязей между явлениями в социально-экономической статистике, позволяет понять сложный механизм причинно-следственных отношений.

При исследовании взаимосвязей выделяют факторные признаки, влияющие на изменение результативных признаков.

Различают два вида связи: функциональную и стохастическую.

Связь между переменными x и y называется функциональной, если определенному значению x строго соответствует одно или несколько значений другой переменной y, и с изменением значения x значение y меняется строго определенно, например, зависимость между площадью круга и радиусом - детерминированная (функциональная) связь.

В различных процессах, характеризующихся статистическими закономерностями, обычно не представляется возможным выявить строгую зависимость явлений от изучаемых факторов, потому что закономерности складываются под влиянием множества причин и условий, действующих одновременно и взаимосвязано с различной силой в различных направлениях, при этом точно неизвестно, в какой мере каждый из факторов влияет на величину явлений. Такие связи, называемые стохастическими, можно обнаружить только при массовом наблюдении (на основе изучения особенностей распределения, поведения средних и других показателей).

Связь, проявляющаяся при большом числе наблюдений в виде определенной зависимости между средним значением результативного признака и признаками-факторами, называется корреляционной (частный случай стохастической связи).Различаютпрямую и обратную корреляционную связь. Если рассматривается связь средней величины результативного показателя y с одним признаком- фактором x, корреляция называется парной, если факторных признаков два и более, то – множественной. При изучении множественной корреляции вводится еще понятие частной корреляции, под которой понимается зависимость между результативным показателем и одним из факторных признаков в условиях, когда влияние на них остальных факторов, учитываемых на фиксированном уровне, устранено.

Для изучения, измерения и количественного выражения взаимосвязей между явлениями статистикой применяются различные методы.

Метод параллельных рядов применяется, чтобы установить связь между явлениями, располагая полученные в результате сводки и обработки материалы в виде параллельных рядов и сопоставления их между собой. Такое сопоставление, проведенное после теоретического анализа, показавшего возможность связи между изучаемыми явлениями, позволяет проследить количественные соотношения сопоставляемых признаков и направление их изменений, т.е. позволяет установить наличие связи. Например, в табл.4.5 показано производство и себестоимость продукции по десяти предприятиям за определенный год.

Сопоставление двух рядов показывает, что между производительностью предприятия (компании, фирмы) и себестоимостью производимой ею продукции существует обратная связь: с увеличением объема продукции предприятия себестоимость 1 т продукции снижается.


Таблица 4.5

Производство продукции и себестоимость продукции

(данные условные)

Название предприятия Произведено продукции, тыс. т Себестоимость 1 т, руб.
Предприятие 1 100,0 70,0
Предприятие 2 96,0 76,0
Предприятие 3 80,0 80,0
Предприятие 4 60,0 90,0
Предприятие 5 55,0 95,0
Предприятие 6 50,0 100,0
Предприятие 7 40,0 108,0
Предприятие 8 30,0 120,0
Предприятие 9 20,0 140,0
Предприятие 10 10,0 170,0

 

Простейший показатель тесноты связи, основанный на сравнении поведения отклонений индивидуальных значений каждого признака от своей средней величины, принимая во внимание не величины отклонений, а их знаки - коэффициент Фехнера (коэффициент корреляции знаков).

Определив знаки отклонения от средней величины, подсчитывают число их совпадений (С) и несовпадений (Н). Коэффициент Фехнера записывают как отношение разности чисел пар совпадений и несовпадений знаков к общему числу наблюдаемых единиц (их сумме):

Коэффициент может принимать значения от 0 до 1. При этом, чем ближе значение коэффициента к единице, тем сильнее теснота зависимости между факторным и результативным признаками. Однако равенство коэффициента единице не свидетельствует о наличии функциональной зависимости, поскольку коэффициент Фехнера учитывает только знаки без анализа величин отклонений от средних значений, то он характеризует не столько тесноту связи, сколько ее наличие и направление (табл.4.6).


 

Таблица 4.6

Основные показатели деятельности предприятий (данные условные)

 

Предприятия Основные производственные фонды, млн. руб. Валовой выпуск продукции, млн. руб. Знаки отклонений от средней величины
Xi - Yi -
      - -
      - -
      - -
      - -
      - -
      + +
      + -
      + +
      + +
      + +
       

 

Сущность балансового метода заключается в том, что данные взаимосвязанных показателей изображаются в виде таблицы и располагаются таким образом, чтобы итоги между отдельными частями были равны.

Таблица 4.7.

Таблица четырех полей

Группа лиц Число лиц
Заболевших гриппом Не заболевших гриппом Итого
Сделавших прививку 30 (a) 270 (b)  
Не сделавших прививку 120 (c) 80 (d)  
Итого      

Балансовый метод используется для характеристики взаимосвязи между производством и реализацией продукции, денежными доходами и расходами населения и т.д.

Метод аналитических группировок используют при наличии массовых статистических данных для изучения массовых явлений. Сущность метода аналитических группировок заключается в том, что единицы статистической совокупности группируются, как правило, по факторному признаку и для каждой группы исчисляется средняя или относительная величина по результативному признаку. Затем изменения средних или относительных значений результативного признака сопоставляются с изменением факторного признака для выявления характера связи между ними. Аналитические группировки при всей своей значимости не дают количественного выражения тесноты связи между признаками. Эта задача решается при помощи дисперсионного и корреляционного анализов.

Дисперсионной анализ позволяет определить роль систематической и случайной вариации в общей вариации и, следовательно, установить роль изучаемого фактора в изменении результативного признака. Для этого пользуются правилом сложения дисперсий, согласно которому общая дисперсия равна сумме двух дисперсий: средней из внутригрупповых и межгрупповой .

Для характеристики тесноты корреляционной связи между признаками в аналитических группировках используют корреляционное соотношение: .

Оно характеризует долю вариации результативного признака, вызванного воздействием факторного признака, положенного в основание группировки.

Корреляционное отношение по своему абсолютному значению колеблется в пределах от 0 до 1. Чем ближе корреляционное отношение к 1, тем большее влияние оказывает факторный признак на результативный.

Дисперсионный анализ позволяет не только определить роль случайной и систематической вариации, но и оценить достоверность вариации, обнаруженной методом аналитических группировок. Определение достоверности вариации дает возможность с заданной степенью вероятности установить, чем вызвана межгрупповая вариация — признаком, положенным в основание группировки, или является результатом действия случайных причин. Для оценки существенности корреляционного отношения пользуются критическими значениями корреляционного отношения при разных уровнях вероятности или значимости.

Уровень значимости - это достаточно малое значение вероятности, отвечающее событиям, которые в данных условиях исследования будут считаться практически невозможными. Появление такого события является указанием на неправильность начального предположения. Чаще всего пользуются уровнями или . Критические значения корреляционного отношения содержатся в специальных таблицах.

При проверке существенной связи чаще пользуются критерием Фишера, потому что при больших числах степеней свободы его табличные значения мало изменяются, в отличие от корреляционного отношения, которое требует более громоздких таблиц. Критерий Фишера представляет собой отношение факторной дисперсии к остаточной дисперсии, исчисленных с учетом числа степеней свободы:

,

где:

- факторная дисперсия;

- остаточная дисперсия;

m - число параметров в уравнении регрессии;

m- 1 – число степеней свободы для факторной дисперсии;

n – число наблюдений;

n-m – число степеней свободы для остаточной дисперсии.

Для этих отношений Фишер (отсюда название «критерий Фишера») составил таблицы, по которым можно определить, какая величина при данном числе степеней свободы по факторной вариации и остаточной вариации дает основание утверждать с определенной вероятностью (например 0,95 — 0,339), что положенный в основание группировки признак является несущественным..

Зная корреляционное отношение, можно определить критерий Фишера по следующей формуле:

Аналогично проводится анализ при комбинационной группировке по двум и более факторам. Принцип дисперсионного анализа, заключающийся в сопоставлении факторной дисперсии со случайной для оценки достоверности результатов статистической группировки, неизменен при любом числе признаков группировки.

Основными задачами изучения корреляционных связей являются:

1. Выявление наличия (отсутствия) корреляционной связи между изучаемыми признаками.

2. Корреляционный анализ - измерение тесноты связи между признаками с использованием специальных коэффициентов.

3. Регрессионный анализ – нахождение уравнения регрессии (среднее значение результативного признака рассматривается как функция одного или нескольких факторных признаков.)

Задачи корреляционного анализа сводятся к изучению взаимосвязей между признаками статистической совокупности: в определении формы и количественной характеристики связи, а также степени тесноты (сопряженности) связи.

Первая задача корреляционного анализа заключается в определении формы связи, т.е. в установлении математической формы, в которой выражается данная связь. Это очень важно, так как от правильного выбора формы связи зависит конечный результат изучения взаимосвязи между признаками. Определение формы связи не может быть произведено только при помощи математических методов. Корректно и наиболее полно определить ее возможно только на основе предварительного содержательного анализа изучаемых явлений.

Нахождение уравнения регрессии по эмпирическим данным сводится к математическому описанию взаимосвязи коррелированных величин.

Вторая задача корреляционного анализа состоит в измерении тесноты, т.е. меры связи между признаками с целью установить степень влияния данного фактора на результат. Она решается математическими методами путем определения параметров корреляционного уравнения.

В заключение проводится оценка и анализ полученных результатов при помощи специальных показателей корреляционного метода (коэффициентов детерминации, линейной и множественной корреляции и т.д.), а также проверка существенности связи между изучаемыми признаками.

Уравнение регрессии может быть представлено в виде уравнения прямой линии, параболы, гиперболы, показательной функции, логарифмической функции и т.д.

Линейное уравнение регрессии имеет вид:

где

- коэффициент регрессии показывает, насколько в среднем отклоняется величина результативного признака при отклонении величины факторного признака на одну единицу.

Уравнение кривой второго порядка (параболы) имеет вид: .

Параметр характеризует степень ускорения или замедления кривизны параболы и при парабола имеет минимум, а при — максимум. Параметр характеризует крутизну кривой, а параметр — вершину кривой.

На практике изучение взаимосвязи между признаками часто базируется на значительном числе наблюдений, материалы которых группируются по двум взаимосвязанным признакам ( и ). Результаты группировки оформляются в виде корреляционной таблицы (решетки). Корреляционная решетка представляет собой комбинационную таблицу, в подлежащем которой располагаются значения одного признака, как правило, факторного, а в сказуемом — другого, результативного. В клетках, образовавшихся при пересечении строк и граф, указываются частоты, т.е. число случаев, в которых одни значения сочетаются с другими.

Если после предварительного анализа предполагают наличие линейной взаимосвязи, для выражения аналитической зависимости между у – зависимой случайной величиной и х 1, х 2, х 3, – независимыми случайными величинами может быть выбрана модель следующего вида:

,

где u – случайная компонента.

Оценкой этой модели является следующее уравнение:

,

где bi – оценка параметра b i при i =0; 1; 2; 3.

Термин "оценка" применяется, чтобы подчеркнуть, что рассчитанные показатели лишь приближаются к реальным, истинным значениям этих параметров в генеральной совокупности.

Для исчисления bi используется метод наименьших квадратов:

где

n – число наблюдений.

Дифференцируя это уравнение по , получаем соответственно (k+1) нормальных уравнений, где k – число независимых переменных х (в примере k =3).

Решение системы уравнений позволяет найти коэффициенты уравнения регрессии.

Для оценки полученного уравнения регрессии в статистике используют методы дисперсионного анализа и проверяют, существенно ли вектор b ( ) отличается от нулевого вектора.

При изучении корреляционной связи важно выяснить не только форму, но и тесноту (сопряженность) связи между факторным и результативным признаками. Для этого статистикой установлен числовой показатель, который вычисляется по определенным правилам. Чтобы измерить тесноту прямолинейной связи между двумя признаками, пользуются парным коэффициентом корреляции, который обозначается .

При корреляционной связи определение тесноты связи сводится к изучению сопряженности (в какой мере отклонение от среднего уровня одного признака сопряжено с отклонением другого). При полной прямой связи все значения и должны иметь одинаковые знаки; при полной обратной связи – разные.

Таким образом, по показателю можно определить направление и тесноту связи, но он неудобен, так как зависит от числа членов ряда и единиц измерения.

Теснота связи определяется как отношение

 

где

— линейный коэффициент корреляции.

Коэффициент корреляции принимает значение от -1 до +1:

при корреляция прямая,

при корреляция обратная,

при связь отсутствует полностью.

 

Контрольные вопросы

1. В чем заключаются особенности и каково значение выборочного наблюдения?

2. Что такое генеральная и выборочная совокупности?

3. Что такое ошибка выборочного наблюдения, по какой формуле она исчисляется и от каких факторов зависит ее величина?

4. Что такое повторная и бесповторная выборка? Какая из них точнее?

5. Чем отличается предельная ошибка выборки от средней?

6. Как определяется необходимая численность выборки при заданной ее точности?

7. Чем отличается случайный отбор от механического отбора единиц статистической совокупности?

8. Как организуется типический отбор и в чем его преимущества?

9. Как организуется серийный (гнездовой) отбор единиц статистической совокупности, в каких случаях применяется единиц статистической совокупности?

10. Какие имеются способы распространения выборочных данных?

11. Какие преимущества выборочного метода приводят к его широкому применению в социально-экономических исследованиях?

12. В чем заключаются основные задачи изучения и измерения связи между явлениями?

13. Какая связь называется корреляционной и в чем ее сущность?

14. Какие методы применяются статистикой для установления и измерения связи между явлениями?

15. Какие задачи решает дисперсионный анализ?

16. Как исчисляется корреляционное отношение, что оно характеризует и в каких пределах колеблется его абсолютное значение?

17. Для чего применяется критерий Фишера и как он исчисляется?

18. Каковы задачи корреляционного анализа?

19. Вид уравнения линейной регрессии и что характеризуют его параметры?

20. Как определяется достоверность коэффициента регрессии?

21. Что представляет собой линейный коэффициент корреляции.

22. Для чего используется критерий Фишера?


Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...