Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Приемы корреляционного анализа




Приемы корреляционного анализа используются для измере­ния влияния факторов в стохастическом анализе, когда взаимо­связь между показателями неполная, вероятностная. Различают парную и множественную корреляцию. Парная корреляция — это связь между двумя показателями, один из которых является фак­торным, а другой — результативным. Множественная корреляция возникает от взаимодействия нескольких факторов с результатив­ным показателем.

Необходимые условия применения корреляционного анализа.

1. Наличие достаточно большого количества наблюдений о ве­личине исследуемых факторных и результативных показателей (в динамике или за текущий год по совокупности однородных объектов).

2. Исследуемые факторы должны иметь количественное измерение и отражение в тех или иных источниках информации. Применение корреляционного анализа позволяет решить сле­дующие задачи:

1) определить изменение результативного показателя под воздей­ствием одного или нескольких факторов (в абсолютном измере­нии), т.е. определить, на сколько единиц изменяется величина результативного показателя при изменении факторного на единицу;

2) установить относительную степень зависимости результативного показателя от каждого фактора.

Корреляционный анализ состоит из нескольких этапов. На первом этапе определяются факторы, которые оказывают воздействие на изучаемый показатель, и отбираются наиболее су­щественные для корреляционного анализа. Отбор факторов — очень важный момент в экономическом анализе: от того, насколь­ко правильно он сделан, зависит точность выводов по итогам ана­лиза. При этом необходимо придерживаться следующих правил: I) при отборе факторов в первую очередь следует учитывать при- чинно-следственные связи между показателями, ибо только они раскрывают сущность изучаемых явлений. Анализ же таких фак­торов, которые находятся только в математических соотношениях с результативным показателем, не имеет практического смысла;

2) при создании многофакторной корреляционной модели необ­ходимо отбирать самые значимые факторы, которые оказывают наиболее существенное воздействие на результативный показа­тель, так как охватить все условия и обстоятельства практически невозможно. Факторы, которые имеют критерий надежности по Стьюденту меньше табличного, не рекомендуется принимать в расчет;

3) в корреляционную модель линейного типа не рекомендуется включать факторы, связь которых с результативным показателем носит криволинейный характер;

4) не рекомендуется включать в корреляционную модель взаимо­связанные факторы. Если парный коэффициент корреляции между двумя факторами больше 0,85, то по правилам корреля­ционного анализа один из них необходимо исключить, иначе это приведет к искажению результатов анализа;

5) нельзя включать в корреляционную модельфакторы, связь которых с результативным показателем носит функциональный характер. Большую помощь при отборе факторов для корреляционной

модели оказывают аналитические группировки, способ сравнения параллельных и динамических рядов, линейные графики. С их по­мощью можно определить наличие, направление и форму зависи­мости между изучаемыми показателями. Отбор факторов можно производить также в процессе решения задачи корреляционного анализа на основе оценки их значимости по критерию Стьюдента, о котором будет сказано ниже.

На втором этапе собирается исходная информация по каждому факторному и результативному показателю. Она должна быть про­верена на достоверность, на однородность и на соответствие зако­ну нормального распределения.

В первую очередь необходимо убедиться в достоверности ин­формации, насколько она соответствует объективной действитель­ности. Использование недостоверной, неточной информации при­ведет.к неточным результатам анализа и к неправильным выво­дам.

Одно из условий корреляционного анализа — однородность ис­следуемой информации относительно распределения ее около сред­него уровня. Если в совокупности имеются группы объектов, ко­торые значительно отличаются от среднего уровня, то это говорит о неоднородности исходной информации.

Критерием однородности информации служат среднеквадра- тическое отклонение и коэффициент вариации, которые рассчи­тываются по каждому факторному и результативному показате­лю.

Среднеквадратическое отклонение показывает абсолютное от­клонение индивидуальных значений от среднеарифметической. ()но определяется по формуле

Коэффициент вариации показывает относительную меру откло- I юния отдельных значений от среднеарифметической. Для его рас­чета используется формула

V = °100.

х

Чем выше коэффициент вариации, тем относительно больший разброс и меньшая выравненность изучаемых объектов. Изменчи­вость вариационного ряда принято считать незначительной, если париания не превышает 10%, средней — если вариация составляет 10—12%, значительной — когда она больше 20%, но не превышает <3%. Если же вариация выше 33%, то это свидетельствует о неод­нородности информации и о необходимости исключения нетипич­ных наблюдений, которые обычно бывают в первых и последних ранжированных рядах выборки.

Следующее требование к исходной информации — подчинение се закону нормального распределения. Для количественной оценки степени отклонения информации от нормального распределения служат отношение показателя асимметрии к ее ошибке и отноше­ние показателя эксцесса к его ошибке.

Показатель асимметрии (А) и его ошибка (ша) рассчитываются но следующим формулам:

пег \ п

Показатель.эксцесса (Е) и его ошибка (ше) рассчитываются сле­дующим образом:

па V п

В симметричном распределении А = 0. Отклонение от нуля ука­зывает на наличие асимметрии в распределении данных около средней величины. Отрицательная асимметрия свидетельствует о том, что преобладают данные с большими значениями, а с меньши­ми значениями встречаются значительно реже. Положительная асимметрия показывает, что чаще встречаются данные с небольши­ми значениями.

В нормальном распределении показатель эксцесса Е = 0. Если Е > 0, то данные густо сгруппированы около средней, образуя ос­тровершинность. Если Е < 0, то кривая распределения будет плос­ковершинной. Однако когда отношения А/та и Е/те меньше 3, то асимметрия и эксцесс не имеют существенного значения и иссле­дуемая информация соответствует закону нормального распреде­ления. Следовательно, ее можно использовать для корреляцион­ного анализа.

На третьем этапе изучается характер и моделируется связь меж­ду факторными и результативными показателями, т.е. подбирается и обосновывается математическое уравнение, которое наиболее точно выражает сущность исследуемой зависимости. Для его обо­снования используются те же приемы, что и для установления на­личия связи: аналитические группировки, линейные графики и др.

Зависимость результативного показателя от определяющих его факторов можно выразить уравнением парной и множественной регрессии. При прямолинейной форме они имеют следующий вид:

уравнение парной регрессии:

Yx = а + Ьх;

уравнение множественной регрессии:

Yx=a + blXl+b2x2 +... + bnxn, где а — свободный член уравнения при х = 0;

х,,х2,...,хп — факторы, определяющие уровень изучаемого результативного показателя;

b,,b2,...,bn — коэффициенты регрессии при факторных по­казателях, характеризующие уровень влияния каждого фактора на результативный показатель в абсолютном выражении.

Если связь между результативным и факторными показателями носит криволинейный характер, то могут быть использованы сте­пенная, логарифмическая, параболическая, гиперболическая и другие функции.

В случаях когда трудно обосновать форму зависимости, реше- мие задачи можно провести по разным моделям и сравнить полу­ченные результаты. Адекватность разных моделей фактическим инисимостям проверяется по критерию Фишера, показателю сред- I и й ошибки аппроксимации и величине множественного коэффи­циента детерминации, о которых речь пойдет позже.

На четвертом этапе проводится расчет основных показателей «нязи корреляционного анализа: уравнения связи, коэффициентов корреляции, детерминации, эластичности и др.

В качестве примера для иллюстрации корреляционного анали- 1 | прямолинейной зависимости используем приведенные в мбл. 3.4 данные об изменении уровня выработки рабочих (Y) в лнисимости от уровня фондовооруженности труда (х).

Расчет уравнения связи (Yx = а + Ьх) сводится к определению параметров а и Ь. Их находят из следующей системы уравнений:

jna+b£x=Xy;

|аХх + ЬХх2 = ХхУ'

| ie п — число наблюдений (в данном примере 10);

х — фондовооруженность труда (стоимость основных произ­водственных фондов на одного работника предприятия), тыс. руб.;

у — среднегодовая выработка продукции одним работником, тыс. руб.

Значения Их, £у, 1х2, Еху рассчитывают на основании фактиче­ских исходных данных (табл. 4.3).

Подставим полученные значения в систему уравнений:

|10а + 40Ь = 54;

[40а +162,76Ь = 219,45.

Умножив все члены первого уравнения на 4, получим:

Г40а + 160Ь = 216;

[40а + 162,76b = 219,45.

Вычтя из второго уравнения первое, узнаем, что 2,76Ь = 3,45. Отсюда b = 3,45/2,76 = 1,25.

54 —(40 1,25) ft „ а = —Д —^ = 0,4.

Таблица 4.3 Расчет производных данных для корреляционного анализа
п X У ху X2 У2 Yx
  3,1 4,5 13,95 9,61 20,25 4,28
  3,4 4,4 14,96 11,56 19,36 4,65
  3,6 4,8 17,28 12,96 23,04 4,90
  3,8 5,0 19,00 14,44 25,00 5,15
  3,9 5,5 21,45 15,21 30,25 5,28
  4,1 5,4 22,14 16,81 29,16 5,52
  4,2 5,8 24,36 17,64 33,64 5,65
  4,4 6,0 26,40 19,36 36,00 5,90
  4,6 6,1 28,06 21,16 37,21 6,15
  4,9 6,5 31,85 24,01 42,25 6,28
Итого     219,45 162,76 296,16 53,75

 

Уравнение связи, описывающее зависимость производительно­сти труда от его фондовооруженности, получило следующее выра­жение:

Yx = 0,4+ 1,25х.

Коэффициент а — постоянная величина результативного пока­зателя, которая не связана с изменением данного фактора. Пара­метр b показывает среднее изменение результативного показателя с повышением или понижением величины факторного показателя на единицу его измерения. В данном примере с увеличением фон­довооруженности труда на 1 тыс. руб. выработка рабочих повыша­ется в среднем на 1,25 тыс. руб.

Подставив в уравнение регрессии соответствующие значения х, можно определить выравненные (теоретические) значения резуль­тативного показателя (Yx) для каждого предприятия. Например, чтобы рассчитать выработку рабочих на первом предприятии, где фондовооруженность труда равна 3,1 тыс. руб., необходимо это значение подставить в уравнение связи:

Yj = 0,4+ 1,25-3,1 =4,28.

Полученная величина показывает, какой была бы выработка рабочих при фондовооруженности труда 3,1 тыс. руб., если бы дан-
мое предприятие использовало свои производственные мощности в такой степени, как в среднем все предприятия этой выборки. Фактическая выработка рабочих на данном предприятии выше расчетного значения. Следовательно, предприятие использует свои производственные мощности несколько лучше, чем в среднем по отрасли. Аналогичные расчеты сделаны для каждого предприятия. Данные приведены в последней графе табл. 4.3. Сравнение факти­ческого уровня выработки рабочих с расчетным позволяет оценить результаты работы отдельных предприятий.

Кроме параболы для описания криволинейной зависимости в корреляционном анализе очень часто используется гипербола:
Для определения ее параметров необходимо решить следующую систему уравнений:

По такому же принципу решается уравнение связи при криволи­нейной зависимости между изучаемыми явлениями. Когда при уве­личении одного показателя значения другого возрастают до опре­деленного уровня, а потом начинают снижаться (например, зави­симость производительности труда рабочих от их возраста), то для описания такой зависимости лучше всего подходит парабола вто­рого порядка:

Yx = a + bx + cx2.

В соответствии с требованиями метода наименьших квадратов для определения параметров a, b и с необходимо решить следу­ющую систему уравнений:

 

Гипербола описывает такую зависимость между двумя показате­лями, когда при увеличении одной переменной значения другой увеличиваются до определенного уровня, а потом прирост замедля­ется, например зависимость урожайности от количества внесенного удобрения, продуктивности животных от уровня их кормления, се­бестоимости единицы продукции от объема ее производства и т.д.

При более сложном характере зависимости между изучаемыми явлениями используются более сложные параболы (третьего, чет­вертого порядка и т.д.), а также квадратические, степенные, пока­зательные и другие функции.

Таким образом, используя тот или иной тип математического уравнения, можно определить степень зависимости между изуча­емыми явлениями, узнать, на сколько единиц в абсолютном изме­рении изменяется величина результативного показателя с измене­нием факторного на единицу. Однако регрессионный анализ не дает ответа на вопрос: насколько тесна эта связь, решающее или второстепенное воздействие оказывает данный фактор на величи­ну результативного показателя?

Для измерения тесноты связи между факторными и результа­тивными показателями исчисляется коэффициент корреляции. При прямолинейной форме связи между изучаемыми показателями он рассчитывается по следующей формуле:

2>5>


 

 


г = -
2 Л
2\
(S4
(2»)
2У-
П

2У-


 

 


219,45-
= 0,97.

V

40-54 10


162,76- — 10
541 10
296,16-

 

 


Подставив значения Хху, Хх; Ху, Хх2 и Ху2 из табл. 4.3 в фор­мулу, получим значение коэффициента корреляции, равное 0,97. Этот коэффициент может принимать значения от 0 до 1. Чем бли­же его величина к единице, тем более тесная связь между изуча­емыми явлениями, и наоборот. В данном случае величина коэф-

фициента корреляции является существенной (г = 0,97). Это по- шоляет сделать вывод о том, что фондовооруженность — один из основных факторов, от которых на анализируемых предприятиях hi висит уровень производительности труда.

Если коэффициент корреляции возвести в квадрат, получим ко­эффициент детерминации (d = 0,94). Он показывает, что производи­тельность труда на 94% зависит от фондовооруженности труда, а на долю других факторов приходится 6% изменения ее уровня.

Что касается измерения тесноты связи при криволинейной форме швисимости, то здесь используется не линейный коэффициент корреляции, а корреляционное отношение, формула которого име- е г следующий вид:


 

Эта формула является универсальной. Ее можно применять для исчисления коэффициента корреляции при любой форме зависи­мости. Однако для его нахождения требуется предварительное ре­шение уравнения регрессии и расчет по нему теоретических (вы­равненных) значений результативного показателя для каждого наблюдения исследуемой выборки (см. гр. 7 табл. 4.3).

Решение задач многофакторного корреляционного анализа произ­водится на ПЭВМ по типовым программам. Сначала формируется матрица исходных данных, в первой графе которой записывается порядковый номер наблюдения, во второй — величина результа­тивного показателя (Yx), а в следующих — данные по факторным показателям (х;). Эти сведения вводятся в ПЭВМ, и рассчитыва­ется уравнение множественной регрессии, которое в нашей задаче получило следующее выражение:

Yx = 0,49 + 3,65х, + 0,09х2 + 1,02х3 - 0,122х4 + 0,052xs, где Y — рентабельность продаж, %; х, — материалоотдача, руб.; х2 — фондоотдача, коп.;

х3 — производительность труда (среднегодовая выработка продукции на одного работника), тыс. руб.;

х4 — продолжительность оборота оборотных средств предпри­ятия, дни;

х5 — удельный вес продукции высшей категории каче­ства^.

Коэффициенты уравнения показывают количественное влия­ние каждого фактора на результативный показатель при неизмен­ности других. В данном случае можно дать следующую интерпре­тацию полученному уравнению: рентабельность повышается на 3,65% при увеличении материалоотдачи на 1 руб.; на 0,09% — с ростом фондоотдачи на 1 коп.; на 1,02% — с повышением сред­негодовой выработки продукции на одного работника на 1 тыс. руб.; на 0,052% — при увеличении удельного веса продукции выс­шей категории качества на 1%. С увеличением продолжительности оборота средств на 1 день рентабельность снижается в среднем на 0,122%.

Пятый этапстатистическая оценка и практическое исполь­зование результатов корреляционного анализа.

Для того чтобы убедиться в надежности показателей связи и правомерности их использования для практической цели, необхо­димо дать им статистическую оценку. Для этого используются кри­терий Стьюдента (t), критерий Фишера (F-отношение), средняя ошибка аппроксимации (е), коэффициенты множественной кор­реляции (R) и детерминации (D).

Надежность коэффициентов корреляции, которая зависит от объ­ема исследуемой выборки данных, проверяется по критерию Стью­дента:

г 1-г2

t =—, где аТ =

, 1Д1/ —,--------

CTr Vn^l

Если расчетное значение t выше табличного, то можно сделать заключение о том, что величина коэффициента корреляции являет­ся значимой. Табличные значения t находят по таблице значений критериев Стьюдента. При этом учитываются количество степеней свободы (V = п — 1) и уровень доверительной вероятности (в эконо­мических расчетах обычно 0,05 или 0,01).

Надежность уравнения связи оценивается с помощью критерия Фишера, расчетное значение которого сравнивается с табличным значением. Если FpaC4>FTa6jl, то гипотеза об отсутствии связи меж­ду исследуемыми показателями отвергается.

Для оценки точности уравнения связи рассчитывается средняя ошибка аппроксимации. Чем меньше теоретическая линия регрес­сии (рассчитанная по уравнению) отклоняется от фактической (эмпирической), тем меньше ее величина, а это свидетельствует о правильности подбора формы уравнения связи. В нашем при­мере она составляет 0,0364, или 3,64%. Учитывая, что в экономи­ческих расчетах допускаемая погрешность находится в пределах 5—8%, можно сделать вывод, что исследуемое уравнение связи довольно точно описывает изучаемые зависимости. С такой же не­большой погрешностью будет делаться и прогноз уровня рента­бельности по данному уравнению.

О полноте уравнения связи можно судить по коэффициентам множественной корреляции и детерминации. Если их значения близки к единице, значит, в корреляционную модель удалось вклю­чить наиболее существенные факторы, на долю которых приходит­ся основная вариация результативного показателя.

Коэффициент множественной корреляции равен 0,92, коэффи­циент множественной детерминации — 0,85. Это значит, что изме­нение уровня рентабельности на 85% зависит от изменения иссле­дуемых факторов, а на долю неучтенных факторов приходится 15% вариации результативного показателя. Значит, данное уравнение связи можно использовать для практических целей, а именно:

а) расчета влияния факторов на прирост результативного по­казателя;

б) подсчета резервов повышения уровня исследуемого показа­теля;

в) планирования и прогнозирования его величины.

Влияние каждого фактора на изменение (отклонение от плана)

результативного показателя рассчитывается следующим образом:

AY = Ь| ■ Дх..

Допустим, что уровень материалоотдачи на анализируемом предприятии по плану на отчетный год — 2,5 руб., фактически — 2,4 руб. Из-за этого уровень рентабельности продукции ниже пла­нового на 0,365%.

ДУХ =3,65 (2,4-2,5) = -0,365%.

xi

Аналогичным образом подсчитывают резервы роста результа­тивного показателя. Для этого планируемый прирост факторного показателя умножают на соответствующий ему коэффициент ре­грессии в уравнении связи:

РТ¥х = РТхгЬг

Предположим, что в следующем году намечается рост матери­алоотдачи с 2,4 до 2,7 руб. За счет этого рентабельность повысит­ся на

PtYx =(2,7-2,4)-3,65 =1,1%.

Ai

Подобные расчеты делаются по каждому фактору с последу­ющим обобщением результатов анализа.

Результаты многофакторного регрессионного анализа могут быть использованы также для планирования и прогнозирования уровня ре­зультативного показателя. С этой целью необходимо в полученное уравнение связи подставить плановый (прогнозный) уровень фак­торных показателей:

Y0=0,49+ 3,65-2,7+ 0,09-85 + 1,02-8,5- - 0,122 • 20 + 0,052 • 33 = 25,95%.

Таким образом, многофакторный корреляционный анализ имеет важную научную и практическую значимость. С установ­лением места и роли каждого фактора в формировании уровня исследуемых показателей точнее обосновываются планы и управ­ленческие решения, объективнее оцениваются итоги деятельно­сти предприятий и полнее определяются внутрихозяйственные резервы.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...