Расчёт множественных коэффициентов корреляции
РЕАЛИЗАЦИЯ ЗАДАЧ МНОГОМЕРНОГО КОРРЕЛЯЦИОННОГО АНАЛИЗА С ИСПОЛЬЗОВАНИЕМ ПАКЕТА MS EXCEL
Проведение корреляционного анализа рассмотрим на примере. С целью анализа взаимосвязи показателей эффективности производства продукции были рассмотрены параметры производственно-хозяйственной деятельности 30 предприятий машиностроения. Необходимо провести анализ взаимосвязи следующих экономических показателей: Результативный признак: Y1 – производительность труда Факторные признаки: Х10 - фондоотдача; Х14 - фондовооруженность труда; Х15 - оборачиваемость нормируемых оборотных средств; X16 - оборачиваемость ненормируемых оборотных средств. Исходные данные представлены в файле Коррел. анализ.xls. Предположим, что рассматриваемые признаки Y1, Х10, Х14, Х15, X16 в генеральной совокупности подчиняются нормальному закону распределения, и указанные данные представляют выборку из этой генеральной совокупности. Для решения данной задачи воспользуемся программным продуктом MS EXCEL. 1. Скопируйте в свою папку или на Рабочий стол файл Коррел. анализ.xls с диска U:\Общая информация\Эконометрика; 2. Откройте файл Коррел. анализ.xls иперейдите на лист Задание; 3. Подключите в Excel пакет анализа: Меню СЕРВИС – Надстройки – Пакет анализа – ОК; Меню СЕРВИС – Анализ данных – Корреляция – ОК; 4. Укажите следующие параметры диалогового окна «Корреляция»: 1. Входной интервал Укажите массив исходных показателей, выделив мышкой все значения исследуемых переменных (Y1, Х10, Х14, Х15, X16). 2. Группирование Установите переключатель в положение по столбцам. Метки в первой строке Поставьте флажок в опции Метки в первой строке, чтобы добавить во входной диапазон верхнюю строку, содержащую названия переменных, тогда корреляционная матрица будет выведена с названиями переменных.
Выходной интервал Поставьте точку в опции Выходной интервал, затем щелкните мышью в строке напротив надписи Выходной интервал и щелкните мышью в ячейку G1 листа Задание. После установки указанных параметров нажмите на кнопку ОК.
Получим корреляционную матрицу в следующем виде: Таблица 1
5. Для дальнейших расчётов необходимо привести корреляционную матрицу к обычному виду, заполнив верхний треугольник таблицы. При этом надо учесть, что матрица парных коэффициентов корреляции является симметричной, и коэффициенты rij = rji. Скопируйте нужные парные коэффициенты корреляции в соответствующие ячейки. В результате мы получим матрицу парных коэффициентов корреляции размерности 5x5: Таблица 2
6. Далее необходимо проверить значимость полученных коэффициентов корреляции, т.е. гипотезу Hо: rij = 0. Для этого рассчитаем наблюдаемые значения t -статистики для всех коэффициентов корреляции по формуле: Для этого скопируйте предыдущую таблицу и вставьте ее под самой собой, отступив две строки. Удалите из таблицы все числовые данные и установите курсор в ячейку на пересечении переменных Y1 и Х10. Находясь в указанной ячейке, введите в строку формул выражение для записи вышеуказанной формулы в следующем виде: =(H3/КОРЕНЬ(1-H3*H3))*КОРЕНЬ(49). При вводе данного выражения необходимо щелкать мышью в ячейку с соответствующим коэффициентом, для которого рассчитывается значение t -статистики, в данном случае в ячейку H3. Введя указанное выражение, нажмите ENTER. Растяните введенную формулу с помощью черного крестика по соседним ячейкам, в результате у вас должна получиться следующая матрица наблюдаемых значений t -статистики:
Таблица 3
Мы вычислили наблюдаемые значения t -статистики только для нижнего треугольника таблицы, поскольку матрица парных коэффициентов корреляции является симметричной. 7. Наблюдаемые значения t -статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости α=0,05 и числа степенен свободы ν =п-2. Для этого используем встроенную функцию Excel ВСТАВКА – Функция – Статистические – СТЬЮДРАСПОБР. Для расчета tкр выделите пустую ячейку, затем вызовите функцию СТЬЮДРАСПОБР, введите в поле Вероятность число 0,05, а в поле Степени_свободы – число 49, поскольку всего мы имеем 51 наблюдение, поэтому ν =п-2=51-2=49. Нажав на кнопку ОК, мы получим следующее значение tкр = 2,009574. Сравним рассчитанные нами наблюдаемые значения t -статистики с критическим (табличным) и определим, какие коэффициенты значимы, а какие нет. Коэффициент значим, если его | tнабл | > tкр. 8. Отметьте жирным шрифтом в таблице значимые коэффициенты корреляции: Таблица 4 Матрица парных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при α=0,05)
9. Для значимыхпарных коэффициентов корреляции построим с заданной надёжностью γ=0,95 интервальную оценку rmin< r < rтах с помощью Z-преобразования Фишера (см. формулы в лекции). Z' можно найти, используя функцию Excel: ВСТАВКА – Функция – Статистические – ФИШЕР, в качестве аргумента вводится значение соответствующего выборочного коэффициента корреляции r.
10. Значение tγ рассчитаем, используя функцию Excel: ВСТАВКА – Функция – Статистические – НОРМСТОБР, где в поле Вероятность вводится значение 0,95. Zmin = ; Zmax = Для обратного преобразования используем функцию Excel: ВСТАВКА – Функция – Статистические –ФИШЕРОБР, где в поле Y вводятсяячейки со значением Zmin, Zmax, т.е. для расчета rmin вводим Zmin, а для расчета rтах вводим Zmax. Расчеты представим в виде следующей таблицы: Таблица 5 Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью γ = 0,95
Таким образом, доверительные интервалы с надёжностью γ = 0,95найдены для всех значимых парных коэффициентов корреляции. По полученным данным можно сделать следующие выводы: Между исследуемыми показателями выявлены значимые корреляционные зависимости. 1). Значимая обратная корреляционная взаимосвязь обнаружена между изучаемым признаком Х10 - фондоотдача и факторным признаком X16 - оборачиваемость ненормируемых оборотных средств. 2). Между производительностью труда (Y1) и фондовооруженностью труда (Х14) имежду производительностью труда (Y1) иоборачиваемостью нормируемых оборотных средств (Х15) существует прямая связь. 3). Наиболее сильная связь существует между результативным признаком производительность труда (Y1) и факторным признаком фондовооруженность труда (Х14), причем отмеченная связь прямая. Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции.
Частные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными при исключении влияния остальных показателей (т.е. характеризуют «чистую» связь только между этими признаками) и важны для понимания взаимодействия всего комплекса показателей, т.к. позволяют определить механизмы усиления-ослабления влияния переменных друг на друга.
Частный коэффициент (k-2)- гo порядка между переменными, например, между Y1 и Х10, равен: , где Rij - алгебраическое дополнение элемента rij корреляционной матрицы R, равное , где Mij – минор-определитель матрицы, полученный из матрицы R путем вычеркивания i- той строки и j- го столбца. 11. Для расчета частных коэффициентов корреляции нужно сформировать в Excel соответствующие матрицы размерности 4*4.
Например, алгебраическое дополнение R12 рассчитывается путем вычеркивания из нашей корреляционной матрицы первой строки и второго столбца:
Аналогично
Чтобы найти определители этих матриц используем функцию Excel: ВСТАВКА - Функция - Математические - МОПРЕД (указать в качестве массива соответствующую матрицу переменных). Воспользовавшись функцией получаем: -(-0,05438) 0,786557 0,528443 Подставив значения в формулу, получаем = - 0,084348 Аналогично проводятся расчеты для всех остальных частных коэффициентов корреляции: R13=(-1)1+3 * M13 = - 0,42585 R34=(-1)3+4 * M34 = - (-0,1) R14=(-1)1+4 * M14 = - 0,225305 R35=(-1)3+5 * M35 = 0,063223 R15=(-1)1+5 * M15 = 0,05218 R45=(-1)4+5 * M45 = - (-0,08965) R23=(-1)2+3 * M23 = - (-0,02282) R33=(-1)3+3 * M33 = 0,702903 R24=(-1)2+4 * M24 = - 0,05483 R44=(-1)4+4 * M44 = 0,551944 R25=(-1)2+5 * M25 = - (-0,18526) R55=(-1)5+5 * M55 = 0,561651
r13/245 = 0,572722 r25/134 = - 0,340055 r14/235 = 0,341947 r34/125 = - 0,160548 r15/234 = - 0,078507 r35/124 = - 0,100622 r23/145 = - 0,037443 r45/123 = - 0,161016 r24/135 = 0,101525 В результате получим матрицу следующего вида: Таблица 6 Матрица частных коэффициентов корреляции исследуемых экономических показателей
12. Далее необходимо проверить значимость полученных частных коэффициентов корреляции. Для этого рассчитаем наблюдаемые значения t -статистик для всех коэффициентов по формуле: где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l =3), n - количество наблюдений. Построим матрицу наблюдаемых значений t -статистик для всех коэффициентов rij:
Таблица 7 Матрица наблюдаемых значений t-статистик для частных коэффициентов корреляции исследуемых экономических показателей
Наблюдаемые значения t -статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости α =0,05 и числа степеней свободы v=n-l-2. Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в диалоговое окно функции вероятность α =0,05 и число степеней свободы v=n-l-2=51-3-2=46. 13. Сравним расчетные значения с критическим и определим, какие коэффициенты значимы. Получим матрицу частных коэффициентов корреляции с выделенными значимыми коэффициентами: Таблица 8 Матрица частных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при α=0,05)
14.Для значимых частных коэффициентов корреляции построим с заданной надёжностью γ интервальную оценку rmin< r < rтах с помощью Z-преобразования Фишера (см. формулы в лекции). Получим следующий результат: Таблица 9 Расчёт доверительных интервалов для частных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью γ = 0,95
15. Построим таблицу сравнения выборочных парных и частных коэффициентов корреляции для всех переменных. Таблица 10 Таблица сравнения выборочных оценок парных и частных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при α=0,05)
По полученным данным можно сделать следующие выводы: 1. Значимые корреляционные зависимости, полученные на этапе расчёта парных коэффициентов корреляции, подтвердились и при вычислении частных коэффициентов корреляции. При этом выявлены следующие механизмы воздействия переменных друг на друга: наиболее тесная связь наблюдается между изучаемым признаком Y1 – производительность труда и факторными признаками Х14 - фондовооруженность труда и Х15 - оборачиваемость нормируемых оборотных средств (прямые зависимости) и между факторными признаками Х10 – фондоотдача и X16 - оборачиваемость ненормируемых оборотных средств(обратная зависимость). 2. Воздействие других переменных, что характерно для частного коэффициента корреляции (для парного коэффициента корреляции рассматриваются только две переменные без прочих посторонних), несколько ослабляет положительную взаимосвязь между производительностью труда (Y1) и фондовооруженностью труда (Х14), т.к. величина частного коэффициент корреляции ry1x14/x10x15x16 = 0,573 меньше величины парного коэффициента корреляции ry1x14 = 0,577. 3. Аналогичная ситуация наблюдается и для обратной связи между фондоотдачей (Х10) и 4. Для связи между производительностью труда (Y1) и оборачиваемостью нормируемых оборотных средств (Х15) характерна обратная ситуация: воздействие других переменных усиливает эту взаимосвязь (величина частного коэффициента корреляции больше величины парного коэффициента корреляции). 5. Наиболее сильная связь, выявленная на этапе расчёта парных коэффициентов корреляции,
Расчёт множественных коэффициентов корреляции
Множественные коэффициенты корреляции служат мерой связи одной переменной с совместным действием всех остальных показателей. 16.Вычислим точечные оценки множественных коэффициентов корреляции. Множественный коэффициент корреляции, например, для 1-го показателя Y1 вычисляется по формуле: где | R | - определитель корреляционной матрицы R; Rij - алгебраическое дополнение элемента rij корреляционной матрицы R. Все алгебраические дополнения Rij были найдены ранее, на этапе расчёта частных коэффициентов корреляции, поэтому осталось вычислить только определитель самой корреляционной матрицы. Чтобы найти определитель корреляционной матрицы, воспользуемся встроенной математической функцией Excel МОПРЕД. Получим |R|= 0,453494. Подставляя полученное значение определителя в формулу, получаем значения множественных коэффициентов корреляции: = 0,650726 = 0,376603 = 0,595674 = 0,422338 = 0,438828
Множественный коэффициент детерминации получается возведением коэффициента корреляции в квадрат. 17. Проверим значимость полученных множественных коэффициентов корреляции и детерминации. Проверка осуществляется с помощью F -критерия: где k - количество рассматриваемых факторов (в нашем случае k = 5), п - количество наблюдений. Произведя расчёты, получим следующую таблицу: Таблица 11 Множественные коэффициенты корреляции и детерминации исследуемых показателей с выделением значимых коэффициентов (на уровне значимости α = 0,05)
18. Для определения значимости множественных коэффициентов корреляции и детерминации нужно найти критическое значение F -распределения для заданного уровня значимости α и числа степеней свободы числителя v1=k-1 и знаменателя v2=n-k. Для определения Fкр воспользуемся встроенной функцией Excel: ВСТАВКА - Функция - Статистические - FРАСПОБР, введя в диалоговое окно функции вероятность α = 0,05 и число степеней свободы v1=k-1=5-1=4 и v2=n-k=51-5-46. Получаем Fкр = 2,574033 Если наблюдаемое значение F -статистики превосходит ее критическое значение, то гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается. Следовательно, в рассматриваемом примере значимыми являются множественные коэффициенты корреляции ry1/x10x14x15x16, rx14/y1x10x15x16, rx16/y1x10x14x15. Множественные коэффициенты корреляции rx10/y1x14x15x16 и rx15/y1x10x14x16 являются незначимыми. Результаты проведенного анализа позволяют сделать следующие выводы: 1.Множественный коэффициент корреляции ry1/x10x14x15x16 = 0,651 значим и имеет достаточно высокое значение, что говорит о том, показатель Y1 – производительность труда имеет тесную связь с многомерным массивом факторных признаков Х10 - фондоотдача, Х14 - фондовооруженность труда, Х15 - оборачиваемость нормируемых оборотных средств и X16 - оборачиваемость ненормируемых оборотных средств. Это даёт основание для проведения дальнейшего регрессионного анализа. 2.Множественный коэффициент детерминации ry1/x10x14x15x162 = 0,423 показывает, что 42,3% доли дисперсии Y1 – производительности труда, обусловлены изменениями факторных признаков. 3.Факторные признаки Х14 - фондовооруженность труда и X16 - оборачиваемость ненормируемых оборотных средств, также имеют значимые значения множественных коэффициентов корреляции и детерминации, что свидетельствует о их достаточно сильной взаимосвязи с рассматриваемыми признаками. Однако, хотя множественные коэффициенты фактора X16 и значимы, но только 19,3% доли его дисперсии обусловлены изменениями переменных, включённых в рассматриваемую модель, а, соответственно 80,7% его дисперсии обусловлены влиянием других, не включённых в модель факторов. 4.Полученные результаты корреляционного анализа, показавшие, что показатель Y1 – производительность труда, имеет тесную связь с многомерным массивом факторных признаков, позволяют перейти ко второму этапу статистического исследования - построению регрессионной модели.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|