Алгоритм однократного регрессионного и корреляционного анализа
КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ, РАСЧЕТ КОЭФФИЦИЕНТОВ УРАВНЕНИЯ ОДНОФАКТОРНОЙ РЕГРЕССИИ. ПРИМЕРЫ ПРИМЕНЕНИЯ ОДНОФАКТОРНОГО АНАЛИЗА Важнейшим понятием математической статистики является ко-эффициент корреляции - мера взаимосвязи случайных величин. В переводе с латинского слово correlatio означает взаимосвязь, взаимозависимость. Модели в виде простых уравнений, устанавливающие связь между двумя или несколькими переменными называются регрессионными. Термин регрессия предложил Ф.Гальтон в работе «Регрессия» в 1885 г., и происходит он от слова to regress - двигаться обратно по отношению к среднему[3]. Если случайных величин две, говорят о коэффициенте парной корреляции. Если случайных величин несколько, то их взаимосвязь выражает коэффициент множественной корреляции. Основная особенность его заключается в ограниченности пределами 1. -1 < r < +1. Для убывающих зависимостей r -1,для возрастающих r +1. Смысл коэффициента корреляции в том, что он характеризует степень взаимозависимости двух величин. Для зависимости y = ax+в коэффициент корреляции - это мера линейности y. Коэффициент корреляции является статистической характеристикой. Его обозначают r или R. Возможные ситуации показаны на рисунке 8.1. Возможные значения коэффициента корреляции Рис. 8.1 а) r =1.имеет место функциональная зависимость y=ax+b; б) r =0.6; в) r =0 - никакой зависимости нет. В большинстве случаев 0 < r < 1, если r >= 0.8 - хорошая корреляция; r < 0.6 - плохая корреляция. Алгоритм расчета коэффициента корреляции для зависимости y=ax+в чрезвычайно прост. r=Mxy/Sx*Sy; (8.1)
(8.2) где Мxy - коэффициент ковариации, также характеризует связь случайных величин, но в отличие от r может принимать какое угодно положительное значение;
Sx, Sy - среднее квадратичное отклонение по Х и по У. Для линейной зависимости алгоритм нахождения коэффициентов корреляции в уравнении y=ax+в предельно прост. Существуют иные формулы расчета, но мы выберем самые компактные. ; (8.3) _ _ b = Y - aX; (8.4) Очень часто инженеры и исследователи забывают, что коэф-фициент «b» имеет размерность функции «У», коэффициент «a» имеет размерность функции деленную на размерность аргумента «X». [ b ]=[ Y ] [ a ]=[ Y]/[ X ], где Sx и Sy те же, что в уравнении (8.1). - средние значения коэффициентов У и Х. Вывод формул 8.3 и 8.4 возможен с помощью методов наименьших квадратов и рассматривается в приложении 2. Понятие об адекватности модели Вполне естественно возникает вопрос - как же установить насколько модель соответствует эксперименту? Соответствие мо-дели экспериментальным данным называется адекватностью модели. В статистике принято несколько критериев адекватности. Рассмотрим некоторые из них. I. Среднее относительное отклонение (погрешность) , (8.5) где Уэ - наблюдаемое значение функции; Ур - расчетное значение; N - число точек (число наблюдений). Обычно в экономике принимают значения этого критерия при Е < 10%. Средняя относительная ошибка является грубым критерием. Для эффективного использования этого критерия надо иметь хорошие экспериментальные данные. II.Критерий Фишера Смысл этого критерия заключается в сравнении двух разбро-сов точек (сравнение двух дисперсий) вокруг средних значений. При этом сравнивается разброс расчетных точек вокруг точек регрессии с естественным разбросом экспериментальных данных. Вычисление критерия Фишера проводят по следующим форм-лам: где Дуэ, Sуэ, Дур, Sур -дисперсия и среднеквадратичное отклонение эмперического и расчетного значения функции соответственно. Для уравнения регрессии типа У = ах+в,эти характеристики рассчитываются по следующим формулам:
(8.7) Условием адекватности является выполнение неравенства: F < Fтабл., (8.8) где Fтабл. - табличное значение критерия Фишера, которое определяется доверительной вероятностью (обычно 0.95) и числом степеней свободы (f = N - 1). В какой-то степени коэффициент корреляции является мерой адекватности, так при r > 0,8 заведомо можно говорить о хорошей регрессионной модели, в остальных случаях проверка на адекват-ность по всем критериям объективно необходима. Итак, алгоритм и программа линейного регрессионного ана-лиза предельно просты. Алгоритм однократного регрессионного и корреляционного анализа 1.Ввод исходных данных: Хi;Yi;N. 2.Находим Хi и Yi. 3.Находим среднее арифметическое 4.Находим коэффициент ковариации: 5.Вычисляем сумму квадратов отклонений от средней величины (дисперсию) 6.Находим среднеквадратичное отклонение 7.Вычисляем коэффициент корреляции: 8.Находим коэффициенты уравнения а и в и критерий Фишера: Ниже предлагаем программу однофакторного регрессионного анализа, написанную на языке БЕЙСИК. ПРОГРАММА Однофакторного регрессионного и корреляционного анализа 5 REM ПР-МА РАСЧЕТА К-ЭНТОВ РЕГРЕССИИ 100 CLS 110 INPUT «ВВЕДИТЕ N:»;N 120 DIM X(N):DIM Y(N) 130 PRINT «***** РЕЗ-ТЫ ОПЫТОВ ************» 140 FOR I=1 TO N 150 INPUT «X(I)=?;X(I) 160 INPUT «Y(I)=?;Y(I) 170 NEXT I 180 X1=0:Y1=0 190 FOR I=1 TO N 200 X1 = X1+ X(I) 210 Y1 = Y1+ Y(I) 220 NEXT I 230 XM = X1 / N: YM / N 240 PRINT «СРЕДН. ПО Х ===>; XM: PRINT «СРЕДН. ПО Y ===>»;YM 250 DX = 0: DY = 0: MXY = 0 260 FOR I= 1 TO N 270 DX = DX + ((X (I) - XM)^2)/ (N-1) 280 DY = DY + ((Y(I) - YM)^2)/ (N-1) 290 MXY = MXY + (X (I) - XM)*(Y(I) - YM)/ (N-1) 300 NEXT I 310 SX = SQR(DX):SY = SQR(DY) 320 PRINT «СРЕДН. КВ. SX==>; SX: PRINT «СРЕДН. КВ. SY ==>»;SY 330 R = MXY/(SX*SY) 340 PRINT «КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ===>»;R 350 A = R*SY/SX 360 B = YM - (A*XM) 370 PRINT «КОЭФФИЦИЕНТ A = «;A:PRINT «КОЭФ- ФИЦИЕНТ B = «;B 380 DEF FNK(X) = A*X(I) + B 390 T = 0 400 FOR I = 1 TO N 410 PRINT «K(X(«;I;))=;FNK(X(I)) 420 T = T + FNK (X(I)) 430 NEXT I 440 TS = T /N:P = 0 460 FOR I = 1 TO N 470 P = P + ((FNK (X(I)) - TS)^2) / (N-1) 480 NEXT I 490 IF P<=DY THEN 520 500 F = P / DY 510 GOTO 530 520 F = DY / P 530 PRINT «КРИТЕРИЙ ФИШЕРА F ===>»;F 540 END
Таблица 8.1 Условные обозначения
Литература
. 1.Ферстер Э.,Ренц Б. Методы корреляционного и регрессион-ного анализа. М.: Финансы и статистика, 1983.-302 с.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|