Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Алгоритм однократного регрессионного и корреляционного анализа

КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ, РАСЧЕТ КОЭФФИЦИЕНТОВ УРАВНЕНИЯ ОДНОФАКТОРНОЙ РЕГРЕССИИ. ПРИМЕРЫ ПРИМЕНЕНИЯ ОДНОФАКТОРНОГО АНАЛИЗА

Важнейшим понятием математической статистики является ко-эффициент корреляции - мера взаимосвязи случайных величин.

В переводе с латинского слово correlatio означает взаимосвязь, взаимозависимость. Модели в виде простых уравнений, устанавливающие связь между двумя или несколькими переменными называются регрессионными. Термин регрессия предложил Ф.Гальтон в работе «Регрессия» в 1885 г., и происходит он от слова to regress - двигаться обратно по отношению к среднему[3].

Если случайных величин две, говорят о коэффициенте парной корреляции. Если случайных величин несколько, то их взаимосвязь выражает коэффициент множественной корреляции.

Основная особенность его заключается в ограниченности пределами 1. -1 < r < +1. Для убывающих зависимостей r -1,для возрастающих r +1.

Смысл коэффициента корреляции в том, что он характеризует степень взаимозависимости двух величин.

Для зависимости y = ax+в коэффициент корреляции - это мера линейности y. Коэффициент корреляции является статистической характеристикой. Его обозначают r или R. Возможные ситуации показаны на рисунке 8.1.

Возможные значения коэффициента корреляции

Рис. 8.1

а) r =1.имеет место функциональная зависимость y=ax+b;

б) r =0.6;

в) r =0 - никакой зависимости нет.

В большинстве случаев 0 < r < 1, если r >= 0.8 - хорошая корреляция; r < 0.6 - плохая корреляция.

Алгоритм расчета коэффициента корреляции для зависимости y=ax+в чрезвычайно прост.

r=Mxy/Sx*Sy; (8.1)

 

(8.2)

где Мxy - коэффициент ковариации, также характеризует связь случайных величин, но в отличие от r может принимать какое угодно положительное значение;

Sx, Sy - среднее квадратичное отклонение по Х и по У.

Для линейной зависимости алгоритм нахождения коэффициентов корреляции в уравнении y=ax+в предельно прост. Существуют иные формулы расчета, но мы выберем самые компактные.

; (8.3)

_ _

b = Y - aX; (8.4)

Очень часто инженеры и исследователи забывают, что коэф-фициент «b» имеет размерность функции «У», коэффициент «a» имеет размерность функции деленную на размерность аргумента «X».

[ b ]=[ Y ]

[ a ]=[ Y]/[ X ],

где Sx и Sy те же, что в уравнении (8.1).

- средние значения коэффициентов У и Х.

Вывод формул 8.3 и 8.4 возможен с помощью методов наименьших квадратов и рассматривается в приложении 2.

Понятие об адекватности модели

Вполне естественно возникает вопрос - как же установить насколько модель соответствует эксперименту? Соответствие мо-дели экспериментальным данным называется адекватностью модели. В статистике принято несколько критериев адекватности. Рассмотрим некоторые из них.

I. Среднее относительное отклонение (погрешность)

, (8.5)

где Уэ - наблюдаемое значение функции;

Ур - расчетное значение;

N - число точек (число наблюдений).

Обычно в экономике принимают значения этого критерия при Е < 10%. Средняя относительная ошибка является грубым критерием. Для эффективного использования этого критерия надо иметь хорошие экспериментальные данные.

II.Критерий Фишера

Смысл этого критерия заключается в сравнении двух разбро-сов точек (сравнение двух дисперсий) вокруг средних значений. При этом сравнивается разброс расчетных точек вокруг точек регрессии с естественным разбросом экспериментальных данных.

Вычисление критерия Фишера проводят по следующим форм-лам:

где Дуэ, Sуэ, Дур, Sур -дисперсия и среднеквадратичное отклонение эмперического и расчетного значения функции соответственно.

Для уравнения регрессии типа У = ах+в,эти характеристики рассчитываются по следующим формулам:

(8.7)

Условием адекватности является выполнение неравенства:

F < Fтабл., (8.8)

где Fтабл. - табличное значение критерия Фишера, которое определяется доверительной вероятностью (обычно 0.95) и числом степеней свободы (f = N - 1).

В какой-то степени коэффициент корреляции является мерой адекватности, так при r > 0,8 заведомо можно говорить о хорошей регрессионной модели, в остальных случаях проверка на адекват-ность по всем критериям объективно необходима.

Итак, алгоритм и программа линейного регрессионного ана-лиза предельно просты.

Алгоритм однократного регрессионного и корреляционного анализа

1.Ввод исходных данных: Хi;Yi;N.

2.Находим Хi и Yi.

3.Находим среднее арифметическое

4.Находим коэффициент ковариации:

5.Вычисляем сумму квадратов отклонений от средней величины (дисперсию)

6.Находим среднеквадратичное отклонение

7.Вычисляем коэффициент корреляции:

8.Находим коэффициенты уравнения а и в и критерий Фишера:

Ниже предлагаем программу однофакторного регрессионного анализа, написанную на языке БЕЙСИК.

ПРОГРАММА

Однофакторного регрессионного и корреляционного анализа

5 REM ПР-МА РАСЧЕТА К-ЭНТОВ РЕГРЕССИИ

100 CLS

110 INPUT «ВВЕДИТЕ N:»;N

120 DIM X(N):DIM Y(N)

130 PRINT «***** РЕЗ-ТЫ ОПЫТОВ ************»

140 FOR I=1 TO N

150 INPUT «X(I)=?;X(I)

160 INPUT «Y(I)=?;Y(I)

170 NEXT I

180 X1=0:Y1=0

190 FOR I=1 TO N

200 X1 = X1+ X(I)

210 Y1 = Y1+ Y(I)

220 NEXT I

230 XM = X1 / N: YM / N

240 PRINT «СРЕДН. ПО Х ===>; XM: PRINT «СРЕДН. ПО Y

===>»;YM

250 DX = 0: DY = 0: MXY = 0

260 FOR I= 1 TO N

270 DX = DX + ((X (I) - XM)^2)/ (N-1)

280 DY = DY + ((Y(I) - YM)^2)/ (N-1)

290 MXY = MXY + (X (I) - XM)*(Y(I) - YM)/ (N-1)

300 NEXT I

310 SX = SQR(DX):SY = SQR(DY)

320 PRINT «СРЕДН. КВ. SX==>; SX: PRINT «СРЕДН. КВ. SY

==>»;SY 330 R = MXY/(SX*SY)

340 PRINT «КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ===>»;R

350 A = R*SY/SX

360 B = YM - (A*XM)

370 PRINT «КОЭФФИЦИЕНТ A = «;A:PRINT «КОЭФ-

ФИЦИЕНТ B = «;B

380 DEF FNK(X) = A*X(I) + B

390 T = 0

400 FOR I = 1 TO N

410 PRINT «K(X(«;I;))=;FNK(X(I))

420 T = T + FNK (X(I))

430 NEXT I

440 TS = T /N:P = 0

460 FOR I = 1 TO N

470 P = P + ((FNK (X(I)) - TS)^2) / (N-1)

480 NEXT I

490 IF P<=DY THEN 520

500 F = P / DY

510 GOTO 530

520 F = DY / P

530 PRINT «КРИТЕРИЙ ФИШЕРА F ===>»;F

540 END

 

Таблица 8.1

Условные обозначения

Вычисляемая переменная Обозначение в алгоритме Обозначение в программе
Среднее арифметическое X Y Mx My
Дисперсия Дх Ду Дх Ду
Среднеквадратичное отклонение Sх Sу Cх Cу
Коэффициент ковариации Мху Мху
Критерий Фишера F F
     

Литература

.

1.Ферстер Э.,Ренц Б. Методы корреляционного и регрессион-ного анализа. М.: Финансы и статистика, 1983.-302 с.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...