Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Нелинейная корреляционная связь




Тесноту связи между X и Y удобно оценивать в единицах общей дисперсии σy, т.е. рассматривать отношение остаточной дисперсии к дисперсии признака относительно его математического ожидания:

{M[ x – M(Y) ]2} / σy2

Эту величину называют теоретическим корреляционным отношением η2Y|x.

Для оценки тесноты линейной корреляционной связи между признаками в выборке служит выборочный коэффициент корреляции. Для оценки тесноты нелинейной корреляционной связи вводят новые сводные характеристики: ηyx и ηxy – выборочные корреляционные отношения Y к X и X к Y.

Выборочным корреляционным отношением Y к X называют отношение:

Ryx = s x / sy,

где s x = ; sy = ;

nx – частота значения x признака X; ny частотазначения y признака Y;

– общая средняя признака Y; x – условная средняяпризнака Y.

Аналогично определяется выборочное корреляционное отношение X к Y: Rxy = s y / sx

Однако чаще пользуются коэффициентом детерминации

R2 = s2факт / s2общ ,

который является отношением объясненной с помощью функции регрессии части дисперсии к общей дисперсии. Коэффициент детерминации определяет долю рассеивания величины Y, обусловленную функциональной зависимостью ее от величины X. Величина

1 – R2 = s2ост / s2общ

Показывает, какую долю рассеивания случайной величины Y обуславливают случайные факторы.

Свойства коэффициента детерминации:

· 0 ≤ R2 ≤ 1;

· если R2 = 0 (η = 0), признак Y с признаком X корреляционной зависимостью не связан;

· если R2 =1 (η =- 1), признак Y связан с признаком X функциональной зависимостью;

· R │rв │ ивыборочное корреляционное отношение не меньше абсолютной величины выборочного коэффициента корреляции: η ≥ │rв;

· если R = │rв, то имеет место точная линейная корреляционная зависимость, т.е. точки (xi,yi) лежат на прямой линии регрессии, найденной МНК.

С возрастанием R2 корреляционная связь становится более тесной, так

как уменьшается (1 – R2), т.е. уменьшается дисперсия, вызванная воздействием неучтенных факторов.

Преимущество корреляционного отношения перед коэффициентом

корреляции состоит в том, что оно служит мерой тесноты связи любой, в том числе и линейной, формы. Однако, оно не позволяет судить, насколько близко расположены точки наблюдений к кривой определенного вида (параболе, гиперболе и т.д.).

Если график регрессии изображается кривой линией, то корреляцию называют криволинейной. В общем случае нелинейная модель регрессионного анализа имеет вид:

y = g(x1,x2,…,xk) + ε(x1,x2,…,xk),

где g(x1,x2,…,xk) – нелинейная функция регрессии Y на (x1,x2,…,xk); ε(x1,x2,…,xk) – отклонение, погрешность замены истинной зависимости функцией регрессии. В случае двумерной случайной величины функция регрессии

g(x) = β0 + β1x + β2x2.

Параметры β0, β1 и β2 определяются как значения, при которых остаточная

дисперсия регрессии Y на X Sост = становится минимальной.

Оценку значимости приближения функций регрессии выполняют с помощью критерия Фишера:

Fрасч = ,

где k – количество факторных признаков (k = 1 для двумерной модели).

Если Fрасч > Fкр, гипотеза H0: уравнение регрессии не значимо отвергается и уравнение считается не противоречащим статистическим данным. В противном случае, когда Fрасч < Fкр, гипотеза принимается. Значение Fкр(m1,m2,α) находится по таблице в зависимости от количества факторных признаков k

(m1 = k), объема выборки n (m2 = n) и уровня значимости α (0,05).

 

Тесты для самоконтроля

Составьте краткие ответы на вопросы

  1. Двумерная случайная величина и законы ее распределения – уровень 2.
  2. Условная вероятность и условное распределение – уровень 2.
  3. Условное математическое ожидание и функция регрессии – уровень 2.
  4. Корреляционный момент и коэффициент корреляции – уровень 2.
  5. Выборочный коэффициент корреляции – уровень 2.
  6. Коррелированные и не коррелированные случайные величины – уровень 1.
  7. Проверка значимости коэффициента корреляции – уровень 3.
  8. Доверительный интервал для коэффициента корреляции – уровень 3.
  9. Среднеквадратическая регрессия Y на X – уровень 3.
  10. Остаточная дисперсия Y относительно X – уровень 3.
  11. Условное среднее – уровень 1.
  12. Выборочное уравнение регрессии – уровень 2.
  13. Оценка параметров уравнения прямой линии регрессии – уровень 3.
  14. Оценка значимости коэффициентов регрессии – уровень 3.
  15. Оценка значимости линейной функции регрессии – уровень 3.
  16. Доверительный интервал для значимых параметров – уровень 3.
  17. Основное назначение и идея дисперсионного анализа – уровень 2.
  18. Факторная и остаточная дисперсия – уровень 3.
  19. Оценка тесноты нелинейной корреляционной связи – уровень 2.
  20. Коэффициент детерминации и его свойства – уровень 3.
  21. Нелинейная функция регрессии – уровень 2.
  22. Оценка значимости нелинейной функции регрессии для двумерной системы – уровень 3.

Характеристика тестов

· всего вопросов – 22;

· количество вопросов уровня 1 – 2; уровня 2 – 9; уровня 3 – 11;

· количество баллов за вопрос:

§ уровня 1 – 1;

§ уровня 2 – 2;

§ уровня 3 – 3.

Количество баллов за раздел II – 53.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...