Нелинейная корреляционная связь
Тесноту связи между X и Y удобно оценивать в единицах общей дисперсии σy, т.е. рассматривать отношение остаточной дисперсии к дисперсии признака относительно его математического ожидания: {M[ x – M(Y) ]2} / σy2 Эту величину называют теоретическим корреляционным отношением η2Y|x. Для оценки тесноты линейной корреляционной связи между признаками в выборке служит выборочный коэффициент корреляции. Для оценки тесноты нелинейной корреляционной связи вводят новые сводные характеристики: ηyx и ηxy – выборочные корреляционные отношения Y к X и X к Y. Выборочным корреляционным отношением Y к X называют отношение: Ryx = s x / sy, где s x = ; sy = ; nx – частота значения x признака X; ny – частотазначения y признака Y; – общая средняя признака Y; x – условная средняяпризнака Y. Аналогично определяется выборочное корреляционное отношение X к Y: Rxy = s y / sx Однако чаще пользуются коэффициентом детерминации R2 = s2факт / s2общ , который является отношением объясненной с помощью функции регрессии части дисперсии к общей дисперсии. Коэффициент детерминации определяет долю рассеивания величины Y, обусловленную функциональной зависимостью ее от величины X. Величина 1 – R2 = s2ост / s2общ Показывает, какую долю рассеивания случайной величины Y обуславливают случайные факторы. Свойства коэффициента детерминации: · 0 ≤ R2 ≤ 1; · если R2 = 0 (η = 0), признак Y с признаком X корреляционной зависимостью не связан; · если R2 =1 (η =- 1), признак Y связан с признаком X функциональной зависимостью; · R ≥ │rв │ ивыборочное корреляционное отношение не меньше абсолютной величины выборочного коэффициента корреляции: η ≥ │rв │; · если R = │rв │, то имеет место точная линейная корреляционная зависимость, т.е. точки (xi,yi) лежат на прямой линии регрессии, найденной МНК.
С возрастанием R2 корреляционная связь становится более тесной, так как уменьшается (1 – R2), т.е. уменьшается дисперсия, вызванная воздействием неучтенных факторов. Преимущество корреляционного отношения перед коэффициентом корреляции состоит в том, что оно служит мерой тесноты связи любой, в том числе и линейной, формы. Однако, оно не позволяет судить, насколько близко расположены точки наблюдений к кривой определенного вида (параболе, гиперболе и т.д.). Если график регрессии изображается кривой линией, то корреляцию называют криволинейной. В общем случае нелинейная модель регрессионного анализа имеет вид: y = g(x1,x2,…,xk) + ε(x1,x2,…,xk), где g(x1,x2,…,xk) – нелинейная функция регрессии Y на (x1,x2,…,xk); ε(x1,x2,…,xk) – отклонение, погрешность замены истинной зависимости функцией регрессии. В случае двумерной случайной величины функция регрессии g(x) = β0 + β1x + β2x2. Параметры β0, β1 и β2 определяются как значения, при которых остаточная дисперсия регрессии Y на X Sост = становится минимальной. Оценку значимости приближения функций регрессии выполняют с помощью критерия Фишера: Fрасч = , где k – количество факторных признаков (k = 1 для двумерной модели). Если Fрасч > Fкр, гипотеза H0: уравнение регрессии не значимо отвергается и уравнение считается не противоречащим статистическим данным. В противном случае, когда Fрасч < Fкр, гипотеза принимается. Значение Fкр(m1,m2,α) находится по таблице в зависимости от количества факторных признаков k (m1 = k), объема выборки n (m2 = n) и уровня значимости α (0,05).
Тесты для самоконтроля Составьте краткие ответы на вопросы
Характеристика тестов
· всего вопросов – 22; · количество вопросов уровня 1 – 2; уровня 2 – 9; уровня 3 – 11; · количество баллов за вопрос: § уровня 1 – 1; § уровня 2 – 2; § уровня 3 – 3. Количество баллов за раздел II – 53.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|