Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Основы корреляционного анализа




Корреляционным моментом μxy случайных величин X и Y называют математическое ожидание произведения отклонений этих величин от их математических ожиданий:

μxy = M {[ X – M (X) ] [ Y – M (Y) ]}.

Для дискретных случайных величин

μxy = ;

для непрерывных величин

μxy =

Корреляционный момент служит для характеристики связи между величинами X и Y. μxy = 0, если X и Y независимы. Корреляционный момент имеет размерность, равную произведению размерностей X и Y. Для того, чтобы устранить этот недостаток, вводят новую числовую характеристику – коэффициент корреляции.

Коэффициент корреляции ρxy случайных величин X и Y – это отношение корреляционного момента к произведению средних квадратических отклонений этих величин:

ρxy = μxy / (σx σy)

Очевидно, что коэффициент корреляции независимых случайных величин равен нулю. Абсолютная величина ρxy не превышает 1: | ρxy | ≤ 1.

Коэффициенткорреляции ρxy количественная характеристика степени линейной зависимости случайных величин. Чем ближе значение ρxy к 1,темменьше дисперсия, т.е. отклонение Y от наилучшего линейного приближения вида Y = aX + b.

Две случайные величины называются коррелированными, если их корреляционный момент (коэффициент корреляции) отличен от нуля. X и Y называются некоррелированными, если их корреляционный момент равен 0. Две коррелированные случайные величины также и зависимы. Обратное не всегда верно, т.е. из зависимости случайных величин еще не следует их коррелированность. Из независимости двух величин следует их некоррелированность, но из некоррелированности еще нельзя сделать вывод о независимости этих величин.

Однако, из некоррелированности нормально распределенных величин вытекает их независимость.

Оценкой коэффициента корреляции является выборочный коэффициент корреляции rxy. Для его определения необходимо знать оценки следующих параметров: M(x), M(y), σx, σy, т.е. , , sx, sy.

rxy =

При большом числе наблюдений данные группируются и записываются в виде корреляционной таблицы, построенной на основе интервального ряда. Тогда

rxy =

где x,y – варианты признаков X и Y; nxy – частота пары вариант (x,y); n – объем выборки.

Выборочный коэффициент корреляции rxy является оценкой коэффициента корреляции ρxy генеральной совокупности и также как он служит для измерения линейной связи между величинами – количественными признаками X и Y. Если выборка имеет достаточно большой объем и репрезентативна, то заключение о тесноте связи между признаками, полученное по данным выборки, в известной степени может быть распространено и на генеральную совокупность.

Выборочный коэффициент корреляции является точечной оценкой коэффициента корреляции генеральной совокупности. Из равенства нулю выборочного коэффициента корреляции еще не следует равенство нулю самого коэффициента корреляции. Необходимо проверить значимость выборочного коэффициента корреляции r, т.е. установить, достаточна ли его величина для обоснованного вывода о наличии корреляционной связи, и только потом делать выводы. Для этого выдвигают и проверяют нулевую гипотезу H0: ρ = 0. Предполагая, что случайные величины подчиняются двумерному нормальному распределению, вычисляют статистику

t = r ,

которая распределена по закону Стьюдента с k = n-2 степенями свободы. По таблице t – распределения находят критическое значение tкр(α, k) при уровне значимости α и степени свободы k. Если │t │≥ tкр, нулевую гипотезу об отсутствии корреляционной связи между признаками X и Y отвергают. В противном случае, когда │t │< tкр, нет оснований отвергать нулевую гипотезу.

Гипотезу H0: ρ = 0 можно проверить, сравнив значение выборочного коэффициента корреляции с rкр, найденным по таблице Фишера-Йетса по параметрам – уровню значимости α и объему выборки (rкр(0,05; 50) = 0,273). Если │rнабл │> rкр, гипотеза H0 отвергается.

В случае значимого выборочного коэффициента корреляции имеет смысл построение доверительного интервала для коэффициента корреляции ρ. Для оценки коэффициента корреляции нормально распределенной генеральной совокупности (при n ≥ 50) можно воспользоваться формулой

r – 3 .

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...