Элементы теории корреляции.
Между различного рода признаками, случайными величинами практически всегда существует взаимосвязь. Только иногда эту связь мы замечаем, но в большинстве случаев эти взаимосвязи ускользают от нашего внимания. В одних случаях получается функциональная связь, когда между признаками В других случаях получается корреляционная зависимость, когда одному значению признака Корреляционная связь между признаками может быть линейной и нелинейной, положительной и отрицательной. Задача корреляционного анализа сводится к установлению формы и направления связи между признаками, измерению ее тесноты и к оценке достоверности выборочных коэффициентов корреляции. Корреляционным моментом Корреляционный момент служит для характеристики связи между величинами Корреляционный момент равен нулю, если Теорема 1. Корреляционный момент двух независимых случайных величин Доказательство: т.к.
Из определения корреляционного момента следует, что он имеет размерность, равную произведению размерностей величин Такая особенность корреляционного момента является недостатком этой числовой характеристики, т.к. сравнение корреляционных моментов различных систем случайных величин становится затруднительным. Для того чтобы устранить этот недостаток, вводят новую числовую характеристику—коэффициент корреляции Коэффициентом корреляции случайных величин Так как размерность Таким образом, величина коэффициента корреляции не зависит от выбора единиц измерения случайных величин. В этом и состоит преимущество коэффициента корреляции перед корреляционным моментом. Очевидно, коэффициент корреляции независимых случайных величин равен нулю (т.к. Абсолютная величина коэффициента корреляции не превышает единицы: На практике мы имеем дело с выборками, а не с генеральными совокупностями. Поэтому на практике рассчитывают выборочный коэффициент корреляции, который может быть достоверным или нет. Выборочный коэффициент корреляции рассчитывается по следующей формуле:
Коэффициент корреляции удобный показатель связи, получивший широкое применение в практике. Это отвлеченное число, лежащее в пределах от -1 до +1. При независимом варьировании признаков, когда связь между ними отсутствует,
Лишь один недостаток имеется у этого ценного показателя - он способен характеризовать лишь линейный связи. При наличии нелинейной связи между коррелирующими признаками следует использовать другие показатели. Выборочный коэффициент корреляции служит оценкой генерального параметра Пусть двумерная генеральная совокупность Если нулевая гипотеза отвергается, значит, выборочный коэффициент корреляции значимо отличается от нуля (кратко говоря, значим), а Если же нулевая гипотеза будет принята, значит, выборочный коэффициент корреляции является незначимым, а В качестве критерия проверки нулевой гипотезы примем случайную величину Величина Обозначим значение критерия, вычисленное по данным наблюдений, через Правило. Для того чтобы при заданном уровне значимости
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости и числу степеней свободы Если В то время как задача корреляционного анализа - установить, являются ли данные случайные величины взаимосвязанными, цель регрессионного анализа - описать эту связь аналитической зависимостью, т.е. с помощью уравнения. Мы рассмотрим самый несложный случай, когда связь между точками на графике может быть представлена прямой линией. Уравнение этой прямой линии
Зная уравнение прямой, мы можем находить значение функции по значению аргумента в тех точках, где значение
7. Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона. Ранее предполагалось, что закон распределения генеральной совокупности известен. Если же он неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его Проверка гипотезы о предполагаемом законе неизвестного распределения производится так же, как и проверка гипотезы о параметрах распределения, т. е. при помощи специально подобранной случайной величины — критерия согласия. Критерием согласия Имеется несколько критериев согласия, но мы ограничимся описанием применения критерия Пирсона к проверке гипотезы о нормальном распределении генеральной совокупности (критерий аналогично применяется и для др. распределений). Для этого будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты.
Обычно эмпирические и теоретические частоты различаются. Возможно, что расхождение случайно (незначимо) и объясняется либо малым числом наблюдений, либо способом их группировки, либо другими причинами. Возможно, что расхождение частот неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности. Критерий Пирсона отвечает на вопрос «Случайно ли расхождение частот?». Правда, как и любой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений. Итак, пусть по выборке объема Допустим, что в предположении нормального распределения генеральной совокупности вычислены теоретические частоты В качестве критерия проверки нулевой гипотезы примем случайную величину
Эта величина случайная, т.к. в различных опытах она принимает различные, заранее не известные значения. Ясно, что, чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия, и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений. Стоит заметить, что возведение в квадрат разностей частот устраняет возможность взаимного погашения положительных и отрицательных разностей. Делением на Доказано, что при Число степеней свободы находят по равенству В частности, если предполагаемое распределение — нормальное, то оценивают два параметра (математическое ожидание и среднее квадратическое отклонение), поэтому
Так как односторонний критерий более жестко отвергает нулевую гипотезу, чем двусторонний, построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости
Обозначим значение критерия, вычисленное по данным наблюдений, через Правило: для того чтобы при заданном уровне значимости проверить нулевую гипотезу и по таблице критических точек распределения
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|