Корреляционно – регрессионный анализ. Линейная парная регрессия.
Корреляционно-регрессионный анализ включает в себя измерение тесноты, направление связи и установление аналитического выражения связи. Одним из методов корреляционно-регрессионного анализа является метод парной корреляции, рассматривающий влияние вариации факторного признака Х на результативный У. Аналитическая связь между ними описывается уравнениями: прямой параболы гиперболы Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о наличии линейной связи между ними, а при обратной связи – гиперболической. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная функции. Оценка параметров уравнения регрессии ао и а1 осуществляется методом наименьших квадратов, в основе которого лежит требование минимальности сумм квадратов отклонений эмпирических данных Yi от выровненных (теоретических) Система нормальных уравнений для нахождения параметров линейной парной регрессии имеет вид:
Для оценки типичности параметров уравнения регрессии используется t – критерий Стьюдента. При этом вычисляются значения t - критерия: для параметра
для параметра
В формулах (3) и (4):
σξ- среднее квадратическое отклонение результативного признака
σX- среднее квадратическое отклонение факторного признака Полученные по формулам (3) и (4) фактические значения
Полученные при анализе корреляционной связи параметры уравнения регрессии признаются типичными, если t фактическое больше t критического
По проверенным на типичность параметрам уравнения регрессии производится построение математической модели связи. При этом параметры примененной в анализе математической функции получают соответствующие количественные значения: параметр а 0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр а 1 – на сколько изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения. Проверка практической значимости синтезированных в корреляционно-регрессивном анализе математических моделей осуществляется посредством показателей тесноты связи между признаками х и у. Для статистической оценки тесноты связи применяются следующие показатели вариации: 1. общая дисперсия результативного признака
2. факторная дисперсия результативного признака
Формула (9) характеризует отклонение выровненных значений 3. остаточная дисперсия
Формула (10) характеризует отклонения эмпирических (фактических) значений результативного признака yi от их выровненных значений Соотношение между факторной и общей дисперсиями характеризует меру тесноты связи между признаками x и y
Показатель R2 называется индексом детерминации (причинности). Он выражает долю факторной дисперсии, т.е. характеризует, какая часть общей вариации результативного признака y объясняется изменением факторного признака x. На основе формулы (11) определяется индекс корреляции R
Используя правило сложения дисперсии, получают формулу индекса корреляции
Формула (71) является основным алгоритмом для определения индекса корреляции с использованием машинной обработки анализируемых данных. При прямолинейной форме связи показатель тесноты связи определяется по формуле линейного коэффициента корреляции r. В теории разработаны и на практике применяются различные модификации формулы расчёта данного коэффициента:
или или Заметим, что по абсолютной величине линейный коэффициент корреляции r равен индексу корреляции r только при прямолинейной связи.
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|