Количественные критерии оценки тесноты связи
По направлению выделяют связь прямую и обратную. При прямой связи с уменьшением или увеличением значений факторного признака происходит уменьшение или увеличение значений результативного. Например, увеличение степени механизации труда способствует росту рентабельности строительного производства. В случае обратной связи значения результативного признака изменяются в противоположном направлении по сравнению с изменением факторного признака. Так, с увеличением уровня фондоотдачи снижает себестоимость единицы произведенной продукции. По аналитическому выражению выделяют связи прямолинейные (или просто линейные) и нелинейные (криволинейные). Если статистическая связь между явлениями приближенно выражена уравнением прямой линии, то ее называют линейной связью; Если же она выражена уравнением какой либо кривой линии (параболы, гиперболы: степенной, показательной, экспоненциальной и т.д.), то такую связь называют нелинейной или криволинейной. Для выявления наличия связи, ее характера и направления в статистике используются методы: приведения параллельных данных, аналитических группировок, графический, корреляции и регрессии. Метод приведения параллельных данных основан на составлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере. Сравним изменение двух величин:
X 1 2 3 4 5 6 7 8 9
Y 5 6 9 10 14 17 15 20 23
Мы видим, что с увеличением величины x величина y также возрастает. Можно сделать предположение, что связь между ними прямая и что ее можно описать или уравнением прямой, или уравнением параболы второго порядка.
Статистическую связь между двумя признаками можно изобразить графически и по графику судить о наличии, направлении и форме связи. На оси абсцисс откладываются значения факторного признака, на оси ординат – результативного. На графике откладывают все единицы, обладающие определенными значениями x и y и строится поле корреляции. Уточнение формы связи, нахождение ее аналитического выражения производится путем построения уравнения регрессии. Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями: прямой`уx=a0+a1x; параболы `yx=a0+a1x+a2x2; гиперболы`y=a0+a1.¾ х экспоненты `yx=a.a1x Оценка параметров уравнения регрессии a0, a1 (a2 – в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (a0 и a1), при котором минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по уравнению регрессии:
S=å(y-`yx)2®min
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:
ìna0+a1åx=åy; í îa0åx+a1åx2=åxy,
где n – объем исследуемой совокупности (число единиц наблюдения). В уравнении регрессии параметр a0 показывает усредненное влияние на результативный признак неучтенных (не выделенных при исследовании факторов; параметр а1 (а в уравнении параболы и а2) – коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения. Наиболее приемлемым способом отбора факторных признаков является шаговая регрессия (шаговый регрессионный анализ). Сущность метода шаговой регрессии заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости. Факторы поочередно вводятся в уравнение так называемым «прямым методом». При проверке значимости введенного фактора определяется, насколько уменьшается сумма квадратов остатков и увеличивается величина множественного коэффициента корреляции (R2). Одновременно используется и обратный метод, т.е. исключение факторов, ставших незначимыми на основе t-критерия Стьюдента.
При построении модели регрессии студент может столкнуться и с проблемой мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель. Мультиколлинеарность существенно искажает результаты исследования. Одним из индикаторов определения наличия мультиколлинеарности между факторными признаками является превышение величины парного коэффициента корреляции 0,8 (rxi xj ³ 0,8). Устранение мультиколлинеарности может реализоваться через исключение корреляционной модели одного или нескольких линейно-связанных факторных признаков в новые, укрупненные факторы. Пример. По данным о сумме активов (у), кредитных вложений (х1) и величине собственного капитала (х2) коммерческих банков Белоруссии построить множественное уравнение связи. Связь предполагается линейной. Расчетная таблица для определения параметров уравнения регрессии представлена в табл. 9.4. Решение
`yx=a0+a1x+a1x+a2x2.
Система нормальных уравнений имеет вид:
ìna0+a1åx1+a2åx2=åy; ía0åx1+a1åx12+a2åx1x2=åyx1; (9.6) îa0åx2+a1åx1x2+a2åx22=åyx2;
ì7a0+8761a1+1046a2=14757 í8671a0+14266159a1+1510415a2=21956214; î1046a0+1510415a1+175876a2=2534726.
Отсюда: a0=-443,4; a1=0,0368; a2=16,77; `yx1x2=-443,4+0,0368x1+16,77x2. Расчёты показали, что с увеличением кредитных вложений на 1 млрд нац. руб. стоимость их активов возрастёт соответственно на 0,0368 и 16,77 млрд нац. руб. Оценка существенности связи. Принятие решений на основе уравнения регрессии. Проверка адекватности моделей, построенных на основе уравнения регрессии, начинается с проверки значимости каждого коэффициента регрессии.
Если связь между признаками у и х криволинейная и описывается уравнением работы второго порядка:
`yx=a0+a1x+a2x2,
то система нормальных уравнений имеет вид:
ìna0+a1åx+a2åx2=åy; ía0åx+a1åx2+a2åx3=åyx; (9.3) îa0åx2+a1åx3+a2åx4=åyx2.
Оценка обратной зависимости между х и у, когда с увеличением (уменьшением) х уменьшается (увеличивается) значение результативного признака у, может быть осуществлена на основе уравнения гиперболы вида:
a1 `Yx=a0+¾ x
Система нормальных уравнений для нахождения параметров гиперболы следующая:
ì 1 ï na0+a1å¾=åy; ï x í ï 1 1 y ï a0å¾+a1å¾=å¾. î x x2 x
Множественная (многофакторная) регрессия. Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии, описываемой функцией вида:
`Y1,2,…,xk=f(x1,x2,…,xk).
Построение моделей множественной регрессии включает этапы: 1) выбор формы связи (уравнения регрессии); 2) отбор факторных признаков; 3) обеспечение достаточного объёма совокупности для получения несмещённых оценок. Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определённой степени будут описывать эти связи. Поскольку уравнение регрессии строится главным образом для объяснения и количественного выражения взаимосвязей, оно должно хорошо отражать сложившиеся между исследуемыми факторами фактические связи. Практика построения многофакторных моделей взаимосвязи показывает, что все реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей:
Оценка существенности связи. Принятие решений на основе уравнения регрессии. Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии, с помощью t-критерия Стьюдента:
çaiú t = ¾; где б2ai – коэффициент регрессии
бai
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|