Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Этапы построения многофакторной корреляционно-регрессионной модели




 

Разработка модели и исследование экономических процессов должны выполняться по следующим этапам.

1. Априорное исследование экономической проблемы.

2. Формирование перечня факторов и их логический анализ.

3. Сбор исходных данных и их первичная обработка.

4. Спецификация функции регрессии.

5. Оценка функции регрессии.

6. Отбор главных факторов.

7. Проверка адекватности модели.

8. Экономическая интерпретация.

9. Прогнозирование неизвестных значений зависимой переменной.

 

Рассмотрим подробнее содержание этапов.

1. Априорное исследование экономической проблемы

В соответствии с целью работы на основе знаний макро- и микроэкономики конкретизируются явления, процессы, зависимость между которыми подлежит оценке. При этом подразумевается прежде всего четкое определение экономических явлений, установление объектов и периода исследования.

На этом этапе исследования должны быть сформулированы экономически осмысленные и приемлемые гипотезы о зависимости экономических явлений.

2. Формирование перечня факторов и их логический анализ

Для определения наиболее разумного числа переменных в регрессионной модели прежде всего ориентируются на соображения профессионально-теоретического характера. Исходя из физического смысла явления, производят классификацию переменных на зависимую и объясняющую.

3. Сбор исходных данных и их первичная обработка

При построении модели исходная информация может быть собрана в трех видах.

1.Динамические (временные) ряды.

2.Пространственная информация - информация о работе нескольких объектов в одном разрезе времени.

3.Сменная - табличная форма. Информация о работе нескольких объектов за разные периоды времени.

Объем выборки зависит от числа факторов, включаемых в модель с учетом свободного члена. Для получения статистически значимой модели требуется на 1 фактор объем выборки, равный наблюдений. Например, если в модель включается 3 фактора, то минимальный объем выборки равен:

,

где - число факторов, включаемых в модель;

- число свободных членов в уравнении.

Если в квартальном разрезе собирать данные, то надо их собрать за 20/4=5 лет.

 

4. Спецификация функции регрессии

На данном этапе исследования дается конкретная формулировка гипотезы о форме связи (линейная или нелинейная, простая или множественная и т.д.). Для этого используются различные критерии для проверки состоятельности гипотетического вида зависимости. На данном этапе проверяются предпосылки корреляционно-регрессионного анализа.

5. Оценка функции регрессии

Здесь определяются числовые значения параметров регрессии и вычисление ряда показателей, характеризующих точность регрессионного анализа.

6. Отбор главных факторов

Выбор факторов - основа для построения многофакторной корреляционно-регрессионной модели.

На этапе "Формирование перечня факторов и их логического анализа" собираются все возможные факторы, обычно более 20-30 факторов. Но это неудобно для анализа, и модель, включающая 20-30 факторов, будет неустойчива. Неустойчивость модели находит выражение в том, что в ней изменение некоторых факторов ведет к увеличению вместо снижения .

Мало факторов тоже плохо. Это может привести к ошибкам при принятии решений в ходе анализа модели. Поэтому необходимо выбирать более рациональный перечень факторов. При этом проводят анализ факторов на мультиколлинеарность.

 

Анализ и способы снижения влияния мультиколлинеарности на значимость модели.

Мультиколлинеарность - попарная корреляционная зависимость между факторами.

Мультиколлинеарная зависимость присутствует, если коэффициент парной корреляции .

Отрицательное воздействие мультиколлинеарности состоит в следующем:

1. Усложняется процедура выбора главных факторов.

2. Искажается смысл коэффициента множественной корреляции (он предполагает независимость факторов).

3. Усложняются вычисления при построении самой модели.

4. Снижается точность оценки параметров регрессии, искажается оценка дисперсии.

Следствием снижения точности является ненадежность коэффициентов регрессии и отчасти неприемлемость их использования для интерпретации как меры воздействия соответствующей объясняющей переменной на зависимую переменную.

Оценки коэффициента становятся очень чувствительными к выборочным наблюдениям. Небольшое увеличение объема выборки может привести к очень сильным сдвигам в значениях оценок. Кроме того, стандартные ошибки оценок входят в формулы критерия значимости, поэтому применение самих критериев становится также ненадежным. Из сказанного ясно, что исследователь должен пытаться установить стохастическую мультиколлинеарность и по возможности устранить ее.

Для измерения мультиколлинеарности можно использовать коэффициент множественной детерминации, который равен:

, (23)

где - коэффициент множественной корреляции.

При отсутствии мультиколлинеарности факторов

, (24)

где - коэффициент парной детерминации, вычисляемый по формуле:

, (5.25)

где - коэффициент парной корреляции между -м фактором и зависимой переменной .

При наличии мультиколлинеарности соотношение (24) не соблюдается. Поэтому в качестве меры мультиколлинеарности используется разность:

. (26)

Чем меньше эта разность, тем меньше мультиколлинеарность. Для устранения мультиколлинеарности используется метод исключения переменных. Этот метод заключается в том, что высоко коррелированные объясняющие переменные (факторы) устраняются из регрессии, и она заново оценивается. Отбор переменных, подлежащих исключению, производится с помощью коэффициентов парной корреляции. Опыт показывает, что если , то одну из переменных можно исключить, но какую переменную исключить из анализа, решают исходя из управляемости факторов на уровне предприятия. Обычно в модели оставляют тот фактор, на который можно разработать мероприятие, обеспечивающее улучшение значения этого фактора в планируемом году. Возможна ситуации, когда оба мультиколлинеарных фактора управляемы на уровне предприятия. Решить вопрос об исключении того или иного фактора можно только в соответствии с процедурой отбора главных факторов.

Процесс отбора факторов не самостоятельный процесс. Он сопровождается построением модели. Принятие решения об исключении факторов производится на основе анализа значений специальных статистических характеристик и с учетом управляемости факторов на уровне предприятия.

Процедура отбора главных факторов обязательно включает следующие этапы:

1. Анализ факторов на мультиколлинеарность и ее исключение.

Здесь производится анализ значений коэффициентов парной корреляции между факторами и .

 

2. Анализ тесноты взаимосвязи факторов () с зависимой переменной ().

Для анализа тесноты взаимосвязи и используются значения коэффициента парной корреляции между фактором и функцией (). Величина определяется на ЭВМ и представлена в корреляционной матрице вида:

Таблица 1

Корреляционная матрица

Номер переменной ...
  ...
  ...
  ...
...
...  
...  

 

 

Факторы, для которых =0, т.е. не связанные с , подлежат исключению в первую очередь. Факторы, имеющие наименьшее значение , могут быть потенциально исключены из модели. Вопрос об их окончательном исключении решается в ходе анализа других статистических характеристик.

 

3. Анализ коэффициентов факторов, которые потенциально могут быть исключены.

Коэффициент учитывает влияние анализируемых факторов на с учетом различий в уровне их колеблемости. Коэффициент показывает, насколько сигм (среднеквадратических отклонений) изменяется функция с изменением соответствующего аргумента на одну сигму при фиксированном значении остальных аргументов:

, (27)

где - коэффициент -го фактора;

- среднеквадратическое отклонение - го фактора;

- среднеквадратическое отклонение функции;

- коэффициент регрессии при -ом факторе.

 

Из двух факторов и может быть исключен тот фактор, который имеет меньшее значение .

Допустим, исключению подлежит один из мультиколлинеарных факторов или . Оба фактора управляемы на уровне предприятия, коэффициенты регрессии и статистически значимы. Фактор более тесно связан с , т.е. , но при этом . В этом случае обычно исключению подлежит фактор .

4. Проверка коэффициентов регрессии на статистическую значимость.

Проверка может быть произведена двумя способами:

1. Проверка статистической значимости по критерию Стьюдента

, (28)

где - коэффициент регрессии при -ом факторе;

- стандартное отклонение оценки параметра [21].

Число степеней свободы статистики равно , где - количество факторов, включенных в модель. Значение ,вычисляемое по (5.28), сравнивают с критическим значением , найденным по табл.1 (приложение) при заданном уровне значимости и числе степеней свободы (двухсторонняя критическая область):

- если , то существенно больше 0, а фактор оказывает существенное влияние на . При этом фактор оставляем в модели;

- если , то фактор исключаем из модели.

2. Проверка статистической значимости по критерию Фишера

(29)

где - многомерный аналог критерию Стьюдента.

Число степеней свободы статистики следующее: . Значение , вычисляемое по формуле (29), сравнивают с критическим значением , найденным по табл.2 (приложение), при заданных уровне значимости и числе степеней свободы , :

- если , то - существенно больше 0, а фактор оказывает существенное влияние на . При этом фактор оставляем в модели;

- если , то фактор исключаем из модели.

 

5. Анализ факторов на управляемость.

В ходе логического анализа на основе экономических знаний исследователь должен сделать вывод: можно ли разработать организационно - технические мероприятия, направленные на улучшение (изменение) выбранных факторов на уровне предприятия. Если это возможно, то данные факторы управляемы. Неуправляемые факторы на уровне предприятия могут быть исключены из модели. Так, например, из двух факторов - средняя техническая скорость автомобилей и - время погрузки-разгрузки на одну ездку при равенстве или близких по значению таких характеристик, как и , и , исключению подлежит . На уровне АТП практически невозможно повлиять на значение технической скорости, которая зависит в основном от климатических условий и величины транспортного потока.

6. Строится новая регрессионная модель без исключенных факторов. Для этой модели определяется коэффициент множественной детерминации .

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...