Главная | Обратная связь | Поможем написать вашу работу!

Тема 2. 6. Регрессионные модели с переменной структурой (фиктивные переменные)

До сих пор в качестве факторов рассматривались экономические переменные, принимающие количественные значения в некотором интервале.

Вместе с тем может оказаться необходимым включить в модель фактор, имеющий два или более качественных уровней.

Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону.

Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т.е. качественные переменные преобразованы в количественные.

Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными.

Рассмотрим применение фиктивных переменных для функции спроса.

Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены.

В общем виде для совокупности обследуемых уравнение регрессии имеет вид:

где

– количество потребляемого кофе;

– цена.

Аналогичные уравнения могут быть найдены отдельно для лиц мужского пола:

и женского пола:

Различия в потреблении кофе проявятся в различии средних и .

Вместе с тем сила влияния на может быть одинаковой, т.е.

В этом случае возможно построение общего уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной.

Объединяя уравнения и и, вводя фиктивные переменные, можно прийти к следующему выражению:

где

и – фиктивные переменные, принимающие значения:

В общем уравнении регрессии зависимая переменная рассматривается как функция не только цены но и пола .

Переменная рассматривается как дихотомическая переменная, принимающая всего два значения: 1 и 0.

При этом когда , то , и наоборот.

Для лиц мужского пола, когда

объединенное уравнение регрессии составит:

а для лиц женского пола, когда

Иными словами, различия в потреблении для лиц мужского и женского пола вызваны различиями свободных членов уравнения регрессии:

Параметр является общим для всей совокупности лиц, как для мужчин, так и для женщин.

Однако при введении двух фиктивных переменных и в модель

применение МНК для оценивания параметров и приведет к вырожденной матрице исходных данных, а следовательно, и к невозможности получения их оценок.

Объясняется это тем, что при использовании МНК в данном уравнении появляется свободный член, т.е. уравнение примет вид

Предполагая при параметре независимую переменную, равную 1, имеем следующую матрицу исходных данных:

В рассматриваемой матрице существует линейная зависимость между первым, вторым и третьим столбцами: первый равен сумме второго и третьего столбцов.

Поэтому матрица исходных факторов вырождена.

Выходом из создавшегося затруднения может явиться переход к уравнениям

или

т.е. каждое уравнение включает только одну фиктивную переменную или .

Предположим, что определено уравнение

где принимает значения 1 для мужчин и 0 для женщин.

Теоретические значения размера потребления кофе для мужчин будут получены из уравнения

Для женщин соответствующие значения получим из уравнения

Сопоставляя эти результаты, видим, что различия в уровне потребления мужчин и женщин состоят в различии свободных членов данных уравнений: – для женщин и – для мужчин.

Теперь качественный фактор принимает только два состояния, которым соответствуют значения 1 и 0.

Если же число градаций качественного признака-фактора превышает два, то в модель вводится несколько фиктивных переменных, число которых должно быть меньше числа качественных градаций.

Только при соблюдении этого положения матрица исходных фиктивных переменных не будет линейно зависима и возможна оценка параметров модели.

Пример.

Проанализируем зависимость цены двухкомнатной квартиры от ее полезной площади.

При этом в модель могут быть введены фиктивные переменные, отражающие тип дома: «хрущевка», панельный, кирпичный.

При использовании трех категорий домов вводятся две фиктивные переменные: и .

Пусть переменная принимает значение 1 для панельного дома и 0 для всех остальных типов домов; переменная принимает значение 1 для кирпичных домов и 0 для остальных; тогда переменные и принимают значения 0 для домов типа «хрущевки».

Предположим, что уравнение регрессии с фиктивными переменными составило:

Частные уравнения регрессии для отдельных типов домов, свидетельствуя о наиболее высоких ценах квартир в панельных домах, будут иметь следующий вид:

«хрущевки» –

;

панельные –

;

кирпичные –

Параметры при фиктивных переменных и представляют собой разность между средним уровнем результативного признака для соответствующей группы и базовой группы.

В рассматриваемом примере за базу сравнения цены взяты дома «хрущевки», для которых

Параметр при , равный 2200, означает, что при одной и той же полезной площади квартиры цена ее в панельных домах в среднем на 2200 долл. США выше, чем в «хрущевках».

Соответственно параметр при показывает, что в кирпичных домах цена выше в среднем на 1600 долл. при неизменной величине полезной площади по сравнению с указанным типом домов.

В отдельных случаях может оказаться необходимым введение двух и более групп фиктивных переменных, т.е. двух и более качественных факторов, каждый из которых может иметь несколько градаций.

Например, при изучении потребления некоторого товара наряду с факторами, имеющими количественное выражение (цена, доход на одного члена семьи, цена на взаимозаменяемые товары и др.), учитываются и качественные факторы.

С их помощью оцениваются различия в потреблении отдельных социальных групп населения, дифференциация в потреблении по полу, национальному составу и др.

При построении такой модели из каждой группы фиктивных переменных следует исключить по одной переменной.

Так, если модель будет включать три социальные группы, три возрастные категории и ряд экономических переменных, то она примет вид:

где

– потребление;

– экономические (количественные) переменные.

До сих пор мы рассматривали фиктивные переменные как факторы, которые используются в регрессионной модели наряду с количественными переменными.

Вместе с тем возможна регрессия только на фиктивных переменных.

Например, изучается дифференциация заработной платы рабочих высокой квалификации по регионам страны.

Модель заработной платы может иметь вид:

где

– средняя заработная плата рабочих высокой квалификации по отдельным предприятиям;

………………………………………………………………………..

Поскольку последний район, указанный в модели, обозначен , то в исследование включено район.

Мы рассмотрели модели с фиктивными переменными, в которых последние выступают факторами.

Может возникнуть необходимость построить модель, в которой дихотомический признак, т.е. признак, который может принимать только два значения, играет роль результата.

Подобного вида модели применяются, например, при обработке данных социологических опросов.

В качестве зависимой переменной рассматриваются ответы на вопросы, данные в альтернативной форме: «да» или «нет».

Поэтому зависимая переменная имеет два значения: 1, когда имеет место ответ «да», и 0 – во всех остальных случаях.

Модель такой зависимой переменной имеет вид:

Модель является вероятностной линейной моделью.

В ней принимает значения 1 и 0, которым соответствуют вероятности и .

Поэтому при решении модели находят оценку условной вероятности события при фиксированных значениях .

Для оценки параметров линейно-вероятностной модели применяются методы Logit-, Probit- и Tobit-анализа.

Такого рода модели используют при работе с неколичественными переменными.

Как правило, это модели выбора из заданного набора альтернатив.

Зависимая переменная представлена дискретными значениями (набор альтернатив), объясняющие переменные – характеристики альтернатив (время, цена), – характеристики индивидов (возраст, доход, уровень образования).

Модель такого рода позволяет предсказать долю индивидов в генеральной совокупности, которые выбирают данную альтернативу.

Среди моделей с фиктивными переменными наибольшими прогностическими возможностями обладают модели, в которых зависимая переменная рассматривается как функция ряда экономических факторов и фиктивных переменных .

Последние обычно отражают различия в формировании результативного признака по отдельным группам единиц совокупности, т.е. в результате неоднородной структуры пространственного или временного характера.

⇐ Предыдущая 5 6 7 8 91011 12 13 14 Следующая ⇒

Воспользуйтесь поиском по сайту: