Фиктивные переменные
В некоторых задачах по эконометрике, может оказаться нужным включать в модель фактор, имеющий два или более качественных уровней. Это могут быть, например, разного рода атрибутивные признаки: профессия, образование, пол, климатические условия, проживание в определенном регионе.
Пример с фиктивными переменными
Чтобы использовать эти переменные в регрессионной модели, им должны быть присвоены цифровые метки, т. е. качественные переменные преобразованы в количественные. Такого вида сформированные переменные в эконометрике называют фиктивными переменными. В российской литературе по дисциплине эконометрика можно встретить термин «структурные переменные».
Рассмотрим использование фиктивных переменных для функции спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены. В общем виде для всех исследуемых данных уравнение регрессии имеет вид:
![линейное уравнение регрессии линейное уравнение регрессии](/econometrica/fiktiv1.jpg)
где у — количество потребляемого кофе; х — цена кофе.
Аналогичные уравнения находятся отдельно для лиц мужского пола:
![](/econometrica/fiktiv2.jpg)
и женского пола:
![](/econometrica/fiktiv3.jpg)
Разница в потреблении кофе проявятся в различии средних y1 и y2 . Вместе с тем сила влияния х на у может быть одинаковой. В этом случае можно построить общее уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной. Объединяя уравнения y1 и y2 и вводя фиктивные переменные, можно прийти к следующему выражению:
![](/econometrica/fiktiv4.jpg)
где z1 и z2 — фиктивные переменные, принимают значения:
z1 = 1 – мужской пол, 0 – женский пол.
z2 = 0 – мужской пол, 1 – женский пол.
В общем уравнении регрессии переменная у рассматривается как функция не только цены х, но также и пола (z1, z2). Переменная z рассматривается как дихотомическая переменная, которая принимает всего два значения: 1 и 0. При этом когда z1 = 1, то z2 = 0 и наоборот.
Для лиц мужского пола, когда z1 = 1 и z2 = 0, объединенное уравнение регрессии составит:
![](/econometrica/fiktiv5.jpg)
Для лиц женского пола, когда z1 = 0 и z2 = 1
![](/econometrica/fiktiv6.jpg)
Различия в потреблении для лиц мужского и женского пола обусловлены различиями свободных членов уравнения регрессии а. Параметр b является общим для всех лиц, как для мужчин, так и для женщин.
Следует иметь в виду, что при введении фиктивных переменных z1 и z2 в регрессионную модель применение МНК для оценивания параметров a1 и a2 в контрольные по эконометрике приведет к вырожденной матрице исходных данных, а значит к невозможности получения их оценок. Объясняется это тем, что при использовании МНК в таком уравнении появляется свободный член, т.е. уравнение принимает вид
![](/econometrica/fiktiv7.jpg)
Теоретические значения размера потребления кофе для мужского пола будут получены из уравнения
![](/econometrica/fiktiv8.jpg)
Для женского пола соответствующие значения получим из уравнения
![](/econometrica/fiktiv9.jpg)
Сравнивая эти результаты, видно, что различия в уровне потребления мужчин и женщин состоят в различии свободных членов данных уравнений: А — для женщин и А + А1 — для мужчин.
Источник: Эконометрика: Учебник / Под ред. И.И. Елисеевой. – М: Финансы и статистика, 2002. – 344 с.