Поиск параметров множественной регресии. Оценка значимости. Статистика Дарбина-Уотсона

Имеются данные по странам за 2005 год. Построить регрессионную модель:

Y= β0  +  β1 Х1  +  β2  Х2 .

Задание.

  1. По МНК оценить коэффициенты линейной регрессии i , βi= 0, 1, 2.
  2. Оценить статистическую значимость найденных эмпирических коэффициентов регрессии   bi , i =0, 1, 2.
  3. В соответствие с заданным значением  построить доверительные интервалы для найденных коэффициентов;
  4. Вычислить коэффициент детерминации R2 и оценить его статистическую значимость при заданном значении ;
  5. Определить какой процент разброса зависимой переменной объясняется данной регрессией;
  6. Сравнить коэффициент детерминации R2 со скорректированным коэффициентом детерминации;
  7. Вычислить статистику DW Дарбина-Уотсона и оценить наличие автокорреляции;
  8. Посредством коэффициентов  bi , i = 1, 2, оценить в % отношении влияние объясняющих переменных Х1 и Х2 на изменение объясняемой переменной;
  9. Спрогнозировать значение объясняемой переменной Yпрогн для прогнозных значений Х1 прогн , Х2 прогн  и определить доверительный интервал для Yпрогн;
  10. Сделать обобщающие выводы по регрессионной модели.
Страна Индекс человеческого развития, Y Ожидаемая продолжительность жизни при рождении 2005 г., лет, Х1 Суточная калорийность питания населения, ккал на душу, Х2
Австрия

0,904

77,0

3343

Белоруссия

0,763

68,0

3101

Греция

0,867

78,1

3575

Казахстан

0,740

67,7

3007

Китай

0,701

69,8

2844

США

0,927

76,6

3642

Турция

0,728

69,0

3568

Франция

0,918

78,1

3551

ЮАР

0,695

64,1

2933

 

Х1 прогн = 73, Х2 прогн =3300,   = 0,05.

1. Модель множественной линейной регрессии можно представить в виде: Y= β0  +  β1 Х1  +  β2  Х2 .

Для определения оценок  b0 , b1 , b2  воспользуемся матричным МНК. Представим данные наблюдений и коэффициенты в матричном виде:

parnaya-matrix

Тогда уравнение множественной линейной регрессии второго рода запишем в виде: Y = Х В .

Остаточная сумма квадратов в данном случае равна

Остаточная сумма квадратов линейной модели

Результатом минимизации  является вектор:

B = (XT X)-1 XT Y

Произведем операции над матрицами

liney-matrix

Оценки вектора В являются несмещенными и эффективными, если выполняются предпосылки множественного регрессионного анализа.

Вычислим дисперсии коэффициентов регрессии   b0 , b1 , b2, которые используются для оценки их точности, определения доверительных интервалов для теоретических коэффициентов  β0 , β1 , β2   и  проверки соответствующих гипотез. Вариации оценок параметров будут определять и точность уравнения множественной регрессии. Для измерения их в многомерном регрессионном анализе используют ковариационную матрицу вектора оценок

ковариационная матрица вектора оценок

Вычислим e2

n

y

y^

e

е2

1

0,904

0,882

0,022

0,0005

2

0,763

0,736

0,027

0,0007

3

0,867

0,908

-0,041

0,0017

4

0,74

0,728

0,012

0,0001

5

0,701

0,753

-0,052

0,0027

6

0,927

0,888

0,039

0,0015

7

0,728

0,771

-0,043

0,0018

8

0,918

0,907

0,011

0,0001

9

0,695

0,671

0,024

0,0006

Сумма

0,0098

kovar-matrix2

2). Оценка качества уравнения множественной линейной регрессии 2-го рода определяется следующими характеристиками:
— доверительными интервалами для коэффициентов регрессии и их статистической значимостью;
— оценкой коэффициента детерминации и его статистической значимостью;
— выполнением предпосылок МНК;
— прогнозом значений зависимой переменной и его параметрами

Для проверки статистической значимости коэффициентов регрессии используется случайная величина

Тbi = bi / Sbi, i = 0, 1, 2

имеющая распределение Стьюдента.

student-matrix

4) Проверка общего качества уравнения регрессии.

Для этой цели, как и в случае парной регрессии, используется  коэффициент детерминации R2 :

R2 = 0,872

Анализ статистической значимости  коэффициента детерминации.

По величине  R2 можно только предполагать насколько значимо или не значимо уравнение регрессии. Даже при небольшой величине R2 (< 0,5) не всегда следует отказываться от уравнения регрессии. Для этого необходимо проверить статистическую значимость самого коэффициента детерминации. Для чего проверяются гипотезы

Н0  :   R2 = 0, Н1  :   R2 > 0.

Для проверки используется распределение Фишера. Вычисляется F – статистика:

расчет критерия Фишера в модели множественной регрессии

При заданном уровне значимости  по таблице критических точек Фишера находится fкр, и если F > fкр , то  R2 статистически значим.

Вывод: наша модель значима в целом.

5). Связь в линейной модели сильная, т.к. коэффициент  детерминации близок к 1.  означает, что вариация результата на 87,2% объясняется вариацией факторов и 12,8% приходится на долю неучтенных факторов.

7). Проверка выполнимости предпосылок МНК с помощью статистики Дарбина-Уотсона.

Статистика  Дарбина – Уотсона DW рассчитывается по формуле:

критерий Дарбина - Уотсона в модели множественной регрессии

Находим критерий  Дарбина – Уотсона по формуле  СУММКВРАЗН/СУММКВ

DW = 3

По таблицам критических точек  Дарбина – Уотсона, входными параметрами которых являются: n – число наблюдений; m – количество объясняющих переменных; — уровень значимости, определяются два числа: dl – нижняя граница;  du – верхняя граница.

dl = 0,294,  du= 1,676

Выводы осуществляются по следующей схеме.

Если DW < d1 , то это свидетельствует о положительной автокорреляции остатков.

Если DW > 4 — d1 , то это свидетельствует об отрицательной автокорреляции остатков.

При duDW < 4 – du принимается гипотеза об отсутствии автокорреляции остатков.

Если d1DW < du или   4 – duDW < 4 – d1 , то остается неопределенность по вопросу наличия или отсутствия автокорреляции остатков.

Т.к. 4 – duDW < 4 – d1 (4 – 2,88 < 3,014 < 4 — 0,294)  мы попадаем в зону неопределенности.

9). Прогноз значений зависимой переменной

Прогнозирование мы выполнять не может, т.к. модель не значима по параметрам и также не выполняется предпосылка по критерию Дарбина-Уотсона.

Перейти на страницу выбора заданий по эконометрике можно здесь.

Материалы сайта

Обращаем Ваше внимание на то, что все материалы опубликованы для образовательных целей.