Поиск параметров множественной регресии. Оценка значимости. Статистика Дарбина-Уотсона
Имеются данные по странам за 2005 год. Построить регрессионную модель:
Y= β0 + β1 Х1 + β2 Х2 .
Задание.
- По МНК оценить коэффициенты линейной регрессии i , βi= 0, 1, 2.
- Оценить статистическую значимость найденных эмпирических коэффициентов регрессии bi , i =0, 1, 2.
- В соответствие с заданным значением построить доверительные интервалы для найденных коэффициентов;
- Вычислить коэффициент детерминации R2 и оценить его статистическую значимость при заданном значении ;
- Определить какой процент разброса зависимой переменной объясняется данной регрессией;
- Сравнить коэффициент детерминации R2 со скорректированным коэффициентом детерминации;
- Вычислить статистику DW Дарбина-Уотсона и оценить наличие автокорреляции;
- Посредством коэффициентов bi , i = 1, 2, оценить в % отношении влияние объясняющих переменных Х1 и Х2 на изменение объясняемой переменной;
- Спрогнозировать значение объясняемой переменной Yпрогн для прогнозных значений Х1 прогн , Х2 прогн и определить доверительный интервал для Yпрогн;
- Сделать обобщающие выводы по регрессионной модели.
Страна | Индекс человеческого развития, Y | Ожидаемая продолжительность жизни при рождении 2005 г., лет, Х1 | Суточная калорийность питания населения, ккал на душу, Х2 |
Австрия |
0,904 |
77,0 |
3343 |
Белоруссия |
0,763 |
68,0 |
3101 |
Греция |
0,867 |
78,1 |
3575 |
Казахстан |
0,740 |
67,7 |
3007 |
Китай |
0,701 |
69,8 |
2844 |
США |
0,927 |
76,6 |
3642 |
Турция |
0,728 |
69,0 |
3568 |
Франция |
0,918 |
78,1 |
3551 |
ЮАР |
0,695 |
64,1 |
2933 |
Х1 прогн = 73, Х2 прогн =3300, = 0,05.
1. Модель множественной линейной регрессии можно представить в виде: Y= β0 + β1 Х1 + β2 Х2 .
Для определения оценок b0 , b1 , b2 воспользуемся матричным МНК. Представим данные наблюдений и коэффициенты в матричном виде:
Тогда уравнение множественной линейной регрессии второго рода запишем в виде: Y = Х В .
Остаточная сумма квадратов в данном случае равна
Результатом минимизации является вектор:
B = (XT X)-1 XT Y
Произведем операции над матрицами
Оценки вектора В являются несмещенными и эффективными, если выполняются предпосылки множественного регрессионного анализа.
Вычислим дисперсии коэффициентов регрессии b0 , b1 , b2, которые используются для оценки их точности, определения доверительных интервалов для теоретических коэффициентов β0 , β1 , β2 и проверки соответствующих гипотез. Вариации оценок параметров будут определять и точность уравнения множественной регрессии. Для измерения их в многомерном регрессионном анализе используют ковариационную матрицу вектора оценок
Вычислим e2
n |
y |
y^ |
e |
е2 |
1 |
0,904 |
0,882 |
0,022 |
0,0005 |
2 |
0,763 |
0,736 |
0,027 |
0,0007 |
3 |
0,867 |
0,908 |
-0,041 |
0,0017 |
4 |
0,74 |
0,728 |
0,012 |
0,0001 |
5 |
0,701 |
0,753 |
-0,052 |
0,0027 |
6 |
0,927 |
0,888 |
0,039 |
0,0015 |
7 |
0,728 |
0,771 |
-0,043 |
0,0018 |
8 |
0,918 |
0,907 |
0,011 |
0,0001 |
9 |
0,695 |
0,671 |
0,024 |
0,0006 |
Сумма |
0,0098 |
2). Оценка качества уравнения множественной линейной регрессии 2-го рода определяется следующими характеристиками:
— доверительными интервалами для коэффициентов регрессии и их статистической значимостью;
— оценкой коэффициента детерминации и его статистической значимостью;
— выполнением предпосылок МНК;
— прогнозом значений зависимой переменной и его параметрами
Для проверки статистической значимости коэффициентов регрессии используется случайная величина
Тbi = bi / Sbi, i = 0, 1, 2
имеющая распределение Стьюдента.
4) Проверка общего качества уравнения регрессии.
Для этой цели, как и в случае парной регрессии, используется коэффициент детерминации R2 :
R2 = 0,872
Анализ статистической значимости коэффициента детерминации.
По величине R2 можно только предполагать насколько значимо или не значимо уравнение регрессии. Даже при небольшой величине R2 (< 0,5) не всегда следует отказываться от уравнения регрессии. Для этого необходимо проверить статистическую значимость самого коэффициента детерминации. Для чего проверяются гипотезы
Н0 : R2 = 0, Н1 : R2 > 0.
Для проверки используется распределение Фишера. Вычисляется F – статистика:
При заданном уровне значимости по таблице критических точек Фишера находится fкр, и если F > fкр , то R2 статистически значим.
Вывод: наша модель значима в целом.
5). Связь в линейной модели сильная, т.к. коэффициент детерминации близок к 1. означает, что вариация результата на 87,2% объясняется вариацией факторов и 12,8% приходится на долю неучтенных факторов.
7). Проверка выполнимости предпосылок МНК с помощью статистики Дарбина-Уотсона.
Статистика Дарбина – Уотсона DW рассчитывается по формуле:
Находим критерий Дарбина – Уотсона по формуле СУММКВРАЗН/СУММКВ
DW = 3
По таблицам критических точек Дарбина – Уотсона, входными параметрами которых являются: n – число наблюдений; m – количество объясняющих переменных; — уровень значимости, определяются два числа: dl – нижняя граница; du – верхняя граница.
dl = 0,294, du= 1,676
Выводы осуществляются по следующей схеме.
Если DW < d1 , то это свидетельствует о положительной автокорреляции остатков.
Если DW > 4 — d1 , то это свидетельствует об отрицательной автокорреляции остатков.
При du < DW < 4 – du принимается гипотеза об отсутствии автокорреляции остатков.
Если d1 < DW < du или 4 – du < DW < 4 – d1 , то остается неопределенность по вопросу наличия или отсутствия автокорреляции остатков.
Т.к. 4 – du < DW < 4 – d1 (4 – 2,88 < 3,014 < 4 — 0,294) мы попадаем в зону неопределенности.
9). Прогноз значений зависимой переменной
Прогнозирование мы выполнять не может, т.к. модель не значима по параметрам и также не выполняется предпосылка по критерию Дарбина-Уотсона.
Перейти на страницу выбора заданий по эконометрике можно здесь.