Коэффициент детерминации. Значимость уравнения регрессии
Федеральное
агентство по образованию
Всероссийский
заочный финансово-экономический институт
Кафедра
экономико-математических методов и моделей
КОНТРОЛЬНАЯ
РАБОТА
по
дисциплине «Эконометрика»
Вариант № 3
Исполнитель: Глушакова Т.И.
Специальность: Финансы и кредит
Курс: 3
Группа: 6
№ зачетной книжки: 07ффд41853
Руководитель: Денисов В.П.
г. Омск 2009г.
Задачи
По предприятиям легкой
промышленности региона получена информация, характеризующая зависимость объема
выпуска продукции (Y, млн. руб.) от
объема капиталовложений (X,
млн. руб.). Требуется:
1. Найти параметры
уравнения линейной регрессии, дать экономическую интерпретацию коэффициента
регрессии.
- уравнение линейной регрессии, где - параметры уравнения.
, где , - средние значения признаков.
, где n – число наблюдений.
Представим вычисления в
таблице 1:
Таблица 1. Промежуточные
расчеты.
t
|
xi
|
yi
|
yi * xi
|
xi*xi
|
1
|
38
|
69
|
2622
|
1444
|
2
|
28
|
52
|
1456
|
784
|
3
|
27
|
46
|
1242
|
729
|
4
|
37
|
63
|
2331
|
1369
|
5
|
46
|
73
|
3358
|
2116
|
6
|
27
|
48
|
1296
|
729
|
7
|
41
|
67
|
2747
|
1681
|
8
|
39
|
62
|
2418
|
1521
|
9
|
28
|
47
|
1316
|
784
|
10
|
44
|
67
|
2948
|
1936
|
средн. знач.
|
35,5
|
59,4
|
|
|
|
2108,7
|
|
|
|
|
1260,25
|
|
|
|
|
21734
|
|
|
|
|
13093
|
|
|
|
n
|
10
|
|
|
|
|
1,319
|
|
|
|
|
12,573
|
|
|
|
Таким образом, уравнение
линейной регрессии имеет вид:
Коэффициент регрессии
равен 1,319>0, значит связь между объемом капиталовложений и выпуском
продукции прямая, увеличение объема капиталовложений на 1 млн. руб. ведет к
увеличению объема выпуска продукции в среднем на 1,319 млн. руб. Это
свидетельствует об эффективности работы предприятий.
2. Вычислить остатки;
найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков.
Вычислим прогнозное
значение Y по формуле:
Остатки вычисляются по
формуле:
.
Представим промежуточные
вычисления в таблице 2.
Таблица 2. Вычисление
остатков.
|
|
|
|
69
|
62,695
|
6,305
|
39,75303
|
52
|
49,505
|
2,495
|
6,225025
|
46
|
48,186
|
-2,186
|
4,778596
|
63
|
61,376
|
1,624
|
2,637376
|
73
|
73,247
|
-0,247
|
0,061009
|
48
|
48,186
|
-0,186
|
0,034596
|
67
|
66,652
|
0,348
|
0,121104
|
62
|
64,014
|
-2,014
|
4,056196
|
47
|
49,505
|
-2,505
|
6,275025
|
67
|
70,609
|
-3,609
|
13,02488
|
Дисперсия остатков
вычисляется по формуле:
.
Построим график остатков
с помощью MS Excel.
Рис. 1. График остатков.
3. Проверить выполнение
предпосылок МНК
Проверим независимость
остатков с помощью критерия Дарбина-Уотсона.
Вычислим коэффициент
Дарбина-Уотсона по формуле:
.
Данные для расчета
возьмем из таблицы 2.
dw = 0,803
Сравним полученное
значение коэффициента Дарбина-Уотсона с табличными значениями границ и для уровня значимости 0,05 при k=1 и n=10. =0,88,
=1,32, dw < d , значит, остатки содержат автокорреляцию. Наличие
автокорреляции нарушает одну из предпосылок нормальной линейной модели
регрессии.
Проверим наличие
гетероскедастичности. Т.к. у нас малый объем выборки (n=10) используем метод Голдфельда-Квандта.
- упорядочим значения n наблюдений по мере возрастания
переменной x и разделим на две группы с малыми и
большими значениями фактора x
соответственно.
- рассчитаем остаточную
сумму квадратов для каждой группы.
Вычисления представим в
таблицах 3 и 4.
Таблица 3. Промежуточные
вычисления для 1-го уравнения регрессии.
t
|
xi
|
yi
|
yi * xi
|
xi*xi
|
|
|
|
1
|
27
|
46
|
1242
|
729
|
47
|
-1
|
1
|
2
|
27
|
48
|
1296
|
729
|
47
|
1
|
1
|
3
|
28
|
47
|
1316
|
784
|
49,5
|
-2,5
|
6,25
|
4
|
28
|
52
|
1456
|
784
|
49,5
|
2,5
|
6,25
|
средн. знач.
|
27,5
|
48,25
|
|
|
|
|
|
|
1326,875
|
|
|
|
|
|
|
|
756,25
|
|
|
|
|
|
|
|
5310,00
|
|
|
|
|
|
|
|
3026,00
|
|
|
|
|
|
|
n
|
4
|
|
|
|
|
|
|
|
2,5
|
|
|
|
|
|
|
|
- 20,5
|
|
|
|
|
|
|
|
14,5
|
|
|
|
|
|
|
Таблица 4. Промежуточные
вычисления для 2-го уравнения регрессии.
t
|
xi
|
yi
|
yi * xi
|
xi*xi
|
|
|
|
1
|
37
|
63
|
2331
|
1369
|
63,789
|
-0,789
|
0,623
|
2
|
38
|
69
|
2622
|
1444
|
64,582
|
4,418
|
19,519
|
3
|
39
|
62
|
2418
|
1521
|
65,375
|
-3,375
|
11,391
|
4
|
41
|
67
|
2747
|
1681
|
66,961
|
0,039
|
0,002
|
5
|
44
|
67
|
2948
|
1936
|
69,340
|
-2,340
|
5,476
|
6
|
46
|
73
|
3358
|
2116
|
70,926
|
2,074
|
4,301
|
средн. знач.
|
40,833
|
66,833
|
|
|
|
|
|
|
2729,028
|
|
|
|
|
|
|
|
1667,361
|
|
|
|
|
|
|
|
16424
|
|
|
|
|
|
|
|
10067
|
|
|
|
|
|
|
n
|
6
|
|
|
|
|
|
|
|
0,793
|
|
|
|
|
|
|
|
34,448
|
|
|
|
|
|
|
|
41,310
|
|
|
|
|
|
|
= =2,849
где - остаточная сумма квадратов 1-ой
регрессии, -
остаточная сумма квадратов 2-ой регрессии.
Полученное значение
сравним с табличным значением F
распределения для уровня значимости , со степенями свободы и ( - число наблюдений в первой группе, m – число оцениваемых параметров в
уравнении регрессии).
, , m=1.
Если > , то имеет место гетероскедастичность.
= 5,41
< ,
значит,
гетероскедастичность отсутствует и предпосылка о том, что дисперсия остаточных
величин постоянна для всех наблюдений выполняется.
4. Осуществить проверку
значимости параметров уравнения регрессии с помощью t-критерия Стьюдента .
Расчетные значения t-критерия можно вычислить по
формулам:
,
,
,
=35,5
Промежуточные расчеты
представим в таблице:
Таблица 5. Промежуточные
вычисления для расчета t- критерия
xi
|
|
38
|
6,25
|
28
|
56,25
|
27
|
72,25
|
37
|
2,25
|
46
|
110,25
|
27
|
72,25
|
41
|
30,25
|
39
|
12,25
|
28
|
56,25
|
44
|
72,25
|
=490,50
для уровня значимости 0,05 и числа степеней
свободы n-2=8
Так как и можно сделать вывод, что оба коэффициента
регрессии значимые.
Коэффициент детерминации
определяется по формуле:
Из расчетов нам известно,
что
; .
Рассчитаем :
Таблица 6. Промежуточные
вычисления для расчета коэффициента детерминации.
|
|
|
69
|
9,6
|
92,16
|
52
|
-7,4
|
54,76
|
46
|
-13,4
|
179,56
|
63
|
3,6
|
12,96
|
73
|
13,6
|
184,96
|
48
|
-11,4
|
129,96
|
67
|
7,6
|
57,76
|
62
|
2,6
|
6,76
|
47
|
-12,4
|
153,76
|
67
|
7,6
|
57,76
|
=930,4
=0,917.
Т.к. значение
коэффициента детерминации близко к единице, качество модели считается высоким.
Теперь проверим
значимость уравнения регрессии. Рассчитаем значение F-критерия Фишера по формуле:
Уравнение регрессии с
вероятностью 0,95 в целом статистически значимое, т.к. >.
Средняя относительная
ошибка аппроксимации находится по формуле:
Таблица 7. Промежуточные
вычисления для расчета средней относительной ошибки аппроксимации.
yi
|
|
|
69
|
6,305
|
0,091377
|
52
|
2,495
|
0,047981
|
46
|
-2,186
|
0,047522
|
63
|
1,624
|
0,025778
|
73
|
-0,247
|
0,003384
|
48
|
-0,186
|
0,003875
|
67
|
0,348
|
0,005194
|
62
|
-2,014
|
0,032484
|
47
|
-2,505
|
0,053298
|
67
|
-3,609
|
0,053866
|
,
значит модель имеет
хорошее качество.
Рассчитаем коэффициент
эластичности по формуле:
6. осуществить
прогнозирование среднего значения показателя Y при уровне значимости , если прогнозное значение фактора X составит 80% от его максимального
значения.
Рассчитаем стандартную
ошибку прогноза
,
где
=930,4 ;
, для уровня значимости 0,1 и числа степеней
свободы n-2=8
Доверительный интервал
прогноза:
Таким образом, =61,112 , будет находиться между
верхней границей, равной 82,176 и нижней границей, равной 40,048.
7. Представить графически фактические и
модельные значения Y точки прогноза.
Воспользуемся данными из
таблицы 2 для построения графиков с помощью MS Excel.
Рис. 2. Фактические и
модельные значения Y точки прогноза.
8. Составить уравнения
нелинейной регрессии: гиперболической, степенной, показательной. Привести
графики построенных уравнений регрессии.
Построение степенной
модели.
Уравнение степенной
модели имеет вид:
Для построения этой
модели необходимо произвести линеаризацию переменных. Для этого произведем
логарифмирование обеих частей уравнения:
Обозначим .
Тогда уравнение примет
вид – линейное
уравнение регрессии. Рассчитаем его параметры, используя данные таблицы 1:
Таблица 8. Расчет
параметров уравнения степенной модели регрессии.
t
|
xi
|
X
|
|
Y
|
YX
|
X*X
|
|
|
|
|
1
|
38
|
1,5798
|
69
|
1,839
|
2,905
|
2,496
|
62,347
|
6,653
|
9,642
|
44,26
|
2
|
28
|
1,447
|
52
|
1,716
|
2,483
|
2,094
|
50,478
|
1,522
|
2,926
|
2,315
|
3
|
27
|
1,431
|
46
|
1,663
|
2,379
|
2,048
|
49,225
|
-3,225
|
7,010
|
10,399
|
4
|
37
|
1,568
|
63
|
1,799
|
2,821
|
2,459
|
61,208
|
1,792
|
2,845
|
3,212
|
5
|
46
|
1,663
|
73
|
1,863
|
3,098
|
2,765
|
71,153
|
1,847
|
2,530
|
3,411
|
6
|
27
|
1,431
|
48
|
1,681
|
2,406
|
2,049
|
49,225
|
-1,225
|
2,552
|
1,5
|
7
|
41
|
1,613
|
67
|
1,826
|
2,945
|
2,601
|
65,771
|
1,289
|
1,924
|
1,66
|
8
|
39
|
1,591
|
62
|
1,793
|
2,853
|
2,531
|
63,477
|
-1,477
|
2,382
|
2,182
|
9
|
28
|
1,447
|
47
|
1,672
|
2,419
|
2,094
|
50,478
|
-3,478
|
7,4
|
12,099
|
10
|
44
|
1,644
|
67
|
1,826
|
3,001
|
2,701
|
68,999
|
-1,999
|
2,984
|
3,997
|
Уравнение регрессии будет
иметь вид:
Перейдем к исходным
переменным x и y, выполнив потенцирование данного уравнения:
Вычислим коэффициент
детерминации :
=930,4;
(1)
Вычислим среднюю ошибку
аппроксимации А:
%
(2)
Коэффициент эластичности
рассчитывается по формуле:
(3)
Рис. 3. График степенного
уравнения регрессии.
Построение
показательной функции.
Уравнение показательной
кривой:
Для построения этой
модели необходимо произвести линеаризацию переменных. Для этого осуществим
логарифмирование обеих частей уравнения:
Обозначим
Получим линейное
уравнение регрессии:
Рассчитаем его параметры,
используя данные таблиц 1 и 8.
Промежуточные расчеты
представим в таблице 9.
Таблица 9. Промежуточные
расчеты для показательной функции.
t
|
xi
|
Y
|
|
y
|
|
|
|
|
1
|
38
|
1,839
|
69,882
|
69
|
62,632
|
6,368
|
10,167
|
40,552
|
2
|
28
|
1,716
|
48,048
|
52
|
49,893
|
2,107
|
4,223
|
4,44
|
3
|
27
|
1,663
|
44,901
|
46
|
48,771
|
-2,771
|
5,682
|
7,68
|
4
|
37
|
1,799
|
66,563
|
63
|
61,224
|
1,776
|
2,901
|
3,155
|
5
|
46
|
1,863
|
85,698
|
73
|
75,128
|
-2,128
|
2,832
|
4,528
|
6
|
27
|
1,681
|
45,387
|
48
|
48,771
|
-0,771
|
1,581
|
0,595
|
7
|
41
|
1,826
|
74,866
|
67
|
67,054
|
-0,054
|
0,08
|
0,003
|
8
|
39
|
1,793
|
69,927
|
62
|
64,072
|
-2,072
|
3,235
|
4,295
|
9
|
28
|
1,672
|
47
|
49,893
|
-2,893
|
5,798
|
8,369
|
10
|
44
|
1,826
|
80,344
|
67
|
71,788
|
-4,788
|
6,669
|
22,921
|
=63,2432
Уравнение будет иметь
вид:
Перейдем к исходным
переменным x и y, выполнив потенцирование данного уравнения:
Рассчитаем коэффициент
детерминации по формуле (1).
=930,4;
Вычислим среднюю ошибку
аппроксимации А по формуле (2):
А=0,1*43,170=4,317%
Коэффициент эластичности
рассчитаем по формуле (3):
%
Построим график функции с
помощью MS Excel.
Рис. 4. График
показательного уравнения регрессии.
Построение
гиперболической функции.
Уравнение гиперболической
функции
Произведем линеаризацию
модели путем замены Х=1/х.
В результате получим
линейное уравнение:
Рассчитаем параметры
уравнения, промежуточные вычисления представим в таблице 10.
Таблица 10. Расчет
параметров для гиперболической модели.
t
|
xi
|
yi
|
X=1/xi
|
y*X
|
|
|
|
|
|
1
|
38
|
69
|
0,02632
|
1,81579
|
0,00069
|
63,5648
|
5,4352
|
7,877
|
29,5409
|
2
|
28
|
52
|
0,03571
|
1,85714
|
0,00128
|
50,578
|
1,422
|
2,7346
|
2,0221
|
3
|
27
|
46
|
0,03704
|
1,7037
|
0,00137
|
48,7502
|
-2,7502
|
5,9787
|
7,5637
|
4
|
37
|
63
|
0,02703
|
1,7027
|
0,00073
|
62,5821
|
0,4179
|
0,6634
|
0,1747
|
5
|
46
|
73
|
0,02174
|
1,58696
|
0,00047
|
69,8889
|
3,1111
|
4,2618
|
9,6791
|
6
|
27
|
48
|
0,03704
|
1,77778
|
0,00137
|
48,7502
|
-0,7502
|
1,563
|
0,5628
|
7
|
41
|
67
|
0,02439
|
1,63415
|
0,00059
|
66,2256
|
0,7744
|
1,1559
|
0,5998
|
8
|
39
|
62
|
0,02564
|
1,58974
|
0,00066
|
64,4972
|
-2,4972
|
4,0278
|
6,2362
|
9
|
28
|
47
|
0,03571
|
1,67857
|
0,00128
|
50,578
|
-3,578
|
7,6128
|
12,8021
|
10
|
44
|
67
|
0,02273
|
1,52273
|
0,00052
|
68,5235
|
-1,5235
|
2,2738
|
2,3209
|
Уравнение гиперболической
модели:
Рассчитаем коэффициент
детерминации по формуле (1).
=930,4;
Вычислим среднюю ошибку
аппроксимации А по формуле (2):
А=0,1*38,1488=3,81488%
Коэффициент эластичности
рассчитаем по формуле (3):
%
Построим график функции с
помощью MS Excel.
Рис. 5 График
гиперболического уравнения регрессии.
9. Для указанных моделей
найти коэффициенты детерминации, коэффициенты эластичности и средние
относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и
сделать выводы.
Коэффициенты были
рассчитаны в задании 8. Для сравнения моделей составим сводную таблицу 11:
Таблица11. Сводная
таблица характеристик моделей.
параметры
модель
|
Коэффициент детерминации, R
|
Коэффициент эластичности,(%)
|
Средняя относительная ошибка
аппроксимации, А (%)
|
Линейная
|
0,917
|
0,788
|
3,648
|
Степенная
|
0,909
|
0,692
|
4,22
|
Показательная
|
0,896
|
0,817
|
4,317
|
Гиперболическая
|
0,923
|
0,638
|
3,815
|
Для всех моделей средняя
относительная ошибка аппроксимации не превышает 7%, значит, качество всех
моделей хорошее. Коэффициент детерминации более приближен к 1 у гиперболической
модели, таким образом, эту модель можно взять в качестве лучшей для построения
прогноза. Для гиперболической модели степень связи между факторным и
результативным признаком самая низкая, т.к. имеет наименьшее значение, а для показательной
модели самая высокая, т.к. коэффициент эластичности наибольший.