Эконометрика: примеры решения задач
МИНИСТЕРСТВО
ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ВЛАДИВОСТОКСКИЙ
ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ЭКОНОМИКИ И
СЕРВИСА
ИНСТИТУТ
ЗАОЧНОГО И ДИСТАНЦИОННОГО ОБУЧЕНИЯ
КАФЕДРА
МАТЕМАТИКИ И МОДЕЛИРОВАНИЯ
Контрольная работа
по дисциплине
"Эконометрика"
Студент
гр. Д/ПЭ-10-09 А.А. Юркова
Владивосток 2012
Задача №1.
По семи территориям Уральского района. За 199Х г. известны значения двух
признаков (табл. 1.).
Таблица 1
Район
|
Расходы на покупку
продовольственных товаров в общих расходах, %, у
|
Среднедневная заработная
плата одного работающего, руб., х
|
Удмуртская респ.
|
69,8
|
44,1
|
Свердловская обл.
|
63
|
58
|
Башкортостан
|
60,9
|
55,7
|
Челябинская обл.
|
57,7
|
60,8
|
Пермская обл.
|
56
|
57,8
|
Курганская обл.
|
55,8
|
46,2
|
Оренбургская обл.
|
50,3
|
53,7
|
Требуется:
. Для характеристики зависимости у от х рассчитать параметры следующих
функций:
а) линейной;
б) степенной;
в) показательной; 1
г) равносторонней гиперболы (также нужно придумать как предварительно
линеаризовать данную модель).
2.
Оценить каждую модель через среднюю ошибку аппроксимации и F-критерий Фишера.
Решение
задачи
а. Для расчета параметров a и b линейной регрессии y=a+b*x. Решаем систему нормальных уравнений
относительно a и b:
По
исходным данным рассчитываем
Таблица
1.2
|
y
|
x
|
yx
|
x2
|
y2
|
Ai
|
|
|
1
|
69,8
|
44,1
|
3078,18
|
1944,81
|
4872,04
|
62,411
|
7,4
|
10,6
|
2
|
62,7
|
58
|
3636,6
|
3364
|
3931,29
|
57,546
|
5,2
|
8,3
|
3
|
60,9
|
55,7
|
3392,13
|
3102,49
|
3708,81
|
58,551
|
2,5
|
4,1
|
4
|
57,7
|
60,8
|
3508,16
|
3696,64
|
3329,29
|
56,566
|
1,1
|
1,9
|
5
|
56
|
57,8
|
3236,8
|
3340,84
|
3136
|
57,616
|
-1,6
|
2,9
|
6
|
55,8
|
46,2
|
2577,96
|
2134,44
|
3113,64
|
61,676
|
-5,9
|
10,6
|
7
|
50,3
|
53,7
|
2701,11
|
2883,69
|
2530,09
|
89,051
|
-8,8
|
17,4
|
итого
|
413,2
|
376,3
|
22130,94
|
20466,91
|
24621,16
|
-
|
-
|
55,8
|
Среднее значение
|
59,03
|
53,76
|
3161,56
|
2923,84
|
3517,31
|
|
-
|
7,97
|
5,725,81
|
|
|
|
232,7733,70
|
|
|
|
; ;
;
;
b=
=59,03- (-0, 35)53,76=77,846
Уравнение
регрессии: =77,846-0,35x. С увеличением среднедневной заработной платы на 1
руб. доля расходов на покупку продовольственных товаров снижается в среднем на
0,35%-ых пункта. Рассчитаем линейный коэффициент парной корреляции:
= =-0,357
Связь
умеренно обратная.
Определим
коэффициент детерминации:
2 =(-0,35)2 =0,127
Вариация
результата на 12,7% объясняется вариацией фактора x. Подставляя в
уравнение регрессии фактические значения x, определим
теоретические(расчетные) значения . Найдем
величину средней ошибки аппроксимации :
= = %
В
среднем расчетные значения отклоняются от фактических на 7,97%
Рассчитаем
F- критерий
F=
Полученное
значение указывает на необходимость принять гипотезу H0 о случайной природе зависимости и статистической
незначимости параметров уравнения и показателя тесноты связи.
б.
Построению степенной модели y= xb предшествует процедура линеаризации переменных.
В
примере линеаризация производится путем логарифмирования обеих частей
уравнения:
log y=log+b log x
Y=C+b X,
Где Y=log y, X=log x, C=log
Для
расчетов используем данные таблицы 1.3.
Таблица
1.3
|
Y
|
X
|
Y X
|
X2
|
Y2
|
Ai
|
|
|
|
1
|
1,8439
|
1,6444
|
3,0321
|
2,7041
|
3,40
|
59,48
|
10,32
|
106,50
|
14,79
|
2
|
1,7973
|
1,7634
|
3,1694
|
3,1096
|
3,2303
|
58,46
|
4,24
|
17,98
|
6,76
|
3
|
1,7846
|
1,7459
|
3,1157
|
3,0482
|
3,1848
|
58,61
|
2,29
|
5,24
|
3,76
|
4
|
1,7612
|
1,7839
|
3,1418
|
3,1823
|
3,1018
|
58,28
|
-0,58
|
0,34
|
1,005
|
5
|
1,7482
|
1,7619
|
3,080
|
3,1043
|
3,1043
|
58,47
|
-2,47
|
6,1
|
4,41
|
6
|
1,7466
|
1,6646
|
2,9073
|
2,7709
|
2,7709
|
59,31
|
-3,51
|
12,32
|
6,29
|
7
|
1,7016
|
1,73
|
2,9438
|
2,9929
|
2,9923
|
58,74
|
-8,44
|
71,23
|
16,78
|
итого
|
12,3834
|
12,0941
|
21,3901
|
20,9123
|
20,9123
|
411,35
|
1,85
|
219,71
|
53,795
|
Среднее значение
|
1,7691
|
1,7277
|
3,0557
|
2,9875
|
2,9875
|
-
|
-
|
31,39
|
7,7
|
0,040,1122
|
|
|
|
20,00160,0126
|
|
|
|
Рассчитаем С и b:
= C=1,7691+0,06351,7277=1,7691+0,1097=1,8788
Получим
линейное уравнение:
=1,8788-0,0635X
Выполнив
его потенцирование, фактические значения x, получаем
теоретические значения результата x.
По
ним рассчитаем показатели: тесноты связи - индекс корреляции и среднюю ошибку аппроксимации i:
=
Характеристики
степенной модели указывают, что она несколько лучше линейной функции описывает
взаимосвязь.
в.
Построению уравнения показательной кривой y=bx предшествует процедура линеаризации переменных при
логарифмировании обеих частей уравнения:
log y=log+x
log b=C+B x,
где Y=log y, C=log ,
B=log b.
Для
расчетов используем данные таблицы 1.4.
Таблица
1.4
|
Y
|
x
|
Y x
|
x2
|
Y2
|
Ai
|
|
|
|
1
|
1,8439
|
44,1
|
81,3160
|
1944,81
|
3,40
|
62,2
|
7,6
|
57,76
|
10,9
|
2
|
1,7973
|
58
|
104,2434
|
3364
|
3,2303
|
57,5
|
-5,5
|
6,25
|
8,8
|
3
|
1,7846
|
55,7
|
99,4022
|
3102,49
|
3,1848
|
58,9
|
-2
|
4
|
3,3
|
4
|
1,7612
|
60,8
|
107,08096
|
3696,64
|
3,1018
|
56,6
|
-1,1
|
1,21
|
1,9
|
5
|
1,7482
|
57,8
|
101,0460
|
3340,84
|
3,1043
|
57,5
|
1,5
|
2,25
|
2,7
|
6
|
1,7466
|
46,2
|
80,6929
|
2134,44
|
2,7709
|
61,5
|
5,7
|
32,49
|
10,2
|
7
|
1,7016
|
53,7
|
91,3759
|
2883,69
|
2,9923
|
58,9
|
8,6
|
73,96
|
17
|
итого
|
12,3834
|
376,3
|
665,1574
|
20466,91
|
20,9123
|
966,6
|
177,92
|
54,8
|
Среднее значение
|
1,7691
|
53,76
|
95,0225
|
2923,84
|
2,9875
|
-
|
-
|
25,41
|
7,8
|
0,045,81
|
|
|
|
20,001633,7
|
|
|
|
Значения параметров регрессии А и В составили:
Получено
линейное уравнение: =1б9035-0б0025x.
Произведем
потенцирование полученного уравнения и запишем его в обычной форме: =101,9035 10-0б0025x =80,070,9943x
Тесноту
связи оценим через индекс корреляции :
=
Связь
умеренная.
=7,8%,
что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Показательная
функция чуть хуже, чем степенная, она описывает изучаемую зависимость.
г.
Уравнение равносторонней гиперболы y=+b
линеаризуется при замене: z=.
Тогда
y=+bz
Для
расчетов используем данные таблицу 1.5.
Таблица
1.5
|
y
|
z
|
yz
|
z2
|
y2
|
()2Ai
|
|
|
|
1
|
69,8
|
0,227
|
15,8446
|
0,0515
|
4872,04
|
59,1225
|
10,6775
|
114,01
|
15,3
|
2
|
62,7
|
0,0172
|
1,0784
|
0,00029
|
3931,29
|
59,0370
|
3,663
|
13,42
|
5,85
|
3
|
60,9
|
0,0180
|
1,0962
|
1,2026
|
3708,81
|
59,0373
|
1,8627
|
3,47
|
3,06
|
4
|
57,7
|
0,0164
|
0,9463
|
0,8955
|
3329,29
|
59,0367
|
-1,3367
|
1,79
|
2,32
|
5
|
56
|
0,0173
|
0,9688
|
0,9386
|
3136
|
59,0370
|
-3,037
|
9,22
|
5,42
|
6
|
55,8
|
0,022
|
1,2276
|
1,5070
|
3113,64
|
59,0390
|
-3,239
|
10,49
|
5,80
|
7
|
50,3
|
0,0186
|
0,9386
|
0,8753
|
2530,09
|
59,0376
|
-8,7376
|
76,34
|
17,5
|
итого
|
413,2
|
0,3365
|
22,0978
|
5,47079
|
24621,16
|
354,3101
|
-0,1471
|
228,74
|
55,17
|
Среднее значение
|
59,03
|
0,0481
|
3,1568
|
0,7815
|
3517,31
|
-
|
--
|
32,68
|
7,43
|
5,720,8827
|
|
|
|
|
232,770,7792
|
|
|
|
|
Значения
параметров регрессии и b составили:
= =59,03-0,40750,0481=59,03
b=
Получено
уравнение =59,03+0,4075
Индекс
корреляции:
=
. По
уравнению равносторонней гиперболы получена наибольшая оценка тесноты связи: = 0,052. остается
на допустимом уровне:
.
Где
,
Следовательно,
принимается гипотеза H0 о
статистически незначимых параметрах этого уравнения. Этот результат можно
объяснить сравнительно невысокой теснотой выявленной зависимости и небольшим
числом наблюдений.
Задача
№2. По территориям региона приводятся данные за 199Х г. (таблица 1.6).
Таблица
1.6
Номер региона
|
Среднедушевой
прожиточный минимум в день одного трудоспособного, руб., х
|
Среднедневная
заработная плата, руб., у
|
1
|
80
|
136
|
2
|
80
|
151
|
3
|
90
|
132
|
4
|
76
|
152
|
5
|
91
|
164
|
6
|
104
|
197
|
7
|
70
|
137
|
8
|
85
|
156
|
9
|
75
|
155
|
10
|
85
|
165
|
11
|
78
|
157
|
12
|
113
|
171
|
Требуется:
. Построить линейное уравнение парной регрессии у от х.
. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку
аппроксимации.
. Оценить статистическую значимость параметров регрессии и корреляции.
. Выполнить прогноз заработной платы у при прогнозном значении
среднедушевого прожиточного минимума х, составляющем 107% от среднего
уровня.
. Оценить точность прогноза, рассчитав ошибку прогноза и его
доверительный интервал.
Решение задачи.
. Для расчета параметров уравнения линейной регрессии строим расчетную
таблицу (таблицу 1.7).
Таблица 1.7
|
y
|
x
|
yx
|
x2
|
y2
|
Ai
|
|
|
1
|
136
|
80
|
10880
|
6400
|
18496
|
155,714
|
-19,7
|
14,5
|
2
|
151
|
80
|
12080
|
6400
|
22801
|
155,714
|
-4,7
|
3,11
|
3
|
132
|
90
|
11880
|
8100
|
17424
|
155,697
|
-23,7
|
17,95
|
4
|
152
|
76
|
11552
|
5776
|
23,104
|
155,7208
|
-3,72
|
2,45
|
5
|
164
|
91
|
14924
|
8281
|
26896
|
155,6953
|
8,30
|
5,06
|
6
|
197
|
104
|
20488
|
10816
|
38809
|
155,6732
|
41,33
|
20,98
|
7
|
137
|
70
|
9590
|
4900
|
18769
|
155,731
|
-18,731
|
13,67
|
8
|
156
|
85
|
13260
|
7225
|
24336
|
155,7055
|
0,29
|
0,19
|
9
|
155
|
75
|
11625
|
5625
|
24025
|
155,7225
|
-0,72
|
0,46
|
10
|
165
|
85
|
14025
|
7225
|
27225
|
155,7055
|
9,29
|
5,63
|
11
|
157
|
78
|
12246
|
6084
|
24649
|
155,7174
|
1,28
|
0,82
|
12
|
171
|
113
|
19323
|
12769
|
29421
|
155,6579
|
15,34
|
8,97
|
итого
|
1027
|
1873
|
161873
|
89601
|
295955
|
-
|
4,559
|
93,79
|
Среднее значение
|
85,6
|
156
|
13489,4
|
7466,8
|
24663
|
-
|
-
|
7,8
|
11,8
|
18
|
|
|
21139,44327
|
|
|
|
=0,0017
Получено
уравнение регрессии:
=155,85-0,0017x.
С
увеличением среднедушевого прожиточного минимума на 1 рубль среднедневная
заработная плата возрастает в среднем на 0,0017 рубля.
.
Тесноту линейной связи оценит коэффициент корреляции:
; =0,0017=0,001;
;
Это
означает, что 0,0001% вариации заработной платы(y) объясняется
вариацией фактора x - среднедушевого прожиточного минимума. Качество
модели определяет средняя ошибка аппроксимации:
=; =%
Качество
построенной модели оценивается как хорошее, так как не превышает 8-10%.
.
Оценку статистической значимости параметров регрессии проведем с помощью t-статистики
Стьюдента и путем расчета доверительного интервала каждого из показателей.
Выдвигаем
гипотезу о статистически незначимом отличии показателей от
нуля: a=b=rxy=0.
таб для числа степеней свободы d=n-2=12-2=10 и составит
2,23.
Определим
случайные ошибки :
=
Тогда
Фактические
значения tа-статистики
превосходят табличные значения.
Поскольку tb=0,0089ttab=2,3,
=0,003tтаб=2,3, то статистическая значимость коэффициента регрессии b не подтверждается (не отвергаем гипотезу о равенстве нулю
этого коэффициента).
Рассчитаем
доверительный интервал для a и b. Для этого определим предельную ошибку для каждого
показателя:
=;
=2,2336,3=80,9
Доверительные
интервалы:
Анализ
верхней и нижней границ доверительных интервалов приводит к выводу, о том, что
с вероятностью параметр a, находясь в указанных границах,
не принимает нулевых значений, то есть не является статистически незначимым и
существенно отличен от нуля.
Анализ
верхней и нижней границ доверительных интервалов приводит к выводу, о том, что
с вероятностью параметр b, находясь в указанных границах,
принимается нулевым(не может одновременно принимать отрицательное и
положительное значение).
.
полученные оценки уравнения регрессии позволяют использовать его для прогноза.
Если прогнозное значение прожиточного минимума составит: тысяч рублей, тогда прогнозное значение прожиточного
минимума составит: тысяч рублей.
.
Ошибка прогноза составит:
=1,5 =1,575 тысяч рублей.
Предельная
ошибка прогноза, которая в 95% случаев не будет превышена, составит:
=2,23 1,575=3,51
Доверительный
интервал прогноза:
рублей;
рублей.
Выполненный
прогноз среднемесячной заработной платы оказался надежным(), но не точным, так как диапазон верхней и нижней
границ доверительного интервала составляет
1,08 раза:
; .
Задача
№3.
По 30 территориям России имеются данные, представленные в таблица 3.
Таблица 3
Признак
|
Среднее
значение
|
Среднее
квадратическое отклонение
|
Линейный
коэффициент парной корреляции
|
Среднедневной
душевой доход, руб., у
|
88,8
|
8,44
|
|
Среднедневная
заработная плата одного работающего, руб., X1
|
52,9
|
7,86
|
|
Средний возраст
безработного, лет, X2
|
35,5
|
-1,42
|
|
линейный фишер множественный регрессия
Требуется:
1.
Построить уравнение множественной регрессии в стандартизованной и естественной
форме; рассчитать частные коэффициенты эластичности, сравнить их с и ,
пояснить различия между ними.
2. Рассчитать линейные коэффициенты частной корреляции и коэффициент
множественной корреляции, сравнить их с линейными коэффициентами парной
корреляции, пояснить различия между ними.
. Рассчитать общий и частные F-критерии Фишера.
Решение задачи.
1.
Линейное уравнение множественной регрессии y от x1 и x2 имеет
вид: .
Для
расчета его параметров применим метод стандартизации переменных и построим
искомое уравнение в стандартизованном масштабе:
.
Расчет
- коэффициентов выполним по формулам:
;
Получим
уравнение:
.
Для
построения уравнения в естественной форме рассчитаем b1 и b2 ,
используя формулы для перехода от к b1:
; ;
; .
Значение
определим из соотношения
Для
характеристики относительной силы влияния х1 и х2 на y
рассчитаем средние коэффициенты эластичности:
;
%; %.
С
увеличением средней заработной платы на x1 на 1% от ее среднего уровня средний душевой доход возрастает на 0,54 от своего среднего уровня; при повышении
среднего возраста безработного на 1%
среднедушевой доход снижается на 0,38% от своего среднего уровня.
Очевидно, что сила влияния средней заработной платы x1 на средний душевой доход оказалось большей, чем сила влияния среднего возраста
безработного . К аналогичным выводам о силе связи приходим при
сравнении модулей значений и :
Различия
в силе влияния фактора на результат, полученные при сравнении и ,
объясняется тем, что коэффициент эластичности исходит из соотношения средних:
,
а
- коэффициент - из соотношения средних квадратических
отклонений:
.
Линейные коэффициенты частной корреляции здесь рассчитываются по рекуррентной
формуле:
=
=
=
Если
сравнить значения коэффициентов парной и частной корреляции, то приходим к
выводу, что из-за слабой межфакторной связи ()
коэффициенты парной и частной корреляции отличаются незначительно: выводы о
тесноте и направлении связи на основе коэффициентов парной и частной корреляции
совпадают:
; ; ;
; ; .
Расчет
линейного коэффициента множественной корреляции выполним с использованием
коэффициентов и :
=
Зависимость
от и характеризуется как тесная, в которой 76% вариации
среднего душевого дохода определяются вариацией учтенных в модели факторов:
средней заработной платы и среднего возраста безработного. Прочие факторы, не
включенные в модель, составляют соответственно 24% от общей вариации .
.
Общий - критерий проверяет гипотезу о статистической значимости уравнения регрессии и
показателя тесноты связи():
=
=3,35; .
Сравнивая
и ,
приходим к выводу о необходимости отклонить гипотезу, так как =3,35=43,9533.
С вероятностью 1-=0,95 делаем заключение о статистической значимости
уравнения в целом и показателя тесноты связи , которые
сформировались под неслучайным воздействием факторов и . Частные
- критерии - и оценивают статистическую значимость присутствия
факторов и в
уравнении множественной регрессии, оценивают целесообразность включения в
уравнение одного фактора после другого фактора, то есть оценивает целесообразность включения в уравнение
фактора после того, как в него был включен фактор . Соответственно указывает
на целесообразность включения в модель фактора после
фактора :
=
=
=4,21; =0,05.
Сравнивая
и приходим
к выводу о целесообразности включения в модель фактора после фактора , так как
=85,3105.
Гипотезу о несущественного прироста за счет включения фактора после фактора .
Целесообразность
включения в модель фактора после
фактора проверяет :
=
=
Низкое
значение свидетельствует о статистической незначимости
прироста
За
счет включения в модель фактора после
фактора . Следовательно, подтверждается нулевая гипотеза о нецелесообразности включения в модель фактора (средний возраст безработного). Это означает, что
парная регрессионная модель зависимости среднего дохода от средней заработной
платы является достаточно статистически значимой, надежной и что нет
необходимости улучшать ее, включая дополнительный фактор (средний возраст безработного).