№ п/п
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
х*
|
Х
|
140
|
110
|
120
|
90
|
130
|
80
|
100
|
75
|
135
|
60
|
125
|
У
|
5,4
|
4,1
|
5,6
|
3,3
|
4,2
|
2,9
|
3,6
|
2,5
|
4,9
|
3,0
|
|
. Постройте поле корреляции и
сформулируйте гипотезу о форме связи.
. Рассчитайте параметры уравнений
линейной, степенной и гиперболической регрессии.
. Оцените тесноту связи с помощью
показателей корреляции и детерминации.
. Дайте с помощью среднего
коэффициента эластичности сравнительную оценку силы связи фактора с
результатом.
. Оцените с помощью средней ошибки аппроксимации качество уравнений
регрессии.
. Оцените с помощью F-критерия Фишера статистическую надежность результатов
регрессионного моделирования. По значениям характеристик, рассчитанных в п.п.
3-5 и данном пункте, выберите лучшее уравнение регрессии и дайте обоснование
этого шага.
. Для выбранной лучшей модели
постройте таблицу дисперсионного анализа и найдите доверительные интервалы для
параметров регрессии и коэффициента корреляции.
8. Сделать прогноз
значения при
(см.
задание) и найти доверительные интервалы прогноза для двух уравнений регрессии
.
. Оценить полученные
результаты и сделать вывод.
Решение
уравнение корреляция
регрессия аппроксимация
1. Построим диаграмму
рассеивания по исходным данным для своего варианта
Y
4
2
50 100 150 X
Из диаграммы следует,
что между показателями и
действительно
наблюдается зависимость. Но сделать вывод какая именно, трудно, поэтому
рассмотрим все три регрессии, а затем выберем лучшую.
А) Рассмотрим линейную
регрессию.
Составим исходную
расчетную таблицу. Для удобства можно добавить в нее еще два столбца: ,
чтобы сразу получить общую сумму квадратов.
№ п/п
|
Объем товарооборота (тыс. руб.)Издержки (тыс.
руб.)
|
|
|
|
|
|
|
|
|
1
|
140
|
5,4
|
19600
|
29,16
|
756
|
5,25
|
0,15
|
0,02
|
2,78
|
2
|
110
|
4,1
|
12100
|
16,81
|
451
|
4,2
|
-0,1
|
0,01
|
2,43
|
3
|
120
|
5,6
|
14400
|
31,36
|
672
|
4,55
|
1,05
|
1,1
|
18,75
|
4
|
90
|
3,3
|
8100
|
10,89
|
297
|
3,5
|
-0,2
|
0,04
|
6,06
|
5
|
130
|
4,2
|
16900
|
17,64
|
546
|
4,9
|
-0,7
|
0,49
|
16,67
|
6
|
80
|
2,9
|
6400
|
8,41
|
232
|
3,15
|
-0,25
|
0,06
|
8,62
|
7
|
100
|
3,6
|
10000
|
12,96
|
360
|
3,85
|
-0,25
|
0,06
|
6,94
|
8
|
75
|
2,5
|
5625
|
6,25
|
187,5
|
2,98
|
-0,38
|
0,14
|
15,2
|
9
|
135
|
4,9
|
18225
|
24,01
|
661,5
|
5,07
|
-0,17
|
0,03
|
3,47
|
10
|
60
|
3,0
|
3600
|
9
|
180
|
2,45
|
0,55
|
0,30
|
18,33
|
Итого
|
1040
|
39,5
|
114950
|
166,49
|
4343
|
39,5
|
0
|
2,25
|
99,25
|
Средн.зн.
|
104
|
3,95
|
11495
|
16,65
|
434,3
|
3,95
|
-
|
-
|
9,925
|
Функция издержек
выразится зависимостью: .
Для определения
коэффициентов «a» и «b» воспользуемся методом наименьших квадратов (МНК):
(1)
Домножим уравнение (1)
системы на (-104), получим систему, которую решим методом алгебраического
сложения.
b
= 235или
b = 0,03461.
Коэффициент корреляции b можно находить по формуле (2), не решая систему (1)
непосредственно:
(2) ,
Результат аналогичен.
Теперь найдем
коэффициент «a» из уравнения (1) системы (1):
a
= 39,5-1040b; a = 0,35.
Или можно «a» вычислить по формуле (3) ,
.
Уравнение регрессии
будет иметь вид: =0,35
+ 0,035 x
Затем, подставляя
различные значения из
столбца 2, получим теоретические значения для столбца 7:
,
аналогично для …
и .
В столбце 8 находим
разность текущего значения и (теоретического),
найденного по формуле (4).
Для расчета используем
следующие формулы:
, , ,
, , .
Коэффициент
аппроксимации определим по формуле:
.
Средняя ошибка
аппроксимации:
.
Допустимый предел
значений -
не более 10%, это говорит о том, что уравнение регрессии точно аппроксимирует
исходную зависимость.
Тесноту связи изучаемых
явлений оценивает линейный коэффициент парной корреляции .
Найдем его по формуле для
.
Коэффициент .
Характер связи устанавливается по таблице Чеддока:
Диапазон измерения
|
0,1-0,3
|
0,3-0,5
|
0,5-0,7
|
0,7-0,9
|
0,9-0,99
|
Характер тесноты связи
|
слабая
|
умеренная
|
заметная
|
высокая
|
весьма высокая
|
В примере получилась связь прямая,
высокая.
Для вычисления
коэффициента ,
используются и другие формулы:
.
. Дисперсионный анализ.
Общая сумма квадратов отклонений (т.е. общая дисперсия) равна:
,
где -
общая сумма квадратов отклонений,
- сумма отклонений,
обусловленная регрессией (факторная),
- остаточная сумма
квадратов отклонений.
.
Остаточная сумма определена
в таблице в 9 столбце и равна 2,25. Тогда объясненная (факторная) сумма
квадратов будет равна
Долю дисперсии, объясняемую
регрессией, в общей доле дисперсии характеризует индекс
детерминации .
Он определяется отношением объясненной дисперсии к общей
.
Качество всего уравнения
регрессии в целом, проверяется F-тестом.
Составим таблицу
дисперсионного анализа:
Источники вариации Число
степеней свободы квадр.
отклонений.Дисперсия на 1 степ. свободы.F
отн
|
|
|
|
|
|
|
|
Факт
|
табл. (0,05)
|
общая
|
9
|
10,465
|
8,215
|
29,21
|
5,32
|
объясненная
|
1
|
8,215
|
|
|
|
остаточная
|
8
|
2,25
|
0,281
|
|
|
Fтабл определяем по [1] в
зависимости от уровня значимости (α = 0,05) и числа степеней свободы (df=8). Fтабл=5,32.
F-тест состоит в проверке гипотезы Но о статистической
незначимости уравнения регрессии и показателя тесноты связи rху.
Если Fфакт >Fтабл (29,21>5,32), то
гипотеза Но о случайной природе оцениваемых характеристик
отклоняется и признается их значимость и надежность.
Б) Степенная регрессия
Для того, чтобы
построить степенную модель, необходимо линеаризовать переменные путем
логарифмирования обеих частей уравнения :
Пусть ,
тогда
Рассчитываем и
b по формулам:
Все необходимые расчеты
представлены в таблице 2.
№ п/п
|
x
|
y
|
X
|
Y
|
XY
|
X2
|
Y2
|
|
|
|
1
|
140
|
5,4
|
4,9416
|
1,686
|
8,3335
|
24,414
|
2,843
|
5,1
|
0,3
|
0,09
|
2
|
110
|
4,1
|
4,7005
|
1,411
|
6,6324
|
22,097
|
1,990
|
4,1
|
0
|
0
|
3
|
120
|
5,6
|
4,7875
|
1,722
|
8,2479
|
22,922
|
2,968
|
4,4
|
1,2
|
1,44
|
4
|
90
|
3,3
|
4,4998
|
1,193
|
5,3723
|
20,242
|
1,424
|
3,5
|
-0,2
|
0,04
|
5
|
130
|
4,2
|
4,8675
|
1,435
|
6,9853
|
23,696
|
2,055
|
4,8
|
-0,6
|
0,36
|
6
|
80
|
2,9
|
4,3820
|
1,064
|
4,6655
|
19,201
|
1,133
|
3,2
|
-0,3
|
0,09
|
7
|
100
|
3,6
|
4,6052
|
1,2809
|
5,8988
|
21,2079
|
1,6407
|
3,8
|
- 0,2
|
0,04
|
8
|
75
|
2,5
|
4,3175
|
3,9561
|
18,6408
|
0,8396
|
3,0
|
-0,5
|
0,25
|
9
|
135
|
4,9
|
4,9053
|
1,5892
|
7,7955
|
24,0620
|
2,5256
|
4,9
|
0
|
0
|
10
|
60
|
3,0
|
4,0943
|
1,0986
|
4,4980
|
16,7633
|
1,2069
|
2,5
|
0,5
|
0,25
|
Итого
|
1040
|
39,5
|
46,1012
|
13,398
|
62,3853
|
213,251
|
18,634
|
39,3
|
0,2
|
2,56
|
Средн.зн.
|
104
|
3,95
|
4,61012
|
1,3398
|
6,23853
|
21,3251
|
1,8634
|
|
|
|
Параметры будут равны:
Подставим их в уравнение
и получим линейное уравнение:
Потенцируя которое,
получим:
По этому уравнению
заполняется вторая половина таблицы.
В) Уравнение гиперболы
Линеаризуется при замене
,
тогда
Все необходимые расчеты
представим в таблице 6.
№ п/п
|
x
|
y
|
|
|
|
|
|
|
1
|
140
|
5,4
|
0,007143
|
0,038572
|
0,000051
|
4,9
|
0,5
|
0,25
|
2
|
110
|
4,1
|
0,009090
|
0,037269
|
0,000082
|
4,3
|
-0,2
|
0,04
|
3
|
120
|
5,6
|
0,008333
|
0,046667
|
0,000069
|
4,6
|
1
|
1
|
4
|
90
|
3,3
|
0,011111
|
0,036667
|
0,000123
|
3,7
|
-0,4
|
0,16
|
5
|
130
|
4,2
|
0,007692
|
0,032306
|
0,000059
|
4,8
|
-0,6
|
0,36
|
6
|
80
|
2,9
|
0,0125
|
0,03625
|
0,000156
|
3,3
|
-0,4
|
0,16
|
7
|
100
|
3,6
|
0,01
|
0,036
|
0,0001
|
4,0
|
-0,4
|
0,16
|
8
|
75
|
2,5
|
0,013333
|
0,033332
|
0,000177
|
3,0
|
-0,5
|
0,25
|
9
|
135
|
4,9
|
0,007407
|
0,036294
|
0,000054
|
4,8
|
0,1
|
0,01
|
10
|
60
|
3,0
|
0,016667
|
0,05
|
0,000277
|
2,0
|
1
|
1
|
Сумма
|
1040
|
39,5
|
0,103276
|
0,383357
|
0,001148
|
39,4
|
|
3,39
|
Ср. знач.
|
104
|
3,95
|
0,0103276
|
0,0383357
|
0,000115
|
|
|
|
Найдем параметры и
,
используя МНК.
Для этого решим систему
(1), учитывая, что .
Таким образом, получили
систему уравнений:
::
Можно воспользоваться
формулами.
Итак, получим уравнение:
.
Оценим тесноту связи
результативным фактором и факторным признаком с помощью индекса корреляции (для
нелинейных моделей) и коэффициента детерминации , которые рассчитываются
по следующим формулам:
,
Для степенной регрессии:
Для уравнения гиперболы
получим:
Найдем средний
коэффициент эластичности по формулам, представленным в таблице 7.
Таблица 7
Вид регрессии
|
Формула для расчета
|
Линейная
|
|
Степенная
|
|
Гиперболическая
|
|
Найдем среднюю ошибку аппроксимации
по формуле:
, где .
Оценим статистическую
надежность результатов регрессионного моделирования с помощью F-критерия Фишера:
.
Для степенной регрессии
имеем:
.
Для уравнения гиперболы
получим:
.
Для линейном модели уже
строили таблицу дисперсионного анализа.
Для сравнения полученных
уравнений регрессии построим следующую таблицу:
Вид регрессии
|
,
R2,
r2F
|
|
|
|
|
|
Линейная
|
0,886
|
0,785
|
9,925
|
0,9123
|
29,21
|
2,25
|
Степенная
|
0,869
|
0,755
|
9,989
|
0,85
|
24,65
|
3,32
|
Гиперболическая
|
0,822
|
0,676
|
13,87
|
1,0002
|
16,69
|
11,33
|
Из итоговой таблицы видно, что
коэффициент корреляции наибольший для линейной регрессии, коэффициент
детерминации max, а коэффициент аппроксимации минимален, поэтому можно сделать
вывод: наиболее сильное влияние на уровень издержек в зависимости от
товарооборота получается при использовании в качестве аппроксимирующей функции
линейную функцию.
Для всех моделей ,
следовательно, все модели являются адекватными.
Из таблицы видно, что
лучшим уравнением регрессии является линейная функция, так как коэффициент
детерминации для этой функции является наибольшим из представленных в таблице,
сумма квадратов отклонений фактических значений результативного признака от
расчетных является наименьшей и средний коэффициент аппроксимации является
наименьшим.
Если получается, что
коэффициент детерминации для нелинейной регрессии больше
коэффициента
детерминации для линейной регрессии, надо рассмотреть модуль .
Если разность небольшая, т.е. условие модуля выполняется, то все равно выбираем
линейную регрессию для дальнейших расчетов.
Чем больше кривизна
линии регрессии, тем <.
Если превышает
0,1, то предположение о линейной форме связи считается не оправданным. В этом
случае проводится оценка существенности различия по критерию Стьюдента.
- ошибка разности между и
Если t < 2, то различия между и несущественны,
и возможно применение линейной регрессии.
Если t >2, то различия существенны и замена нелинейной регрессии
уравнением линейной функции невозможна.
В нашем примере лучшей
является линейная модель. Для линейной регрессии выполним дальнейшие расчеты.
Для оценки
статистической значимости коэффициентов регрессии и корреляции рассчитывают t-критерий.
Оценка значимости
коэффициентов регрессии и корреляции с помощью t-критерия
Стьюдента проводится путем сопоставления их значений с величиной случайной
ошибки:
, , ;
,
где ,
или из табл. дисперсионного анализа (0,281).
, .
Для примера определим
стандартную ошибку для параметра «b»:
Критерий Стьюдента для
параметра «b» равен 5,46.
Связь между F-критерием Фишера и t-статистикой
Стьюдента выражается равенством: , 5,462=29,81.
Табличное значение tтабл критерия Стьюдента определяем по [1] для и уровня значимости 0,05
и числа степеней свободы df
= 8, ,
т.к. >
,
то гипотезу о несущественности коэффициента регрессии можно отклонить.
Для расчета
доверительного интервала определяем предельную ошибку для
каждого показателя:
Доверительный интервал: ,
.
Для расчета
доверительного интервала для параметра а, найдем:
, т. к. критерий
Стьюдента двусторонний, а параметр а - положительный, то он значим. Найдем для
него доверительный интервал:
Найдем доверительный
интервал для параметра r:
Если в границы доверительного
интервала попадает ноль, т.е. нижняя граница отрицательная, а верхняя
положительная, то оцениваемый параметр принимается нулевым, т. к. не может
одновременно принимать и положительное и отрицательное значения.
Прогнозное значение определяется
путем подстановки в уравнение регрессии:
Вычислим ошибку прогноза
для уравнения :
.
И для уравнения :
(*) ,
,
.
Для * ,
,
,
,
,
.
Для уравнения с :
,
.
Вывод: Целью данной
контрольно-курсовой работы было определение количественной взаимосвязи между
объемом товарооборота и объемом издержек на основе статистических данных. Для
этого были построены уравнения линейной, степенной, гиперболической парной
регрессии.
В ходе проведенного
исследования выяснилось, что лучшей моделью для описания взаимосвязи между
объемом товарооборота и объемом издержек является линейная функция =0,35
+ 0,035 x.
На основе последнего уравнения можно
предположить, что с увеличением товарооборота на 1 тыс. руб. потребительские
расходы на душу населения увеличатся на 0,035 тыс. руб.
При выполнении расчетов выяснилось,
средний коэффициент эластичности для линейной модели составляет 0,9123, т.е. с
увеличением объема товарооборота на 1% объем издержек увеличивается в среднем
на 0,9123%.
Коэффициент детерминации для
линейной модели составил 0,785. Это означает, что уравнением регрессии
объясняется 78,5% дисперсии результативного признака (объем издержек), а на
долю прочих факторов приходится 21,5%, следовательно, линейная модель хорошо
аппроксимирует исходные данные и ей можно пользоваться для прогноза значений
результативного признака.
Так, полагая, что объем
товарооборота составит 125 тыс. руб., то прогнозное значение для объема
издержек окажется 4,725 тыс. руб., при этом с вероятностью 0,95 можно
утверждать, что доверительные интервалы прогноза индивидуального значения
результативного признака составят .
Литература
1. Новиков А.И. Эконометрика: Учеб.
пособие. - М.: ИНФРА-М, 2010. - 144 с.
. Доугерти К. Введение в
эконометрику. - М.: ИНФРА-М, 2001. - XIV, - 402 с.
Елисеева И.И. Эконометрика: Учебник.
- М.: Финансы и статистика, 2007. - 576 с.
. Елисеева И.И., Курышева С.В.,
Гордиенко Н.М. Практикум по эконометрике: Учебное пособие. - М.: Финансы и
статистика, 2008 - 344 с.
5. Магнусян Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика.
Начальный курс. - М.: Дело, 2001. - 454 с.
. Кремер Н.Ш. Теория вероятностей и математическая статистика. -
М.: ЮНИТИ-ДАНА, 2003. - 573 с.
. Кремер Н.Ш., Путко Б.А. Эконометрика. - М.: ЮНИТИ-ДАНА, 2002. -
435 с.
. Домбровский В.В. Эконометрика - М.: Новый учебник, 2004. - 342
с.