Номер
предприятия
|
Номер предприятия
|
|
|
|
|
|
|
1
|
6
|
3,5
|
10
|
11
|
10
|
6,3
|
21
|
2
|
6
|
3,6
|
12
|
12
|
11
|
6,4
|
22
|
3
|
7
|
3,9
|
15
|
13
|
11
|
7
|
23
|
4
|
7
|
4,1
|
17
|
14
|
12
|
7,5
|
25
|
5
|
7
|
4,2
|
18
|
15
|
12
|
7,9
|
28
|
6
|
8
|
4,5
|
19
|
16
|
13
|
8,2
|
30
|
7
|
8
|
5,3
|
19
|
17
|
13
|
8,4
|
31
|
8
|
9
|
5,3
|
20
|
18
|
14
|
8,6
|
31
|
9
|
9
|
5,6
|
20
|
19
|
14
|
9,5
|
35
|
10
|
10
|
6
|
21
|
20
|
15
|
10
|
36
|
Требуется:
1. Построить линейную модель множественной
регрессии. Записать стандартизованное уравнение множественной регрессии. На
основе стандартизованных коэффициентов регрессии и средних коэффициентов
эластичности ранжировать факторы по степени их влияния на результат.
2. Найти коэффициенты парной, частной и
множественной корреляции. Проанализировать их.
3. Найти скорректированный коэффициент множественной
детерминации. Сравнить его с нескорректированным (общим) коэффициентом
детерминации.
4. С
помощью -критерия Фишера оценить статистическую
надежность уравнения регрессии и коэффициента детерминации .
5. С
помощью частных -критериев Фишера оценить целесообразность
включения в уравнение множественной регрессии фактора после и фактора после .
6. Составить
уравнение линейной парной регрессии, оставив лишь один значащий фактор.
Решение
Для удобства проведения расчетов поместим результаты
промежуточных расчетов в таблицу:
Найдем средние квадратические отклонения признаков:
;
;
.
1. Вычисление параметров линейного уравнения
множественной регрессии.
Для нахождения параметров линейного уравнения множественной
регрессии
необходимо решить следующую систему линейных уравнений
относительно неизвестных параметров , , :
либо воспользоваться готовыми формулами:
; ;
.
Рассчитаем сначала парные коэффициенты корреляции:
;
;
.
Находим
;
;
.
Таким образом, получили следующее уравнение множественной
регрессии:
.
Коэффициенты и стандартизованного уравнения регрессии находятся по формулам:
;
.
Т.е. уравнение будет выглядеть следующим образом:
.
Так как стандартизованные коэффициенты регрессии можно сравнивать
между собой, то можно сказать, что ввод в действие новых основных фондов
оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой
квалификации.
Сравнивать влияние факторов на результат можно также при помощи
средних коэффициентов эластичности:
.
Вычисляем:
; .
Т.е. увеличение только основных фондов (от своего среднего
значения) или только удельного веса рабочих высокой квалификации на 1 %
увеличивает в среднем выработку продукции на 0,83 % или 0,035 % соответственно.
Таким образом, подтверждается большее влияние на результат фактора , чем фактора .
2. Коэффициенты парной корреляции мы уже нашли:
; ; .
Они указывают на весьма сильную связь каждого фактора с
результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т. к. ). При такой сильной межфакторной зависимости рекомендуется один
из факторов исключить из рассмотрения.
Частные коэффициенты корреляции характеризуют тесноту связи
между результатом и соответствующим фактором при элиминировании (устранении
влияния) других факторов, включенных в уравнение регрессии.
При двух факторах частные коэффициенты корреляции
рассчитываются следующим образом:
;
.
Если сравнить коэффициенты парной и частной корреляции, то
можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной
корреляции дают завышенные оценки тесноты связи. Именно по этой причине
рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов
исключать из исследования тот фактор, у которого теснота парной зависимости
меньше, чем теснота межфакторной связи.
Коэффициент множественной корреляции определить через матрицу
парных коэффициентов корреляции:
,
где
- определитель матрицы парных коэффициентов корреляции;
определитель матрицы межфакторной корреляции.
;
.
Коэффициент множественной корреляции
.
Аналогичный результат получим при использовании других
формул:
;
;
.
Коэффициент множественной корреляции показывает на весьма сильную
связь всего набора факторов с результатом.
3. Нескорректированный
коэффициент множественной детерминации оценивает долю вариации результата за счет представленных в
уравнении факторов в общей вариации результата. Здесь эта доля составляет и указывает на весьма высокую степень
обусловленности вариации результата вариацией факторов, иными словами - на
весьма тесную связь факторов с результатом.
Скорректированный коэффициент множественной детерминации
определяет тесноту связи с учетом степеней свободы общей и остаточной
дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа
факторов и поэтому может сравниваться по разным моделям с разным числом
факторов. Оба коэффициента указывают на весьма высокую (более ) детерминированность результата в модели факторами и .
4. Оценку
надежности уравнения регрессии в целом и показателя тесноты связи дает -критерий Фишера:
.
В нашем случае фактическое значение -критерия Фишера:
.
Получили, что (при ), т. е. вероятность случайно получить
такое значение -критерия не превышает допустимый уровень
значимости . Следовательно, полученное значение не
случайно, оно сформировалось под влиянием существенных факторов, т. е.
подтверждается статистическая значимость всего уравнения и показателя тесноты
связи .
5. С
помощью частных -критериев Фишера оценим целесообразность
включения в уравнение множественной регрессии фактора после и фактора после при помощи формул:
;
.
Найдем и .
;
.
Имеем
;
.
Получили, что . Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост
факторной дисперсии за счет дополнительного признака оказывается незначительным,
несущественным; фактор включать в уравнение после фактора не следует.
Если поменять первоначальный порядок включения факторов в модель и
рассмотреть вариант включения после , то результат расчета частного -критерия для будет иным. , т. е. вероятность его случайного
формирования меньше принятого стандарта . Следовательно, значение частного -критерия для дополнительно включенного фактора не случайно, является статистически
значимым, надежным, достоверным: прирост факторной дисперсии за счет
дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том
числе в варианте, когда он дополнительно включается после фактора .
6. Общий
вывод состоит в том, что множественная модель с факторами и с содержит неинформативный фактор . Если исключить фактор , то можно ограничиться уравнением парной
регрессии:
, .
. Системы эконометрических уравнений
Дана система эконометрических уравнений.
Макроэкономическая модель (упрощенная версия модели Клейна):
где - потребление; - инвестиции; - доход; - налоги; - запас капитала; - текущий период; - предыдущий период.
Требуется
1. Применив необходимое и достаточное условие
идентификации, определите, идентифицируемо ли каждое из уравнений модели.
2. Определите метод оценки параметров модели.
3. Запишите в общем виде приведенную форму модели.
Решение
Первое уравнение - функция потребления, второе уравнение -
функция инвестиций, третье уравнение - тождество дохода.
Модель представляет собой систему одновременных уравнений.
Проверим каждое ее уравнение на идентификацию.
Модель включает три эндогенные переменные и две предопределенные переменные
(экзогенную переменную - и лаговую переменную - ).
Проверим необходимое условие идентификации для каждого из
уравнений модели.
Первое уравнение: . Это уравнение содержит две эндогенные переменные и и одну предопределенную переменную . Таким образом, , а , т. е. выполняется условие . Уравнение сверхидентифицируемо.
Второе уравнение: . Оно включает две эндогенные переменные и и одну экзогенную переменную . Выполняется условие . Уравнение сверхидентифицируемо.
Третье уравнение: . Оно представляет собой тождество, параметры которого известны.
Необходимости в идентификации нет.
Проверим для каждого уравнения достаточное условие идентификации.
Для этого составим матрицу коэффициентов при переменных модели.
|
|
|
|
|
|
I уравнение
|
-1
|
0
|
0
|
|
|
II уравнение
|
0
|
-1
|
0
|
|
|
Тождество
|
1
|
1
|
-1
|
0
|
0
|
В соответствии с достаточным условием идентификации ранг
матрицы коэффициентов при переменных, не входящих в исследуемое уравнение,
должен быть равен числу эндогенных переменных модели без одного.
Первое уравнение. Матрица коэффициентов при переменных, не
входящих в уравнение, имеет вид
|
|
|
II уравнение
|
-1
|
|
Тождество
|
1
|
0
|
Ранг данной матрицы равен двум, так как определитель квадратной
матрицы не равен нулю:
.
Достаточное условие идентификации для данного уравнения
выполняется.
Второе уравнение. Матрица коэффициентов при переменных, не
входящих в уравнение, имеет вид
|
|
|
I уравнение
|
-1
|
|
Тождество
|
1
|
0
|
Ранг данной матрицы равен двум, так как определитель квадратной
матрицы не равен нулю:
.
Достаточное условие идентификации для данного уравнения
выполняется.
Таким образом, все уравнения модели сверхидентифицируемы.
Приведенная форма модели в общем виде будет выглядеть следующим образом:
Для оценки параметров необходимо применить двухшаговый
метод наименьших квадратов.
. Временные ряды
корреляция регрессия линейный уравнение
Имеются условные данные об объемах потребления электроэнергии () жителями региона за 16 кварталов.
|
|
|
|
1
|
5,8
|
9
|
7,9
|
2
|
4,5
|
10
|
5,5
|
3
|
5,1
|
11
|
6,3
|
4
|
9,1
|
10,8
|
5
|
7,0
|
13
|
9,0
|
6
|
5,0
|
14
|
6,5
|
7
|
6,0
|
15
|
7,0
|
8
|
10,1
|
16
|
11,1
|
Требуется:
1. Построить автокорреляционную функцию и сделать
вывод о наличии сезонных колебаний.
2. Построить мультипликативную модель временного
ряда.
3. Сделать прогноз на 2 квартала вперед.
Решение
Построим поле корреляции:
Рис. 1
Уже исходя из графика видно, что значения образуют пилообразную фигуру. Рассчитаем
несколько последовательных коэффициентов автокорреляции. Для этого составляем
первую вспомогательную таблицу.
Таблица 2
|
t
|
yt
|
yt-1
|
yt -
y1
|
yt-1 -
y2
|
(yt -
y1) *(yt-1 - y2)
|
(yt-y1)2
|
(yt-1-y2)2
|
|
|
1
|
5,8
|
-
|
-
|
-
|
-
|
-
|
-
|
|
|
2
|
4,5
|
5,8
|
-2,89
|
-1,24
|
3,59
|
8,37
|
1,54
|
|
|
3
|
5,1
|
4,5
|
-2,29
|
-2,54
|
5,83
|
5,26
|
6,45
|
|
|
4
|
9,1
|
5,1
|
1,71
|
-1,94
|
-3,31
|
2,91
|
3,76
|
|
|
5
|
7
|
9,1
|
-0,39
|
2,06
|
-0,81
|
0,15
|
4,24
|
|
|
6
|
5
|
7
|
-2,39
|
-0,04
|
0,10
|
5,73
|
0,00
|
|
|
7
|
6
|
5
|
-1,39
|
-2,04
|
2,84
|
1,94
|
4,16
|
|
|
8
|
10,1
|
6
|
2,71
|
-1,04
|
-2,81
|
7,33
|
1,08
|
|
|
9
|
7,9
|
10,1
|
0,51
|
3,06
|
1,55
|
0,26
|
9,36
|
|
|
10
|
5,5
|
7,9
|
-1,89
|
0,86
|
-1,63
|
3,58
|
0,74
|
|
|
11
|
6,3
|
5,5
|
-1,09
|
-1,54
|
1,68
|
1,20
|
2,37
|
|
|
12
|
10,8
|
6,3
|
3,41
|
-0,74
|
-2,52
|
11,61
|
0,55
|
|
|
13
|
9
|
10,8
|
1,61
|
3,76
|
6,04
|
2,58
|
14,14
|
|
|
14
|
6,5
|
9
|
-0,89
|
1,96
|
-1,75
|
0,80
|
3,84
|
|
|
15
|
7
|
6,5
|
-0,39
|
-0,54
|
0,21
|
0,15
|
0,29
|
|
|
16
|
11,1
|
7
|
3,71
|
-0,04
|
-0,15
|
13,74
|
0,00
|
|
|
Сумма
|
110,9
|
105,6
|
0,00
|
0,00
|
8,85
|
65,61
|
52,54
|
|
|
Среднее
значение
|
7,39
|
7,04
|
-
|
-
|
-
|
-
|
-
|
|
Следует заметить, что среднее значение получается путем
деления не на 16, а на 15, т. к. у нас теперь на одно наблюдение меньше.
Теперь вычисляем коэффициент автокорреляции первого порядка
по формуле (4.1):
.
Составляем вспомогательную таблицу для расчета коэффициента
автокорреляции второго порядка.
Таблица 3
|
|
|
|
|
|
|
|
|
|
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
|
|
1
|
5,8
|
-
|
-
|
-
|
-
|
-
|
-
|
|
|
2
|
4,5
|
-
|
-
|
-
|
-
|
-
|
-
|
|
|
3
|
5,1
|
5,80
|
-2,50
|
-1,24
|
3,11
|
6,25
|
1,54
|
|
|
4
|
9,1
|
4,50
|
1,50
|
-2,54
|
-3,81
|
2,25
|
6,47
|
|
|
5
|
7
|
5,10
|
-0,60
|
-1,94
|
1,17
|
0,36
|
3,77
|
|
|
6
|
5
|
9,10
|
-2,60
|
2,06
|
-5,35
|
6,76
|
4,23
|
|
|
7
|
6
|
7,00
|
-1,60
|
-0,04
|
0,07
|
2,56
|
0,00
|
|
|
8
|
10,1
|
5,00
|
2,50
|
-2,04
|
-5,11
|
6,25
|
4,17
|
|
|
9
|
7,9
|
6,00
|
0,30
|
-1,04
|
-0,31
|
0,09
|
1,09
|
|
|
10
|
5,5
|
10,10
|
-2,10
|
3,06
|
-6,42
|
4,41
|
9,35
|
|
|
11
|
6,3
|
7,90
|
-1,30
|
0,86
|
-1,11
|
1,69
|
0,73
|
|
|
12
|
10,8
|
5,50
|
3,20
|
-1,54
|
-4,94
|
10,24
|
2,38
|
|
|
13
|
9
|
6,30
|
1,40
|
-0,74
|
-1,04
|
1,96
|
0,55
|
|
|
14
|
6,5
|
10,80
|
-1,10
|
3,76
|
-4,13
|
1,21
|
14,12
|
|
|
15
|
7
|
9,00
|
-0,60
|
1,96
|
-1,17
|
0,36
|
3,83
|
|
|
16
|
11,1
|
6,50
|
3,50
|
-0,54
|
-1,90
|
12,25
|
0,29
|
|
|
Сумма
|
106,4
|
98,60
|
0,00
|
0,00
|
-30,96
|
56,64
|
52,53
|
|
|
Среднее
значение
|
7,60
|
7,04
|
|
|
|
|
|
|
Следовательно
.
Аналогично находим коэффициенты автокорреляции более высоких
порядков, а все полученные значения заносим в сводную таблицу.
Таблица 4.
Лаг
|
1
|
0,150741
|
2
|
-0,567553
|
3
|
0,094221
|
4
|
0,989408
|
5
|
0,125385
|
6
|
-0,697339
|
7
|
-0,039680
|
8
|
0,975879
|
9
|
0,146685
|
10
|
-0,741901
|
11
|
-0,131990
|
12
|
0,955916
|
Коррелограмма:
Рис. 2.
Анализ коррелограммы и графика исходных уровней временного
ряда позволяет сделать вывод о наличии в изучаемом временном ряде сезонных
колебаний периодичностью в четыре квартала.
Построим мультипликативную модель временного ряда.
Шаг 1. Проведем выравнивание исходных уровней ряда
методом скользящей средней. Для этого:
.1. Просуммируем уровни ряда последовательно за каждые четыре
квартала со сдвигом на один момент времени и определим условные годовые объемы
потребления электроэнергии (гр. 3 табл. 5).
.2. Разделив полученные суммы на 4, найдем скользящие средние
(гр. 4 табл. 5). Полученные таким образом выровненные значения уже не содержат
сезонной компоненты.
.3. Приведем эти значения в соответствие с фактическими моментами
времени, для чего найдем средние значения из двух последовательных скользящих
средних - центрированные скользящие средние (гр. 5 табл. 5).
Таблица
5.
№ квартала, t
|
Объем
потребления энергии, yt
|
Итого за четыре
квартала
|
Скользящая
средняя за четыре квартала
|
Центрированная
скользящая средняя
|
Оценка сезонной
компоненты
|
1
|
5,8
|
-
|
-
|
-
|
-
|
2
|
4,5
|
24,5
|
6,125
|
-
|
-
|
3
|
5,1
|
25,7
|
6,425
|
6,275
|
0,8127
|
4
|
9,1
|
26,2
|
6,55
|
6,4875
|
1,4027
|
5
|
7
|
27,1
|
6,775
|
6,6625
|
1,0507
|
6
|
5
|
28,1
|
7,025
|
6,9
|
0,7246
|
7
|
6
|
29
|
7,25
|
7,1375
|
0,8406
|
8
|
10,1
|
29,5
|
7,375
|
7,3125
|
1,3812
|
9
|
7,9
|
29,8
|
7,45
|
7,4125
|
1,0658
|
10
|
5,5
|
30,5
|
7,625
|
7,5375
|
0,7297
|
11
|
6,3
|
31,6
|
7,9
|
7,7625
|
0,8116
|
12
|
10,8
|
32,6
|
8,15
|
8,025
|
1,3458
|
13
|
9
|
33,3
|
8,325
|
8,2375
|
1,0926
|
14
|
6,5
|
33,6
|
8,4
|
8,3625
|
0,7773
|
15
|
7
|
-
|
-
|
-
|
-
|
16
|
11,1
|
-
|
-
|
-
|
-
|
Шаг 2.
Найдем оценки сезонной компоненты как частное от деления фактических уровней
ряда на центрированные скользящие средние (гр. 6 табл. 5). Эти оценки
используются для расчета сезонной компоненты (табл. 6.). Для этого найдем средние за каждый квартал оценки
сезонной компоненты . Считается, что сезонные воздействия за
период взаимопогашаются. В мультипликативной модели это выражается в том, что
сумма значений сезонной компоненты по всем кварталам должна быть равна числу
периодов в цикле. В нашем случае число периодов одного цикла равно 4.
Таблица
6.
Показатели
|
№ квартала, i
|
|
I
|
II
|
III
|
IV
|
|
-
|
-
|
0,8127
|
1,4027
|
|
1,0507
|
0,7246
|
0,8406
|
1,3812
|
|
1,0658
|
0,7297
|
0,8116
|
1,3458
|
|
1,0926
|
0,7773
|
-
|
-
|
Всего за i-й
квартал
|
3,2091
|
2,2316
|
2,4649
|
4,1297
|
Средняя
оценка сезонной компоненты для i-го квартала,
|
1,0697
|
0,7439
|
0,8216
|
1,3766
|
Скорректированная
сезонная компонента, Si
|
1,0666
|
0,7417
|
0,8192
|
1,3725
|
Имеем
.
Определяем корректирующий коэффициент:
.
Скорректированные значения сезонной компоненты получаются при умножении ее средней
оценки на корректирующий коэффициент .
Проверяем условие равенство 4 суммы значений сезонной компоненты:
.
Шаг 3.
Разделим каждый уровень исходного ряда на соответствующие значения сезонной
компоненты. В результате получим величины (гр. 4 табл. 7), которые содержат только тенденцию и случайную
компоненту.
Таблица
7.
t
|
yt
|
Si
|
yt/Si
|
T
|
T*S
|
E=yt/(T*S)
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
1
|
5,8
|
1,0666
|
5,4378
|
5,8475
|
6,2369
|
0,9299
|
2
|
4,5
|
0,7417
|
6,0671
|
6,0392
|
4,4793
|
1,0046
|
3
|
5,1
|
0,8192
|
6,2256
|
6,2309
|
5,1044
|
0,9991
|
4
|
9,1
|
1,3725
|
6,6302
|
6,4226
|
8,8150
|
1,0323
|
5
|
7
|
1,0666
|
6,5629
|
6,6143
|
7,0548
|
0,9922
|
6
|
5
|
0,7417
|
6,7413
|
6,8060
|
5,0480
|
0,9905
|
7
|
6
|
0,8192
|
7,3242
|
6,9977
|
5,7325
|
1,0467
|
8
|
10,1
|
1,3725
|
7,3588
|
7,1894
|
9,8675
|
1,0236
|
9
|
7,9
|
1,0666
|
7,4067
|
7,3811
|
7,8727
|
1,0035
|
10
|
5,5
|
0,7417
|
7,4154
|
7,5728
|
5,6167
|
0,9792
|
11
|
6,3
|
0,8192
|
7,6904
|
7,7645
|
6,3607
|
0,9905
|
12
|
10,8
|
1,3725
|
7,8689
|
7,9562
|
10,9199
|
0,9890
|
13
|
9
|
1,0666
|
8,4380
|
8,1479
|
8,6906
|
1,0356
|
14
|
6,5
|
0,7417
|
8,7637
|
8,3396
|
6,1855
|
1,0508
|
15
|
7
|
0,8192
|
8,5449
|
8,5313
|
6,9888
|
1,0016
|
16
|
11,1
|
1,3725
|
8,0874
|
8,7230
|
11,9723
|
0,9271
|
Шаг 4.
Определим компоненту в мультипликативной модели. Для этого
рассчитаем параметры линейного тренда, используя уровни . В результате получим уравнение тренда:
.
Подставляя в это уравнение значения , найдем уровни для каждого момента времени (гр. 5 табл. 7.).
Шаг 5.
Найдем уровни ряда, умножив значения на соответствующие значения сезонной компоненты (гр. 6 табл. 7.).
На одном графике откладываем фактические значения уровней временного ряда и
теоретические, полученные по мультипликативной модели.
Расчет ошибки в мультипликативной модели производится по
формуле:
.
Для сравнения мультипликативной модели и других моделей временного
ряда можно использовать сумму квадратов абсолютных ошибок :
Шаг 6.
Прогнозирование по мультипликативной модели. Прогнозное значение уровня временного ряда в
мультипликативной модели есть произведение трендовой и сезонной компонент. Для
определения трендовой компоненты воспользуемся уравнением тренда
.
Получим
;
.
Значения сезонных компонент за соответствующие кварталы равны: и . Таким образом
;
.
Т.е. в следующие два квартала следует ожидать следующие объемы
потребления электроэнергии 9,5 и 6,8 соответственно.