Фиктивные переменные. Динамические эконометрические модели

Вид работы:

Контрольная работа
Предмет:

Менеджмент
Язык:

Русский
,
Формат файла:
MS Word

50,69 Кб
Опубликовано:

2013-07-28

Скачать контрольную работу Читать текст online Посмотреть все контрольные работы

Вы можете узнать стоимость помощи в написании студенческой работы.

Фиктивные переменные. Динамические эконометрические модели

Контрольная работа

Фиктивные переменные. Динамические эконометрические модели

1. Необходимость использования фиктивных переменных

До сих пор рассматривались модели, в которых все объясняющие переменные были количественными переменными (производительность труда, себестоимость, доход и т.п.). На практике часто возникает необходимость исследования влияния качественных признаков, имеющих два или несколько уровней. К числу таких признаков можно отнести: пол (мужской, женский), образование (начальное, среднее, высшее), фактор сезонности (зима, весна, лето, осень) и т.п.

Качественные признаки могут существенно влиять на структуру линейных связей и приводить к скачкообразному изменению параметров регрессионной модели. В этом случае говорят об исследовании регрессионных моделей с переменной структурой или о построении регрессионных моделей по неоднородным данным.

Например, необходимо изучить зависимость размера з/п Y не только от количественных факторов х1,…,хр, но и от качественного признака Z1 (например, пола). Можно получить оценки регрессионной модели

для каждого уровня качественного признака, а затем изучать различия между ними. Другой подход позволяет оценивать влияние количественных переменных и качественных признаков по одному уравнению регрессии. Он связан с введением фиктивных переменных (структурных переменных).

В качестве фиктивных переменных обычно используют булевы переменные, принимающие лишь значения «0» и «1».

В этом случае первоначальная регрессионная модель з/п примет вид

, где

Таким образом, принимая эту модель, считается, что з/п у мужчин на выше, чем у женщин. Проверка гипотезы

Н0: может установить существенность влияния фактора «пол» на размер з/п. Следует отметить, что в принципе качественное различие можно формализовать с помощью любой переменной, принимающей два разных значения, не обязательно «0» или «1». Однако, в эконометрической практике почти всегда используются фиктивные переменные типа «0-1», так как при этом интерпретация полученных результатов выглядит наиболее просто. Если качественный признак имеет k уровней, то можно ввести дискретную переменную, принимающую k значений. Однако так не поступают из-за трудности содержательной интерпретации, а вводят (k-1) бинарную переменную. Например, для учета фактора образования можно ввести k = 3 - 1 = 2 бинарные переменные z21 и z22:

где

Третьей переменной не требуется, так как если работник имеет начальное образование, то z21 = z22 = 0. Более того, z23 вводить нельзя, так как для любого работника z21 + z22 + z23 = 1, и получался бы столбец в матрице Х из 1 (т.е., уже два таких столбца). И ХТХ была бы вырожденной, следовательно, невозможно получить оценки коэффициентов. Такая ситуация получила название «ловушки». Чтобы избежать её, число вводимых бинарных переменных должно быть на 1 меньше числа уровней качественного признака.

Название «фиктивной» переменной не совсем удачно, так как все процедуры регрессионного анализа (оценка параметров модели, проверка значимости коэффициентов и т.п.) проводятся при включении фиктивных переменных так же, как и количественных переменных. «Фиктивность» состоит только в том, что они количественным образом описывают качественный признак.

. Модели ANOVA и ANCOVA

Значит, кроме моделей, содержащих только количественные объясняющие переменные, в регрессионном анализе рассматривают также модели, содержащие лишь качественные переменные, либо те и другие одновременно. Регрессионные модели, содержащие лишь качественные объясняющие переменные, называются ANOVA - моделями (моделями дисперсионного анализа). Например, пусть Y - начальная з/п,

Зависимость можно описать моделью парной регрессии

, очевидно,

При этом коэффициент определяет среднюю начальную з/п при отсутствии в.о. Коэффициент указывает, на какую величину отличаются средние начальные з/п при наличии и при отсутствии в.о. Проверяя статистическую значимость коэффициента с помощью t - статистики, либо значимость коэффициента детерминации R2 с помощью F - статистики, можно определить, влияет или нет наличие высшего образования на начальную з/п. Модели, в которых объясняющие переменные носят как количественный, так и качественный характер, называют ANCOVA - моделями (моделями ковариационного анализа).

Рассмотрим простейшую ANCOVA - модель с одной количественной и одной качественной переменной, имеющей 2 уровня

где Y - з/п сотрудника фирмы, х - стаж, z - пол, т.е.

Ожидаемое значение з/п при х годах трудового стажа будет:

-для женщин,

- для мужчин.

З/п является линейной функцией стажа, причем для мужчин и женщин з/п меняется с одним и тем же коэффициентом . Отличаются только свободные члены. Проверив с помощью t - статистики значимость коэффициентов и , можно определить, имеет ли место в фирме дискриминация по половому признаку. При > 0 она будет в пользу мужчин, при < 0 - в пользу женщин. Пример. Исследуется эффективность лекарств у в зависимости от возраста пациента х. При этом сравнивается эффективность лекарств а и b.

лекарство	y	x	z	zx
a	54	69	0	0
b	30	48	1	48
a	58	73	0	0
b	66	64	1	64
b	67	60	1	60
a	64	62	0	0
a	67	70	0	0
a	33	52	0	0
a	33	63	0	0
b	42	48	1	48
b	33	46	1	46
a	28	55	0	0
b	30	40	1	40
b	23	41	1	41
a	21	55	0	0
b	43	45	1	45
a	38	58	0	0
b	43	58	1	58
a	43	64	0	0
b	45	55	1	55
b	48	57	1	57
a	48	63	0	0
a	53	60	0	0
b	58	62	1	62

Решение

Вводится фиктивная переменная z:

Возможен один из трех вариантов: , или

Какой из вариантов предпочтительнее?

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,690350892
R-квадрат	0,476584354
Нормированный R-квадрат	0,452792733
Стандартная ошибка	10,42269343
Наблюдения	24
Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	1	2176,084158	2176,084158	20,03160557	0,000188762
Остаток	22	2389,915842	108,6325383
Итого	23	4566
	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	-17,86138614	14,09491696	-1,267221807	0,218326504	-47,09245468	11,3696824
x	1,094059406	0,24444605	4,47566817	0,000188762	0,587109328	1,601009484
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,818778974
R-квадрат	0,670399008
Нормированный R-квадрат	0,639008438
Стандартная ошибка	8,465498967
Наблюдения	24
Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	2	3061,041872	1530,520936	21,35670027	8,68719E-06
Остаток	21	1504,958128	71,66467277
Итого	23	4566
	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	-53,19211823	15,23631493	-3,491140638	0,00217736	-84,87776958	-21,50646687
x	1,583743842	0,242565436	6,529140623	1,81395E-06	1,079301405	2,08818628
z	14,83743842	4,222311121	3,514056164	0,002062797	6,056661791	23,61821506
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,820613512
R-квадрат	0,673406536
Нормированный R-квадрат	0,624417516
Стандартная ошибка	8,634887835
Наблюдения	24
Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	3	3074,774242	1024,924747	13,74607086	4,28274E-05
Остаток	20	1491,225758	74,56128792
Итого	23	4566
	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	-61,67248908	25,13975551	-2,453185715	0,02345824	-114,1131	-9,231878171
x	1,720524017	0,403481811	4,264192264	0,00037931	0,87887571	2,562172325
z	27,60406803	30,05830936	0,918350653	0,369378456	-35,0964664	90,30460246
zx	-0,219208228	0,510788146	-0,429156843	0,672396526	-1,284693626	0,84627717

Вывод

Значения фиктивной переменной можно изменять на противоположные. Суть модели от этого не меняется. У коэффициента изменится знак. Значение качественной переменной, для которой принимается Z = 0, называют базовым или сравнительным. Выбор базового значения обычно диктуется целями исследования, но может быть и произвольным.

Коэффициент иногда называют дифференциальным коэффициентом свободного члена, так как он показывает, на какую величину отличается свободный член модели при значении фиктивной переменной, равной 1, от свободного члена модели при базовом значении фиктивной переменной.

Рассмотрим модель с двумя объясняющими переменными, одна из которых количественная, другая - качественная, имеющая 3 альтернативы. Например, расходы на содержание ребенка могут быть связаны с доходами и возрастом ребёнка: дошкольный, младший школьный и старший школьный. Модель будет иметь вид:

где Y - расходы, х - доходы,

Получим следующие зависимости:

Средний расход на дошкольника

;

Средний расход на младшего школьника:

;

Средний расход на старшего школьника:

;

Чтобы учесть сезонные колебания аналогично можно вводить фиктивные переменные, например,

3. Сравнение двух регрессий. Тест Чоу.

В рассматриваемых примерах предполагалось, что изменение значения качественного фактора влияет лишь на изменение свободного члена. В более сложных моделях может быть отражено влияние качественного фактора на сами параметры при переменных. Например, можно предположить, что до некоторого года в стране обменный курс валют был фиксированным, а затем плавающим. Или налог на ввозимые автомобили был одним, а затем он существенно изменился. Зависимость может быть выражена так:

где

Тогда ожидаемое значение Y определяется следующим образом:

и .

Фиктивная переменная z1 в уравнении используется как в аддитивном виде (z1), так и в мультипликативном (z1x), что позволяет фактически разбивать рассматриваемую зависимость на две части, связанные с периодом изменения качественного фактора. Имеет ли смысл разбивать выборку на части или в этом нет необходимости можно решить с помощью теста Чоу. Задача может быть и противоположной: можно ли объединить две выборки в одну и рассматривать единую модель (без качественного фактора).

Суть теста Чоу состоит в следующем. Пусть выборка имеет объем n, и есть основание предполагать, что целесообразно разбить её на две объёмами n1 и n2: n1 + n2 = n. Строят уравнение общей регрессии и уравнение регрессий по каждой подвыборке. Обозначим

, , .

Очевидно, что возможно лишь при совпадении коэффициентов регрессии для всех трех уравнений. Чем сильнее различие в поведении Y для двух подвыборок, тем больше S0 будет превосходить S1 + S2. Тогда S0 - (S1 + S2) может быть интерпретирована как улучшение качества модели при разбиении. Следовательно, дробь (S0 - (S1 + S2))/(p+1) определяет оценку уменьшения дисперсии регрессии. Проверку проводят с помощью критерия Фишера

(здесь n-2p-2 и р+1 - число степеней свободы необъясненной и объясненной дисперсий).

Если F > Fкр(, р+1, n-2p-2), то разбиение целесообразно. Это означает необходимость введения в уравнение регрессии соответствующей фиктивной переменной.

Если F < Fкр, то различие между S0 и S1 + S2 статистически незначимо и нет смысла разбивать уравнение регрессии на части.

Пример. Рассматривая зависимость между доходом Х и сбережениями Y за 20 лет, обнаружено изменение экономической ситуации на 12-м году наблюдений.

Построить общее уравнение регрессии для всего интервала наблюдений, а также уравнение регрессии, учитывающее изменение ситуации. Проверить с помощью теста Чоу необходимость разбиения интервала наблюдений на два подынтервала.

год	Y	X	Z
75	4,7	100	0
76	6,1	105	0
77	6,5	108	0
78	6,8	111	0
79	5,2	115	0
80	6,5	122	0
81	7,5	128	0
82	8	135	0
83	9	143	0
84	9,1	142	0
85	8,7	147	0
86	12	155	1
87	16,2	167	1
88	18,5	177	1
89	18	188	1
90	17,6	195	1
91	20	210	1
92	23	226	1
93	22,5	238	1
94	24,3	255	1

) строим уравнение для всего интервала.

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,975998
R-квадрат	0,952571
Нормированный R-квадрат	0,949936
Стандартная ошибка	1,500972
Наблюдения	20
Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	1	814,4655	814,4655	361,5159	2,3E-13
Остаток	18	40,55252	2,252918
Итого	19	855,018
	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	-9,56407	1,208504	-7,91397	2,86E-07	-12,103	-7,02509
X	0,1394	0,007332	19,01357	2,3E-13	0,123997	0,154804

) строим уравнение множественной регрессии с фиктивной переменной

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,989934
R-квадрат	0,979969
Нормированный R-квадрат	0,977612
Стандартная ошибка	1,00373
Наблюдения	20
Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	2	837,8909	418,9455	415,8374	3,67E-15
Остаток	17	17,12706	1,007474
Итого	19	855,018
	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	-5,43851	1,176906	-4,62103	0,000244	-7,92157	-2,95546
X	0,101714	0,009226	11,02452	3,64E-09	0,082248	0,121179
Z	4,093698	0,848963	4,821998	0,000159	2,302542	5,884853

) строим уравнение парной регрессии для данных до 86 года

ВЫВОД ИТОГОВ
Множественный R	0,91651
R-квадрат	0,83999
Нормированный R-квадрат	0,822211
Стандартная ошибка	0,62994
Наблюдения	11
Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	1	18,74858	18,74858	47,24651	7,28E-05
Остаток	9	3,571422	0,396825
Итого	10	22,32
	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	-3,00135	1,481807	-2,02546	0,073471	-6,35343	0,350733
X	0,081943	0,011921	6,87361	7,28E-05	0,054975	0,108911

) Парная регрессия для интервала с 86 по 94 годы

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,946876
R-квадрат	0,896574
Нормированный R-квадрат	0,881799
Стандартная ошибка	1,316233
Наблюдения	9
Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	1	105,1283	105,1283	60,68116	0,000108
Остаток	7	12,12729	1,73247
Итого	8	117,2556
	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	-2,5731	2,819436	-0,91263	0,391785	-9,24001	4,093808
Переменная X 1	0,107818	0,013841	7,789811	0,000108	0,075089	0,140546

). Применим тест Чоу.

0 = 855,018; S1 = 22,32; S2 = 117,256; n = 20; p = 1;

Так как F > Fkp, то разбиение целесообразно, т.е. целесообразно использование фиктивной переменной.

. Фиктивная зависимая переменная

Иногда фиктивные переменные могут быть использованы для объяснения поведения зависимой переменной. Например, если исследовать зависимость наличия автомобиля от дохода, пола и т.п., то зависимая переменная имеет два возможных значения: 0 - нет машины, 1 - есть.

Если для моделей такого типа использовать обыкновенный МНК, то оценки не будут обладать свойствами наилучших линейных несмещенных оценок. Для определения коэффициентов используют другие методы (например, взвешенный МНК).

Модель LPM.

Рассмотрим модель, в которой зависимая переменная - фиктивная переменная. Объясняющие переменные могут быть и качественными, и количественными. Например, анализ наличия работы у субъекта в зависимости от возраста, образования, семейного положения, доходов остальных членов семьи и т.д. Или, исследование торгового баланса (отрицательный или положительный). Пусть

авторегрессионый модель койка фиктивный

, (*)

где y - результат сдачи экзамена в ГАИ с 1-й попытки, x1- количество часов вождения в автошколе, x2 - средний процент выпускников, сдающих экзамен с 1-й попытки, D1- использование компьютерной методики обучения:

Получим модель

Модели такого вида называют линейными вероятностными моделями (LPM).

Применимость МНК к таким моделям имеет определенные ограничения:

. Случайные отклонения в таких моделях не являются нормальными случайными величинами. Скорее всего, они имеют биномиальное распределение (при оно сходится к нормальному закону).

. Случайные отклонения не обладают свойством постоянства дисперсии (гомоскедастичности).

. Использование модели (*) может привести к тому, что некоторые уi будут либо меньше нуля, либо больше 1.

. Применение модели LPM затруднено с содержательной точки зрения (увеличение x на 1 ед. приводит к изменению y на величину вне зависимости от конкретного значения x и т.п.).

Поэтому, непосредственное использование МНК в модели LPM приводит к серьезным погрешностям и необоснованным выводам, его использование не рекомендуется.

Пример. Исследуется вопрос о наличии собственного дома Y () в зависимости от совокупного дохода семьи Х по выборке объема 40.

семья	y	x
1	0	10	ВЫВОД ИТОГОВ
2	20
3	1	22	Регрессионная статистика
4	0	18	Множественный R	0,72763199
5	0	9	R-квадрат	0,52944831
6	0	15	Нормированный R-квадрат	0,51706537
7	1	25	Стандартная ошибка	0,35013012
8	1	30	Наблюдения	40
9	1	40
10	0	16	Дисперсионный анализ
11	0	12		df	SS	MS	F	Значимость F
12	0	8	Регрессия	1	5,241538247	5,241538247	42,75627105	1,04143E-07
13	1	20	Остаток	38	4,658461753	0,122591099
14	0	19	Итого	39	9,9
15	1	30
16	1	50		Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
17	1	37	Y-пересечение	-0,1694268	0,123166627	-1,37559031	0,17700343	-0,418764617	0,079911
18	1	28	x	0,03022802	0,00462285	6,538827957	1,04143E-07	0,020869548	0,0395865
19	1	45
20	1	38
21	1	30	Оценим LPM модель, её качество и вероятность того, что при доходе, равном 18, семья имеет доход.
22	0	12
23	0	16
24	1	27	P (Y=1 / X=18) =	0,3746775
25	0	19
26	0	15
27	1	32
28	0	18
29	1	43
30	0	13
31	1	22
32	0	14
33	0	10
34	0	17
35	1	36
36	1	45
37	0	14
38	1	2
39	1	41
40	1	34

Logit модель.

Для преодоления недостатков LPM-моделей необходимо использовать такие модели, в которых не будут, по крайней мере, нарушаться неравенства , и зависимость между и х не будет линейной, а будет удовлетворять закону убывающей эффективности.

Поясним суть logit модели. По модели LPM

(для одной переменной)

Представим

где .

Здесь можно заметить, что при , неравенство не нарушается никогда. Формула зависимости pi от xi не является линейной. Однако, pi не является линейной функцией от параметров и . Это значит, что для их определения неприменим МНК. Преодолеем эту проблему.

Отношение является отношением вероятностей, характеризующим во сколько раз больше, чем . Прологарифмировав, получим

. (**)

Модель (**) называют logit моделью, она напоминает полулогарифмическую модель. Однако, для её построения невозможно использовать обычный МНК, так как не неизвестными являются значения

Поэтому предварительно необходимо определить pi. Если имеется выборка по сгруппированным данным, то (относительная частота). В случае несгруппированных данных для определения pi используют метод максимального правдоподобия. И в этом случае использование обычного МНК нецелесообразно в силу проблемы гетероскедастичности. Поэтому при расчетах коэффициентов обычно применяют ВМНК, устраняющий этот недостаток.

Пример. В таблице представлены данные о количестве семей N, имеющих определенный уровень дохода Х, и количестве семей n, имеющих частные дома.

Оценить logit модель по МНК. Оценить logit модель по ВМНК, учитывая при этом, что дисперсии отклонений оцениваются по следующей формуле

; .

Сравните качество построенных регрессий.

Составим таблицу

Xi	N	n	pi	Zi	a'X'Z'
10	35	5	0,142857	-1,79176	0,233333	0,483046	2,070197	20,70197	-3,70929
15	45	10	0,222222	-1,25276	0,128571	0,358569	2,788867	41,833	-3,49379
20	60	18	0,3	-0,8473	0,079365	0,281718	3,549648	70,99296	-3,00761
25	80	30	0,375	-0,51083	0,053333	0,23094	4,330127	108,2532	-2,21194
30	100	45	0,45	-0,20067	0,040404	0,201008	4,974937	149,2481	-0,99832
35	130	60	0,461538	-0,15415	0,030952	0,175933	5,683986	198,9395	-0,87619
40	90	55	0,611111	0,451985	0,046753	0,216225	4,624812	184,9925	2,090346
45	65	45	0,692308	0,81093	0,072222	0,268742	3,721042	167,4469	3,017505
50	50	38	0,76	1,15268	0,109649	0,331133	3,019934	150,9967	3,481016
55	30	24	0,8	1,386294	0,208333	0,456435	2,19089	120,499	3,037219
60	15	13	0,866667	1,871802	0,576923	0,759555	1,316561	78,99367	2,464342

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,9956
R-квадрат	0,99122
Нормированный R-квадрат	0,990244
Стандартная ошибка	0,114177
Наблюдения	11
Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	1	13,24509	13,24509	1016,002	1,45E-10
Остаток	9	0,117328	0,013036
Итого	10	13,36241
	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	-2,34572	0,08362	-28,0521	4,52E-10	-2,53488	-2,15655
Xi	0,0694	0,002177	1,45E-10	0,064475	0,074326
ВЫВОД ИТОГОВ

Регрессионная статистика
Множественный R	0,985839
R-квадрат	0,971879
Нормированный R-квадрат	0,857643
Стандартная ошибка	0,507898
Наблюдения	11

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	2	80,23657	40,11829	155,5212	3,95E-07
Остаток	9	2,321642	0,25796
Итого	11	82,55822
	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	0	#Н/Д	#Н/Д	#Н/Д	#Н/Д	#Н/Д
a'	-2,28664	0,134015	-17,0626	3,67E-08	-2,5898	-1,98348
X'	0,067203	0,003817	17,6074	2,78E-08	0,058569	0,075837

. Общая характеристика ДЭМ

К динамическим эконометрическим моделям (ДЭМ) относят модели, которые в данный момент времени учитывают значения входящих в нее переменных, относящихся к текущему и к предыдущему моментам времени.

Например

ДЭМ, а не является ДЭМ.

Можно выделить два основных типа ДЭМ:

1. К моделям первого типа относятся модели авторегрессии и модели с распределенным лагом, в которых лаговые значения переменных (переменных, относящихся к предыдущим моментам времени) непосредственно включены в модель. Модели авторегрессии - это ДЭМ, в которых в качестве факторных переменных содержатся лаговые значения результативной переменной. Например

- марковский случайный процесс;

- авторегрессионная модель порядка р.

Модели с распределенным лагом - это ДЭМ, в которых содержатся не только текущие, но и лаговые значения факторных переменных. Например

. Модели второго типа учитывают динамическую информацию в неявном виде. Они включают переменные, характеризующие ожидаемый или желаемый уровень признака-результата или одного из факторов в момент времени t. Этот уровень считается неизвестным и определяется с учетом информации в предыдущий момент времени t-1. В зависимости от способа определения ожидаемых значений показателей различают модели: адаптивных ожиданий, частичной корректировки и рациональных ожиданий. Оценка параметров этих моделей сводится к оценке параметров моделей авторегрессии.

. Оценка моделей с лагами в независимых переменных. Преобразование Койка

Оценка моделей с распределенным лагом во многом зависит от того, конечное или бесконечное число лагов она содержит:

В обеих моделях коэффициенты называются краткосрочными мультипликатором, так как он характеризует изменение среднего значения Y под воздействием единичного изменения переменной X в тот же момент времени.

Сумму всех коэффициентов

называют долгосрочным мультипликатором, так как она характеризует изменение Y под воздействием единичного изменения переменной X в каждом из рассматриваемых временных периодов.

Любую сумму коэффициентов

называют промежуточным мультипликатором.

Модель с конечным числом лагов оценивается сведением ее к уравнению множественной регрессии.

Полагают , , ... , и получают уравнение

Для оценки моделей с бесконечным числом лагов разработано несколько методов.

Преобразование Койка

Метод Койка обычно применяют, если в моделях с распределенным лагом величина максимального лага p бесконечна. Предполагается, что коэффициенты при лаговых значениях объясняющей переменной убывают в геометрической прогрессии. Если имеется одна объясняющая переменная, то модель имеет вид

где , , . В модели всего три параметра: . Для их оценивания нельзя использовать обычный МНК, так как:

1) возникает проблема мультиколлинеарности;

2) из полученных оценок МНК не удается вывести (не однозначность).

Для оценки параметров можно использовать два метода: нелинейный МНК и преобразование Койка.

Суть нелинейного МНК. Параметру присваивают последовательно все значения из интервала (0,1) с шагом, например, 0,01; 0,001;... . Для каждого значения рассчитывается переменная с таким значением р, при котором дальнейшие лаговые значения х не оказывают существенного воздействия на z.

С помощью обычного МНК оценивается уравнение регрессии: . Из всех возможных значений выбирается то, при котором коэффициент детерминации будет наибольшим.

Суть метода Койка. Если выражение выполняется для периода t, то оно должно выполняться и для периода (t-1): и вычтем из предыдущего, получим:

или

Полученная модель относится к моделям авторегрессии. Эта форма позволяет анализировать краткосрочные и долгосрочные динамические свойства модели.

В краткосрочном аспекте (в текущем периоде) значение нужно рассматривать как фиксированное. Воздействие х на у характеризует коэффициент .

В долгосрочном периоде (без учета ) если стремится к некоторому равновесному значению , то и будут также стремиться к равновесному уровню , определяемому как: , из которого .

Таким образом, долгосрочное воздействие х на у отражается коэффициентом . Если , то этот коэффициент превысит , то есть долгосрочное воздействие оказывается сильнее краткосрочного.

Модель преобразования Койка привлекательна с практической точки зрения, так как оценивание парной регрессии с помощью МНК позволяет получить оценки . Метод Койка требует гораздо меньше усилий, чем нелинейный МНК. Однако его применение сопряжено с одной проблемой - нарушение одной из предпосылок МНК: объясняющая переменная частично зависит от и поэтому коррелирует с одной из случайных составляющих (). В итоге оценки МНК оказываются смещенными и несостоятельными.

. Авторегрессионые модели: модель адаптивных ожиданий и частичной корректировки. Метод инструментальных переменных

При построении моделей авторегрессии

возникает проблема: нарушается предпосылка линейной регрессионной модели об отсутствии связи между признаком и случайной составляющей. В модели авторегрессии признак связан с . Поэтому применение обычного МНК для оценки параметров уравнения регрессии приводит к получению смещенной оценки параметра при переменной . Для оценки параметров уравнения может быть использован метод инструментальных переменных. Суть его состоит в следующем.

Переменную из правой части уравнения, для которой нарушается предпосылка МНК, заменяют на новую переменную, удовлетворяющую следующим требованиям:

) она должна тесно коррелировать с ;

) она не должна коррелировать со случайной составляющей .

Затем оценивать регрессию с новой инструментальной переменной с помощью обычного МНК.

Рассмотрим один из методов получения инструментальной переменной. Так как зависит от , можно предположить, что зависит также от , то есть . Оценка может быть найдена с помощью обычного МНК. Новая переменная тесно коррелирует с и не коррелирует с , то есть может служить инструментальной переменной.

В результате модель авторегрессии примет вид

где .

Оценки параметров данной модели находят обычным МНК. Полученные оценки являются искомыми оценками модели авторегрессии.

Замечание: реализация метода инструментальных переменных осложняется появлением мультиколлинеарности факторов в модели: функциональная связь с приводит к высокой корреляционной связи между и . В некоторых случаях эту проблему можно решить включением в модель фактора времени t.

Модель адаптивных ожиданий

Модель адаптивных ожиданий учитывает желаемое (ожидаемое) значение факторного признака . Например, ожидаемое в будущем значение курса доллара влияет на наши инвестиции в текущем периоде .

В общем виде модель адаптивных ожиданий можно записать так:

Механизм формирования ожиданий в модели следующий

, или

То есть значение переменной, ожидаемой в следующий период , формирующееся как среднее арифметическое взвешенное ее реального и ожидаемого значений в текущем периоде. Чем больше величина , тем быстрее ожидаемое значение адаптируется предыдущим реальным значениям. Чем меньше , тем ожидаемое значение в будущем ближе к ожидаемому значению предыдущего периода . Использовать обычный МНК нельзя, так как модель содержит ожидаемое значение факторной переменной. Для оценки параметров модель преобразовывают.

Подставим в модель вместо :

Аналогично,

. Вычтем почленно.

или

где .

Полученная модель включает только фактические значения переменных, поэтому ее параметры можно определить обычным МНК, а затем перейти к исходной модели.

Модель частичной корректировки

Модель частичной корректировки учитывает желаемое (ожидаемое) значение результативного признака . В общем виде модель можно записать так

В таких моделях предполагается, что фактическое приращение зависимой переменной пропорционально разнице между ее желаемым уровнем и фактическим значением в предыдущий период :

, или

То есть получается как среднее арифметическое взвешенное желаемого уровня и фактического значения этой переменной в предыдущий период . Чем больше , тем быстрее происходит процесс корректировки. Если , то и полная корректировка происходит за 1 период.

Если , то корректировки не происходит совсем.

Аналогично получим:

Параметры преобразованного уравнения регрессии , , могут быть оценены с помощью обычного МНК.

. Полиномиально распределенные лаги Алмон

Лаги Алмон используют для описания модели с распределенным лагом:

имеющей полиномиальную структуру лага и конечную величину лага р. Суть метода Алмон состоит в следующем:

. Формализуют зависимость коэффициентов от величины лага . Модель зависимости представляет собой полином:

· 1й степени ;

· 2й степени

· 3й степени

· k-степени

2. Каждый коэффициент модели - можно выразить следующим образом:

и т.д.

Подставим эти соотношения для в модель и получим:

. Перегруппируем слагаемые:

Обозначим слагаемые в скобках при коэффициентах как новые переменные

............................................................................

Модель примет вид

. Определим параметры новой модели с помощью обычного МНК. Затем от параметров перейдем к параметрам , используя соотношения на 1-ом шаге.

Применение метода сопряжено с рядом проблем:

а) определение максимального лага с использованием показателей тесноты связи: , , ...;

б) определение степени полинома (обычно 2, 3). Степень должна быть на 1 меньше числа экстремумов в структуре лага;

в) мультиколлинеарность.

Литература

1. Айвазян С.А., Иванова С.С. Эконометрика. Краткий курс: учеб. пособие / С.А. Айвазян, С.С. Иванова. - М.: Маркет ДС, 2007. - 104 с.

. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2 т. 2-у изд., испр. - Т. 2: Айвазян С.А. Основы эконометрики. - М.: ЮНИТИ-ДАНА, 2009. - 432 с.

. Симчера В.М. Методы многомерного анализа статистических данных: учеб. пособие. - М.: Финансы и статистика, 2008. - 400 с.

. Чураков Е.П. Прогнозирование эконометрических временных рядов: учеб. пособие / Е.П. Чураков. - М.: Финансы и статистика, 2008. - 208 с.

. Эконометрика: учеб. / под ред. д-ра экон. наук, проф. В.С. Мхитаряна. - М.: Проспект, 2008. - 384 с.

. Эконометрика: учеб. / под ред. И.И. Елисеевой М.: Проспект, 2009. - 288 с.

. Эконометрика: Учебник/И.И. Елисеева, С.В. Курышева, Т.В. Костеева и др., Под ред. И.И. Елисеевой. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2006. - 576 с.

Фиктивные переменные. Динамические эконометрические модели

Фиктивные переменные. Динамические эконометрические модели

Преобразование Койка

Похожие работы на - Фиктивные переменные. Динамические эконометрические модели