Линейные регрессионные модели с гомоскедастичными и гетероскедастичными остатками

  • Вид работы:
    Курсовая работа (т)
  • Предмет:
    Менеджмент
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    149,2 Кб
  • Опубликовано:
    2012-04-25
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Линейные регрессионные модели с гомоскедастичными и гетероскедастичными остатками













КУРСОВАЯ РАБОТА

ТЕМА: Линейные регрессионные модели с гомоскедастичными и гетероскедастичными остатками

Содержание

Введение

Линейные регрессионные модели с гомоскедастичными и гетероскедастичными остатками

Практическая часть

Заключение

Список литературы

Введение


Эконометрика - одна из базовых дисциплин экономического образования во всем мире. Однако до недавнего времени она не была признана в СССР и России. Это было связано с тем, что из трех основных составляющих эконометрики - экономической теории, экономической статистики и математики - две первые были представлены в нашей стране неудовлетворительно. Но теперь ситуация изменилась коренным образом.

Существуют различные варианты определения эконометрики:

)        расширенные, при которых к эконометрике относят все, что связано с измерениями в экономике;

2)      узко инструментально ориентированные, при которых понимают определенный набор математико-статистических средств, позволяющих верифицировать модельные соотношения между анализируемыми экономическими показателями.

Эконометрика - это самостоятельная научная дисциплина, объединяющая совокупность теоретических результатов, приемов, методов и моделей, предназначенных для того, чтобы на базе экономической теории, экономической статистики и экономических измерений, математико-статистического инструментария придавать конкретное количественное выражение общим (качественным) закономерностям, обусловленным экономической теорией.

В эконометрике, как дисциплине на стыке экономики (включая менеджмент) и статистического анализа выделяют три вида научной и прикладной деятельности -

разработка и исследование эконометрических методов (методов прикладной статистики) с учетом специфики экономических данных; разработка и исследование эконометрических моделей в соответствии с конкретными потребностями экономической науки и практики; применение эконометрических методов и моделей для статистического анализа конкретных экономических данных.

Линейные регрессионные модели с гомоскедастичными и гетероскедастичными остатками


При оценке параметров уравнения регрессии применяется метод наименьших квадратов (МНК). При этом делаются определенные предпосылки относительно случайной составляющей . В модели


случайная составляющая  представляет собой ненаблюдаемую величину. После того как произведена оценка параметров модели, рассчитывая разности фактических и теоретических значений результативного признака , можно определить оценки случайной составляющей . Поскольку они не являются реальными случайными остатками, их можно считать некоторой выборочной реализацией неизвестного остатка заданного уравнения, т.е. .

При изменении спецификации модели, добавлении в нее новых наблюдений выборочные оценки остатков  могут меняться. Поэтому в задачу регрессионного анализа входит не только построение самой модели, но и исследование случайных отклонений , т.е. остаточных величин.

При использовании критериев Фишера и Стьюдента делаются предположения относительно поведения остатков  - остатки представляют собой независимые случайные величины и их среднее значение равно 0; они имеют одинаковую (постоянную) дисперсию и подчиняются нормальному распределению.

Статистические проверки параметров регрессии, показателей корреляции основаны на непроверяемых предпосылках распределения случайной составляющей . Они носят лишь предварительный характер. После построения уравнения регрессии проводится проверка наличия у оценок  (случайных остатков) тех свойств, которые предполагались. Связано это с тем, что оценки параметров регрессии должны отвечать определенным критериям. Они должны быть несмещенными, состоятельными и эффективными. Эти свойства оценок, полученных по МНК, имеют чрезвычайно важное практическое значение в использовании результатов регрессии и корреляции.

Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Если оценки обладают свойством несмещенности, то их можно сравнивать по разным исследованиям.

Оценки считаются эффективными, если они характеризуются наименьшей дисперсией. В практических исследованиях это означает возможность перехода от точечного оценивания к интервальному.

Состоятельность оценок характеризует увеличение их точности с увеличением объема выборки. Большой практический интерес представляют те результаты регрессии, для которых доверительный интервал ожидаемого значения параметра регрессии  имеет предел значений вероятности, равный единице. Иными словами, вероятность получения оценки на заданном расстоянии от истинного значения параметра близка к единице.

Указанные критерии оценок (несмещенность, состоятельность и эффективность) обязательно учитываются при разных способах оценивания. Метод наименьших квадратов строит оценки регрессии на основе минимизации суммы квадратов остатков. Поэтому очень важно исследовать поведение остаточных величин регрессии . Условия, необходимые для получения несмещенных, состоятельных и эффективных оценок, представляют собой предпосылки МНК, соблюдение которых желательно для получения достоверных результатов регрессии.

Исследования остатков  предполагают проверку наличия следующих пяти предпосылок МНК:

1)      случайный характер остатков;

2)      нулевая средняя величина остатков, не зависящая от ;

)        гомоскедастичность - дисперсия каждого отклонения , одинакова для всех значений ;

)        отсутствие автокорреляции остатков - значения остатков  распределены независимо друг от друга;

5)      остатки подчиняются нормальному распределению.

Если распределение случайных остатков  не соответствует некоторым предпосылкам МНК, то следует корректировать модель.

Прежде всего, проверяется случайный характер остатков  - первая предпосылка МНК. С этой целью стоится график зависимости остатков  от теоретических значений результативного признака (рис.2.1). Если на графике получена горизонтальная полоса, то остатки  представляют собой случайные величины и МНК оправдан, теоретические значения  хорошо аппроксимируют фактические значения .

Возможны следующие случаи, если  зависит от  то:

)        остатки  не случайны (рис.2.2а);

)        остатки  не имеют постоянной дисперсии (рис.2.2б);

)        остатки  носят систематический характер (рис.2.2в).

а                                             б                                            в

Рис.1. Зависимость случайных остатков  от теоретических значений .

В этих случаях необходимо либо применять другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки  не будут случайными величинами.

Вторая предпосылка МНК относительно нулевой средней величины остатков означает, что . Это выполнимо для линейных моделей и моделей, нелинейных относительно включаемых переменных.

Вместе с тем, несмещенность оценок коэффициентов регрессии, полученных МНК, зависит от независимости случайных остатков и величин , что также исследуется в рамках соблюдения второй предпосылки МНК. С этой целью наряду с изложенным графиком зависимости остатков  от теоретических значений результативного признака  строится график зависимости случайных остатков  от факторов, включенных в регрессию  (рис.2.3).

Рис.2. Зависимость величины остатков от величины фактора .

Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений . Если же график показывает наличие зависимости  и , то модель неадекватна. Причины неадекватности могут быть разные. Возможно, что нарушена третья предпосылка МНК и дисперсия остатков не постоянна для каждого значения фактора . Может быть неправильна спецификация модели и в нее необходимо ввести дополнительные члены от , например . Скопление точек в определенных участках значений фактора  говорит о наличии систематической погрешности модели.

Предпосылка о нормальном распределении остатков позволяет проводить проверку параметров регрессии и корреляции с помощью  - и -критериев. Вместе с тем, оценки регрессии, найденные с применением МНК, обладают хорошими свойствами даже при отсутствии нормального распределения остатков, т.е. при нарушении пятой предпосылки МНК.

Совершенно необходимым для получения по МНК состоятельных оценок параметров регрессии является соблюдение третьей и четвертой предпосылок.

В соответствии с третьей предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора  остатки  имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции (рис.2.4).

а                          б                                 в

Рис.3. Примеры гетероскедастичности.

На рис.2.4 изображено: а - дисперсия остатков растет по мере увеличения ; б - дисперсия остатков достигает максимальной величины при средних значениях переменной  и уменьшается при минимальных и максимальных значениях ; в - максимальная дисперсия остатков при малых значениях  и дисперсия остатков однородна по мере увеличения значений . Наличие гомоскедастичности или гетероскедастичности можно видеть и по рассмотренному выше графику зависимости остатков  от теоретических значений результативного признака .

Рис.4. Наиболее наглядные графики гомо - и гетероскедастичности

 

Для множественной регрессии данный вид графиков является наиболее приемлемым визуальным способом изучения гомо - и гетероскедастичности.

При построении регрессионных моделей чрезвычайно важно соблюдение четвертой предпосылки МНК - отсутствие автокорреляции остатков, т.е. значения остатков , распределены независимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Коэффициент корреляции между  и , где  - остатки текущих наблюдений,  - остатки предыдущих наблюдений (например, ), может быть определен как

,

т.е. по обычной формуле линейного коэффициента корреляции. Если этот коэффициент окажется существенно отличным от нуля, то остатки автокоррелированы и функция плотности вероятности  зависит от -й точки наблюдения и от распределения значений остатков в других точках наблюдения.

Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии. Особенно актуально соблюдение данной предпосылки МНК при построении регрессионных моделей по рядам динамики, где ввиду наличия тенденции последующие уровни динамического ряда, как правило, зависят от своих предыдущих уровней.

При несоблюдении основных предпосылок МНК приходится корректировать модель, изменяя ее спецификацию, добавлять (исключать) некоторые факторы, преобразовывать исходные данные для того, чтобы получить оценки коэффициентов регрессии, которые обладают свойством несмещенности, имеют меньшее значение дисперсии остатков и обеспечивают в связи с этим более эффективную статистическую проверку значимости параметров регрессии.

Практическая часть


Задание 1: построить интервальный ряд распределения, начертить графики: полигон, гистограмму, кумуляту; вычислить среднее арифметическое, среднее квадратическое отклонение, дисперсию, коэффициент асимметрии и эксцесса, по вычисленным данным сделать вывод о форме эмпирического ряда распределения. Дана дневная выработка 1 работника в т. р.:

42,8; 42,6; 44,05; 37,95; 49,09; 54,1; 44,5; 44,58; 45,49; 44,03; 44,44; 56,01; 55,51; 54,55; 65,49; 65,34; 60,03; 60,95; 54,54; 53,11; 43,05; 53,85; 53,95; 62,93; 66,51; 47,27; 47,26; 66,49; 56,04; 55,38; 65,14; 65,36; 57,95; 58,85; 39, 19; 39,84; 50,05; 43,05; 51,51; 61,85; 41,99; 51; 60,5; 50,49; 54,5; 46; 56,09; 63,49; 67,51;


Группы рабочих

Центр интервала, xi

xi*mi

 (xi-x) mi

 (xi-x) ^2mi

 (xi-x) ^3mi

 (xi-x) ^4mi

34,26-45,34

13

39,8

517,4

-162,707

2036,43

-25487,75

319002,61

45,34-52,73

10

49,035

490,35

-32,8092

107,64

-353,17

1158,73

52,73-60,12

14

56,425

789,95

57,52714

236,38

971,32

3991,23

60,12-67,51

12

63,815

765,78

137,989

1586,75

18246,13

209813,72

Итого

49


2563,48

0

3967, 20

-6623,48

533966,29


Дисперсия:


Среднее квадратическое отклонение:


Коэффициент асимметрии:


Коэффициент эксцесса:


Коэффициент вариации:


Задание 2: найти групповую дисперсию, межгрупповую дисперсию, исследовать показатели по совокупности рабочих, применяя правило сложения дисперсий.

№п/п

1 группа

2 группа


выработка 1 рабочего, х

число рабочих, m

выработка 1 рабочего, х

число рабочих, m

1

42,8

1

45,49

1

42,6

1

44,03

1

3

44,05

1

44,44

1

4

37,95

1

56,01

1

5

49,09

1

55,51

1

6

54,1

1

54,55

1

7

44,5

1

65,49

1

8

44,58

1

65,34

1

Итого

359,67

8

430,86

8


.        Групповая дисперсия:


2.      Общая средняя:


3.      Групповая дисперсия:


4.      Межгрупповая дисперсия:


5.      Средняя для межгрупповых:


6.      Общая дисперсия:


7.      Среднее квадратическое отклонение:


8.      Общее среднеквадратическое отклонение:


9.      Коэффициент вариации:

,

,

Задание 3: на основе приведенных данных определить:

1.      Абсолютный прирост

2.      Темпы роста и прироста (цепные и базисные) и абсолютное значение 1% прироста

.        Рассчитать средние характеристики ряда динамики (средний уровень ряда, средний абсолютный прирост, средний темп роста).

Результаты представить в виде таблицы.

Объем СМР, млн. р.

Абсол. прирост к предыд. году

Абсол. прирост к базисн. году

Темп роста в % к предыд. году

Темп роста в % к базисн. году

Темп прироста в % к предыд. году

Темп прироста в % к базисн. году

Абсол. значение 1% прироста

2001

4940

-

-

-

-

-

-

-

2002

4949

9

9

100,182

100,182

0,182

0,182

49,40

2003

4088

-861

-852

82,603

82,753

-17,397

-17,247

49,49

2004

3730

-358

-1210

91,243

75,506

-8,757

-24,494

40,88

2005

4360

630

-580

116,890

88,259

16,890

-11,741

37,30

2006

4435

75

-505

101,720

89,777

1,720

-10,223

43,60

2007

5070

635

130

114,318

102,632

14,318

2,632

2008

5110

40

170

100,789

103,441

0,789

3,441

50,70

Абсолютное значение 1% прир. = абс. прирост к предыд. году

темп прироста к предыд. году

1.      Средний уровень ряда:


2.      Средний абсолютный прирост:


3.      Средний темп роста:


гомоскедастичный остаток регрессия уравнение

Заключение


Эконометрический метод складывался в преодолении трудностей, искажающих результаты применения классических статистических методов, таких как ложная корреляция, асимметричность связей, мультиколлинеарность связей, автокорреляции, ложной корреляции, наличия лагов и, наконец, эффект гетероскедастичности.

Как сказано выше, основное - это "очистка" временного ряда от случайных отклонений, т.е. оценивание математического ожидания. В отличие от простейших моделей регрессионного анализа, здесь естественным образом появляются более сложные модели. Например, дисперсия может зависеть от времени. Такие модели называют гетероскедастичными, а те, в которых нет зависимости от времени - гомоскедастичными. (Точнее говоря, эти термины могут относиться не только к переменной "время", но и к другим переменным.)

Гомоскедастичность - это означает, что для каждого значения фактора  остатки  имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции.

Список литературы


1.      Бородич С.А. Вводный курс эконометрики: Учебное пособие. - Мн.: БГУ, 2000. - 354 с.

2.      Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учебник. - 3-е изд., перераб. и доп. - М.: Дело, 2000. - 400 с.

.        Практикум по эконометрике: Учеб. пособие / И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред.И. И. Елисеевой. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2007. - 344 с.

.        Эконометрика: учеб. / под ред.И. И. Елисеевой. - М.: Проспект, 2009. - 288 с.

.        Эконометрика: Учебник/И.И. Елисеева, С.В. Курышева, Т.В. Костеева и др., Под ред.И. И. Елисеевой. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2005. - 576 с.

Похожие работы на - Линейные регрессионные модели с гомоскедастичными и гетероскедастичными остатками

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!