Парная и множественная корреляция

  • Вид работы:
    Контрольная работа
  • Предмет:
    Менеджмент
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    88,91 kb
  • Опубликовано:
    2011-10-25
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Парная и множественная корреляция

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

Филиал в г. Уфе

Кафедра математики и информатики







КОНТРОЛЬНАЯ РАБОТА

по дисциплине «Эконометрика»

Исполнитель

Ишмухаметова Эльвира Айдаровна

специальность ФиК

группа 3дФК

№ зачетки 08ФФБ03207

Преподаватель:

Анферов Михаил Анисимович





Уфа 2011

Содержание

1. Практическая задача 1

.1 Условие и исходные данные

.2 Решение задачи

. Практическая задача 2

.1 Условие и исходные данные

.2 Решение задачи

1. Практическая задача 1

.1 Условие и исходные данные

Условие задачи: По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y, млн. руб.) от объема капиталовложений (Х, млн. руб.) (табл. 1.1).

Таблица 1.1 - Исходные данные: Х - объем капиталовложений (млн. руб.); Y - объем выпуска продукции (млн. руб.)

Обозначения

Числовые значения

1

2

3

4

5

6

7

8

Y

11,95745

5,736358

10,35786

9,577711

10,11871

9,630527

12,65125

X

12,49972

6,244372

10,91421

10,1779

10,48216

10,55336

13,00481


Требуется:

.        Для характеристики Y от X построить следующие модели:

-       линейную,

-       степенную,

-       показательную,

-       гиперболическую.

.        Оценить каждую модель, определив:

-       индекс корреляции,

-       среднюю относительную ошибку,

-       коэффициент детерминации,

-       F-критерий Фишера.

.        Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.

.        Рассчитать прогнозные значения результативного признака, если прогнозное значение фактора увеличится на 10% относительно среднего уровня.

.        Результаты расчетов отобразить на графике.

.2 Решение задачи

. Построим для характеристики Y от X следующие модели:

Линейная модель парной регрессии

Построение уравнения регрессии сводится к оценке ее параметров.

Уравнение регрессии имеет вид: .

Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК). Решая систему нормальных уравнений относительно а и b:

 получим следующие формулы:

.

Промежуточные расчеты проведем в Excel. В работе будем приводить таблицы на рабочих листах Excel. Значения параметров a и b определим, используя данные представленные в таблице 1.1.

Таблица 1.2 - Расчет параметров для линейной модели в Excel

t

y

x

y*x

x*x

 

 

 

 

 

 

 

1

11,95745

12,49972

149,46

156,243

1,95

3,81

1,95

3,79

3,80

11,95

0,00

2

5,736358

6,244372

35,82

38,99218

-4,27

18,22

-4,31

18,57

18,39

5,64

0,01

3

10,35786

10,91421

113,05

119,12

0,35

0,13

0,36

0,13

0,13

10,35

0,00

4

9,577711

10,1779

97,48

103,5896

-0,43

0,18

-0,38

0,14

0,16

9,61

0,00

5

10,11871

10,48216

106,07

109,8757

0,11

0,01

-0,07

0,01

-0,01

9,92

0,04

6

9,630527

10,55336

101,63

111,3734

-0,37

0,14

0,00

0,00

0,00

9,99

0,13

7

12,65125

13,00481

164,53

169,1251

2,65

7,01

2,45

6,01

6,49

12,46

0,03

Итого

70,02987

73,87653

768,041

808,319

0,00

29,50


28,64

28,96

 

0,21

Ср. знач.

10,00

10,55

109,72

115,47






 

 


Отсюда получаем:

b=;

а =.

Уравнение линейной регрессии имеет вид:

.

Степенная модель

Уравнение степенной модели имеет вид:


Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:

.

Обозначим

Тогда уравнение примет вид:  - линейное уравнение регрессии.

Таблица 1.3 - Расчет параметров для степенной модели в Excel

t

y

Y

x

X

Y*X

X2

 

 

 

 

1

11,95745

1,077639

12,49972

1,0969

1,182062058

1,20319

11,96

-0,01

0,0000

3,81

2

5,736358

0,758636

6,244372

0,795489

0,603486614

0,632802

5,71

0,03

0,0009

18,22

3

10,35786

1,01527

10,91421

1,037992

1,053842486

1,077428

10,35

0,01

0,0000

0,13

4

9,577711

0,981262

10,1779

1,007658

0,988776407

1,015375

9,61

-0,03

0,0009

0,18

5

10,11871

1,005125

10,48216

1,020451

1,025680747

1,04132

9,91

0,20

0,0415

0,01

6

9,630527

0,98365

10,55336

1,023391

1,006658369

1,047329

9,99

-0,36

0,1269

0,14

7

12,65125

1,102133

13,00481

1,114104

1,227891284

1,241228

12,48

0,17

0,0296

7,01

Итого

70,02987

6,923715

73,87653

7,095985

7,088397965

7,258672

 

0,02

0,2000

29,50

срзнач

10,00

0,99

10,55

1,01

1,01

1,0370

 

 

 

 


Рассчитаем его параметры, используя данные, приведенные в таблице 1.3:


Уравнение линейной регрессии имеет вид:

Перейдем к исходным переменным х и y, выполнив потенцирование данного уравнения, получим уравнение степенной модели регрессии:

=0,81*

Показательная модель

Уравнение показательной кривой:

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:

.

Обозначим

Получим линейное уравнение регрессии: .

Таблица 1.4 - Расчет параметров для показательной модели в Excel

t

y

Y

x

Y*x

x*x

 

 

 

 

1

11,95745

1,077639

12,49972

13,47018

156,243

12,24

-0,29

0,08

3,81

2

5,736358

0,758636

6,244372

4,737207

38,99218

5,89

0,02

18,22

3

10,35786

1,01527

10,91421

11,08087

119,12

10,17

0,19

0,03

0,13

4

9,577711

0,981262

10,1779

9,987184

103,5896

9,33

0,24

0,06

0,18

5

10,11871

1,005125

10,48216

10,53588

109,8757

9,67

0,45

0,20

0,01

6

9,630527

0,98365

10,55336

10,38081

111,3734

9,75

-0,12

0,01

0,14

7

12,65125

1,102133

13,00481

14,33304

169,1251

12,99

-0,34

0,11

7,01

Итого

70,02987

6,923715

73,87653

511,5001

808,319

 

-0,02

0,53

29,50

срзнач

10,00

0,99

10,55

10,65

115,47

 

 

 

 


Рассчитаем его параметры, используя данные, приведенные в таблице 1.4:


Уравнение линейной регрессии имеет вид:

Перейдем к исходным переменным х и y, выполнив потенцирование данного уравнения:

.

Гиперболическая функция

Уравнение гиперболической функции: .

Произведем линеаризацию модели путем замены

.

В результате получим линейное уравнение . Рассчитаем его параметры, используя данные, приведенные в таблице 1.5.

Таблица 1.5 Расчет параметров для гиперболической модели в Excel

t

y

x

X

y *X

X*X

 

 

 

 

1

11,95745

12,49972

0,080002

0,96

0,0064

11,96

-0,01

0,000

3,81

2

5,736358

6,244372

0,160144

0,92

0,0256

5,71

0,03

0,001

18,22

3

10,35786

10,91421

0,091624

0,95

0,0084

10,35

0,01

0,000

0,13

4

9,577711

10,1779

0,098252

0,94

0,0097

9,61

-0,03

0,001

0,18

5

10,11871

10,48216

0,0954

0,97

0,0091

9,91

0,20

0,042

0,01

6

9,630527

10,55336

0,094757

0,91

0,0090

9,99

-0,36

0,127

0,14

7

12,65125

13,00481

0,076895

0,97

0,0059

12,48

0,17

0,030

7,01

Итого

70,02987

73,87653

0,697073

6,62

0,0741


0,02

0,200

29,50

срзнач

10,00

10,55

0,10

0,95

0,0106







Получим следующее уравнение гиперболической модели:

2. Оценим каждую модель и составим сводную таблицу вычислений, определив: индекс корреляции по следующей модели:


Для линейной модели можно вычислить линейный коэффициент парной корреляции по следующей формуле:


Данные для вычислений возьмем из таблиц 1.2. - 1.5. соответственно.

Стандартная ошибка равна:

.

По условию задачи количество наблюдений , количество факторов .

Среднюю относительную ошибку рассчитаем по формуле:

.

Коэффициент детерминации равен :

Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера:

.

. Для выбора лучшей модели построим сводную таблицу результатов (табл. 1.6).

Таблица 1.6 - Сводная таблица результатов

Параметры Модель

Индекс корреляции (линейный коэффициент)

Стандартная ошибка

Средняя относительная ошибка

Коэффициент детерминации

F - критерий Фишера

Линейная

0,996

0,207

1,332%

0,9928

686,678

Степенная

0,997

0,200

1,147%

0,9932

732,467

Показательная

0,991

0,325

2,545%

0,9821

274,137

Гиперболическая

0,964

0,650

5,023%

0,9285

64,911


Выберем лучшую модель и дадим интерпретацию рассчитанных характеристик.

Степенная модель имеет меньшее значение стандартной ошибки, а также большее значение F - критерий Фишера и большее значение коэффициента детерминации R2. Ее можно взять в качестве лучшей модели для построения прогноза.

Значение средней относительной ошибки говорит о том, что в среднем расчетные значения  для степенной функции отличается от фактических на 1,15%.

Связь между показателем у и фактором х можно считать весьма тесной, т.к. индекс корреляции примерно равен 0,997.

Коэффициент детерминации равен 0,9932, следовательно, вариация результата Y (объема выпуска продукции) на 99,32% объясняется вариацией фактора X (объемом капиталовложений).

 для =0,05;

Т.к. , то уравнение регрессии с вероятностью 0,95 в целом статистически значимо.

. Рассчитаем прогнозные значения результативного признака, если прогнозное значение фактора увеличится на 10% относительно максимального уровня.

 следовательно,

 (млн. руб.).

Прогнозное значение результативного признака (объема выпуска продукции) определим по уравнению степенной функции, подставив в него планируемую величину объема капиталовложений:

(млн.руб.).

Для построения интервального прогноза рассчитаем доверительный интервал. Примем значение уровня значимости =0,05; следовательно, доверительная вероятность равна 95%, а критерий Стьюдента при равен 2,57.

Ширину доверительного интервала вычислим по формуле:

.

Интервальный прогноз найдем по следующей формуле:

.

Верхняя граница равна: 14,472 (млн. руб.)

Нижняя граница: 13,157 (млн. руб.).

Фактические, расчетные и прогнозные значения по лучшей модели отобразим на графике (рис. 1.5).

. Результаты расчетов отобразим на графике.

Рисунок 1.1. - Прогноз по лучшей (степенной) модели: х - объем капиталовложений, млн. руб.; y - объем выпуска продукции, млн. руб.

линейная регрессия корреляция прогнозный

2. Практическая задача 2

.1 Условие и исходные данные

Условие задачи: По десяти кредитным учреждениям получены данные, характеризующие зависимость объема прибыли (Y) от среднегодовой ставки по кредитам (X1), ставки по депозитам (Х2) и размера внутрибанковских расходов (Х3) (табл. 2.1).

Таблица 2.1 - Исходные данные: X1 - среднегодовой ставки по кредитам; Х2 -ставка по депозитам; Х3 - размер внутрибанковских расходов; Y - объема прибыли

Y

X1

X2

X3

39,9573

136,8263

82,66037

-48,04

-45,4157

-247,619

-173,312

106,7567

-10,6174

-80,474

-60,3473

38,55368

-35,4631

-208,994

-149,167

93,46888

-91,4663

-405,57

-273,035

167,3665

-91,4241

-358,422

-234,767

142,3765

-92,0873

-360,689

-233,722

138,7201

-40,6464

-202,06

-140,801

86,66781

-90,392

-369,868

-244,584

149,9707

45,47677

127,4481

72,91611

-39,653


Требуется:

. Осуществить выбор факторных признаков для построения двухфакторной регрессионной модели.

. Рассчитать параметры модели.

. Для характеристики модели определить:

-       линейный коэффициент множественной корреляции,

-       коэффициент детерминации,

-       средние коэффициенты эластичности,

-       бета - , дельта - коэффициенты.

Дать их интерпретацию.

. Осуществить анализ остатков (график и оценка с использованием d-критерия Дарбина-Уотсона).

. Осуществить оценку надежности уравнения регрессии.

. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.

. Построить точечный и интервальный прогнозы результирующего показателя.

. Отразить результаты расчетов на графике.

.2 Решение задачи

. Осуществим выбор факторных признаков для построения двухфакторной регрессионной модели:

Проведем корреляционный анализ, используя инструмент Корреляция (Анализ данных в Excel) (табл. 2.2).

Таблица 2.2 - Результат корреляционного анализа

 

Объем прибыли,Y

Среднегодовая ставка по кредитам,X1

Ставка по депозитам, X2

Размер внутрибанковских расходов, X3

Y

1

 

 

 

X1

0,992657

1

 

 

X2

0,988145

0,999443

1

 

X3

-0,9856

-0,99868

-0,99978

1


Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. объем прибыли имеет весьма тесную связь со среднегодовой ставки по кредитам (Х1).

Х2 и Х3 весьма тесно связаны между собой (), что свидетельствует о наличии мультиколлинеарности. Целесообразно включить фактор Х3, , а не Х2 , так как слабее межфакторная корреляция . Поэтому для построения двухфакторной регрессионной модели из трех переменных оставим в модели Х1 и Х3.

В итоге получаем двухфакторную модель с факторами Х1 (Среднегодовая ставка по кредитам) и Х3 (Размер внутрибанковских расходов).

. Рассчитаем параметры модели:

Оценка параметров регрессии осуществляется по методу наименьших квадратов по формуле:

.

Таблица 2.3 - Исходные данные двухфакторной модели

t

X0

X1

X2


Объем прибыли

 

Среднегодовая ставка по кредитам

Размер внутрибанковских расходов

1

39,9573

1

136,8263

-48,04

2

-45,4157

1

-247,619

106,7567

3

-10,6174

1

-80,474

38,55368

4

-35,4631

1

-208,994

93,46888

5

-91,4663

1

-405,57

167,3665

6

-91,4241

1

-358,422

142,3765

7

-92,0873

1

-360,689

138,7201

8

-40,6464

1

-202,06

86,66781

9

-90,392

1

-369,868

149,9707

10

45,47677

1

127,4481

-39,653

Среднее значение

-41,208


-196,942

83,619

средн.кв.отклонение фактора

52,85639511

0

199,7922608

76,81680715


Используя данные, приведенные в таблице 2.3, и применив инструмент Регрессия (Анализ данных в Excel) (табл. 2.4), получим следующие коэффициенты:

.

Таблица 2.4 - Параметры модели

 

Коэффициенты

Стандартная ошибка

t-статистика

Y-пересечение

-1,46328

2,25426

-0,64912

Переменная X 1

0,837544

0,089814

9,325316

Переменная X 2

1,497309

0,233597

6,409807


Уравнение регрессии зависимости объема прибыли от ставки по депозитам и среднегодовой ставки по кредитам можно записать в следующем виде:

.

Расчетные значения Y определяются путем подстановки в эту модель значений факторов, взятых для каждого наблюдения.

. Для характеристики модели определим следующие показатели и дадим их интерпретацию:

линейный коэффициент множественной корреляции вычисляется по формуле:

,

но мы воспользуемся инструментом Регрессия (Анализ данных в Excel) (табл. 2.5).

; что говорит о том, что связь между факторами прямая и весьма тесная.

Коэффициент детерминации равен  (табл. 2.5). Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 99,787 % изменений в объеме прибыли учтено в модели и обусловлено влиянием среднегодовой ставки по кредитам и размер внутрибанковских расходов.

Таблица 2.5 - Регрессионная статистика

Регрессионная статистика

Множественный R

0,998934

R-квадрат

0,99787

Нормированный R-квадрат

0,997261

Стандартная ошибка

2,766169

Наблюдения

10


Учитывая, что коэффициент регрессии невозможно использовать для непосредственной оценки влияния факторов на зависимую переменную из-за различия единиц измерения, используем средний коэффициент эластичности:

.

Для расчета коэффициентов используем данные из таблицы 2.3 и 2.4 соответственно.

.

Следовательно, наименьшее влияние на объем прибыли оказывает размер внутрибанкоских расходов. При неизменном размере внутрибанковских расходов объем прибыли с ростом размера среднегодовой ставки по кредитам на 1% увеличится в среднем на 4,003 %, тогда как с уменьшением размера внутрибанковских расходов на 1% объем прибыли в среднем по совокупности кредитных учреждений сократится на 3,038 % при неизменном размере среднегодовых ставок по кредитам.

Бета-коэффициент с математической точки зрения показывает, на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение при фиксированном на постоянном уровне значений остальных независимых переменных:

,

где  (табл. 2.3),

;

Это означает, что размер внутрибанковских расходов оказывает меньшее влияние на объем прибыли, т.к. при ее увеличении на 76,82 руб., объем прибыли уменьшится на 115,02 руб. (2,176*52,856), тогда как при росте среднегодовой ставки по кредитам на 199,79 руб., объем прибыли увеличится на 116,33 руб. (3,166*52,856).

Долю влияния фактора в суммарном влиянии всех факторов можно оценить по величине дельта - коэффициентов:

 (табл. 2.2, 2.5)

; .

Это означает, что среднегодовая ставка по кредитам в суммарном влиянии всех факторов имеет большее влияние на объем прибыли, чем размер внутрибанковских расходов.

4. График остатков приведен на рисунке 2.1.

Рисунок 2.1 - График остатков: t -наблюдение, e -остатки.

Проверку независимости проведем с помощью d-критерия Дарвина-Уотсона.

Воспользуемся инструментом Регрессия (Анализ данных в Excel) (табл. 2.6):

Таблица 2.6 - Вывод остатка

Наблюдение

Предсказанное Y

Остатки


1

41,20403499

-1,246735


1,554348146

2

-49,00729684

3,59159684

23,40945494

12,89956786

3

-11,13701388

0,51961388

9,437079304

0,269998585

4

-36,55313533

1,09003533

0,325380629

1,188177018

5

-90,54659771

-0,9197023

4,039045285

0,845852297

6

-88,47582896

-2,948271

4,115091181

8,692302119

7

-95,84930175

3,76200175

45,02776087

14,15265715

8

-40,92890918

0,28250918

12,10686852

0,079811438

9

-86,69149261

-3,7005074

15,86442099

13,69375493

10

45,90731127

-0,4305413

10,69267841

0,185365785

 

 

 

125,0177801

53,56183532



В качестве критических табличных уровней при N=10, двух объясняющих факторах при уровне значимости в 5% при k=2 возьмем табличные величины d1=0,70 и d2=1,64.

Значение  сравнивают с табличными значениями d1 и d2.

Т.к. dw >2, это свидетельствует о наличии отрицательной корреляции. dw= 4 - dw= 4 - 2,33= 1,67

При сравнении расчетного значения dw статистики с табличным:

- ряд остатков не коррелирован.

. Осуществим оценку надежности уравнения регрессии с помощью F-критерия Фишера:

.

Значение F-критерия Фишера можно найти с помощью инструмента Регрессия (Анализ данных в Excel):  (табл. 2.7).

Таблица 2.7 - Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

2

25090,62

12545,31

1639,548

4,46E-10

Остаток

7

53,56184

7,651691



Итого

9

25144,19

 

 

 


Табличное значение F-критерия можно найти с помощью функции FРАСПОБР: при доверительной вероятности 0,95 при  и   составляет 4,737.

Поскольку , уравнение регрессии следует признать адекватным.

. Оценим с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии:

 

где  - коэффициенты в матрице .

Воспользуемся инструментом Регрессия (Анализ данных в Excel (табл. 2.4):

.

Табличное значение t-критерия Стьюдента можно найти с помощью функции СТЬЮДРАСПОБР; при уровне значимости 5% и степенях свободы   составляет 2,365.

Т.к.  для двух коэффициентов, то коэффициенты  и  существенны (значимы).

. Построим точечный и интервальный прогнозы результирующего показателя.

Прогнозные значения Х1,11, Х2,11 можно определить с помощью методов экспертных оценок, с помощью средних абсолютных приростов или вычислить на основе экстраполяционных методов.

В качестве аппроксимирующей функции выберем полином второй степени (парабола), по которой построим прогноз на один шаг вперед.

Уравнение фактора - Среднегодовая ставка по кредитам:

 и прогнозное значение .

Уравнение для Размера внутрибанковских расходов выглядит следующим образом:

.

Подставляя в него вместо , получим прогнозное значение среднегодовой ставки по кредитам .

Отобразим результаты расчетов на графике (рис.2.2; рис. 2.3).

Для получения прогнозных оценок зависимостей переменной по модели


Подставим в нее найденные прогнозные значения факторов Х1 и Х2.

.

Доверительный интервал прогноза будет иметь следующие границы:

Верхняя граница прогноза: .

Нижняя граница прогноза: .

.

 - стандартная ошибка, найдена с помощью инструмента Регрессия (Анализ данных в Excel) (табл. 2.5).кр = 2,365 (найдено выше с помощью функции СТЬЮРАСПРОБР).

Тогда получаем.U(1)= 4,699240149

Результаты прогнозных оценок модели регрессии представим в таблице 2.8.

Таблица 2.8 - Таблица прогнозов (р=95%)

Упреждение

Прогноз

Нижняя граница

Верхняя граница

1

58,66008

53,96084237

63,35932267


.

Рисунок 2.2 - Прогноз показателя Среднегодовая ставка по кредитам:

t - количество кредитных учреждений, Х1 -Среднегодовая ставка по кредитам

Рисунок 2.3 - Прогноз показателя Размер внутрибанковских расходов: t - количество кредитных учреждений, Х3 - Размер внутрибанковских расходов

Похожие работы на - Парная и множественная корреляция

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!