Предмет и метод эконометрики. Эконометрические взаимосвязи

  • Вид работы:
    Курсовая работа (т)
  • Предмет:
    Менеджмент
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    895,42 Кб
  • Опубликовано:
    2015-06-29
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Предмет и метод эконометрики. Эконометрические взаимосвязи















Контрольно-курсовая работа

Предмет и метод эконометрики. Эконометрические взаимосвязи

Содержание

1.      Эконометрика, предмет и метод

.1 Предмет и метод

.2Эконометрическая модель

.3 Измерения в экономике

.        Изучение взаимосвязей в эконометрике

.1 Понятие о взаимосвязях в эконометрике

.2 Метод сопоставления параллельных рядов. Корреляция альтернативных признаков

.3 Метод аналитических группировок

.4 Корреляционно-регрессионный анализ

.4.1 Парная регрессия. Парная корреляция

.4.1.1 Парная линейная регрессия

.4.1.2 Парная линейная корреляция

.4.1.3 Оценка надежности параметров парной линейной регрессии и корреляции

.4.1.4 Парная нелинейная регрессия

.4.1.5 Коэффициенты эластичности в парных моделях

.4.1.6 Парная нелинейная корреляция

.4.1.7 Оценка надежности параметров парной нелинейной регрессии и корреляции

.4.1.8 Прогнозирование на основе парной модели регрессии. Расчет доверительных интервалов для прогнозного значения , параметров уравнения регрессии и коэффициента (индекса) корреляции

.4.2 Множественная регрессия. Множественная корреляция

.4.2.1 Множественная регрессия

.4.2.2 Частные уравнения регрессии

.4.2.3 Множественная корреляция

.4.2.4 Частная корреляция

.4.2.5 Оценка надежности параметров множественной регрессии и корреляции

Литература

1. Эконометрика, предмет и метод

.1 Предмет и метод

Термин «эконометрика» впервые введен в Австро-Венгрии П. Цьемпой. Слово эконометрика это комбинация слов «эконом» и «метрика» т.е. экономика и измерение. Соответственно эконометрика это измерение в экономике.

На данный момент под эконометрикой понимают науку, которая занимается измерением и анализом экономических явлений.

В основу эконометрики положены три основных компонента:

. экономическая теория;

. статистические методы;

. математические методы.

Эконометрика это слияние всех этих трех компонентов, каждый из которых является ее неотъемлемой частью.

В основе метода эконометрики лежат методы статистики, такие как:

. регрессионный анализ;

. корреляционный анализ;

. выделение тренда динамического ряда;

. изучение сезонных и циклических колебаний динамического ряда;

. статистическое оценивание результатов и т.д.

Но так как, эконометрика является эмпирической наукой и решает конкретные экономические задачи, методы эконометрического анализа должны исключать проявление процессов искажающих результаты статистического анализа. К таким процессам относятся:

1.      асимметричность связей;

2.      мультиколлинеарность переменных;

.        гетероскедастичность;

.        автокорреляция;

.        ложная корреляция;

.        наличие лагов и т.д.

1.2 Эконометрическая модель

Эконометрические модели являются главным инструментом в эконометрике. Невозможно, например, абсолютно точно подсчитать спрос на автомобили в следующем году. Но можно, зная основные факторы, влияющие на спрос, построить модель спроса.

Эконометрическая модель - теоретическая модель экономических процессов, которая является средством прогнозирования эмпирических экономических процессов.

В эконометрике используют три класса эконометрических моделей:

1.    Модели временных рядов.

2.      Регрессионные модели с одним уравнением.

.        Системы одновременных уравнений.

Моделью временных рядов называется эконометрическая модель, в которой результативных признак - функция переменной времени, или переменных относящихся к другим моментам времени. К моделям временных рядов относятся:

1.    Модель тренда - отражает зависимость результативного признака от трендовой компоненты:

 (1)

где:

 временной тренд, заданный функцией определенного вида, линейной или нелинейной.

 - случайная компонента.

2.    Модель сезонности - отражает зависимость результативного признака от сезонной компоненты

 (2)

где:

 сезонная компонента.

 - случайная компонента.

3.    Тренда и сезонности - отражает зависимость результативного признака и от трендовой и от сезонной компоненты. Может быть:

аддитивная (дополняющая) модель

, (3)

мультипликативная (множительная) модель

 (4)

4.    К моделям, отражающим зависимость результативного признака от переменных, относящихся к другим моментам времени относятся:

модель с распределенным лагом - модель, отражающая зависимость результативного признака от предыдущих значений факторных признаков.

модель авторегрессии - модель, отражающая зависимость результативного признака от предыдущих значений результативных признаков.

модели ожидания - модель, отражающая зависимость результативного признака от будущих значений факторных или результативных переменных.

Регрессионной моделью с одним уравнением называется модель, в которой результативный признак представляется в виде функции факторных переменных:

 (5)

где

 - результативный признак (зависимая переменная).

 - факторные признаки (независимые или объясняющие переменные).

Регрессионные модели с одним уравнением в зависимости от вида функции делятся на линейные и нелинейные.

Наиболее часто в экономике используют следующие модели с одним уравнением:

.        Функция цены, где цена товара  зависит от объема поставки  и цен конкурентов :

 (6)

.        Функция спроса, где величина спроса товара  зависит от его цены , от цен конкурентов , и доходов потребителей :

 (7)

.        Производственная функция, где зависимость объема производства товара  зависит от производственных факторов, например затрат капитала  и затрат труда :

 (8)

Системы одновременных уравнений - модели, которые описываются системами взаимосвязанных регрессионных уравнений.

Системы уравнений могут быть тождественными или поведенческими.

Тождественные системы уравнений состоят из уравнений, вид которых и значения параметров известны.

Поведенческие системы уравнений состоят из уравнений, вид которых и значение параметров требуется оценить, а также уравнения, которые в качестве независимых переменных могут включать, кроме факторных переменных, результативные признаки из других уравнений системы.

К системам одновременных уравнений относится, например, модель спроса и предложения из трех уравнений:

 (9)

где

 - предложение товара в момент времени .

 - спрос на товар в момент времени .

 - цена товара в момент времени .

 - цена товара в предыдущий момент времени .

 - доход потребителя в момент времени .

Системы одновременных уравнений могут включать в себя большое количество уравнений, например, модель Уортона американской экономики, содержит более одной тысячи уравнений, которые решаются одновременно.

1.3 Измерения в экономике

В настоящее время термин «измерение» употребляется в трех значениях:

. Измерение - это получение, сравнение и упорядочение информации. Предполагает сравнение объектов исследования по наличию или отсутствию исследуемого свойства. Данному понятию соответствуют термины «классификация», «нумерация».

. Измерение - это операция, в результате которой получается численное значение величины измеряемого признака. Данному понятию соответствуют термины «шкалирование», «топология», «упорядочение».

. Измерение - измерение с обязательным наличием единицы измерения, т.е. сравнение изучаемых объектов с эталоном. Данному понятию соответствуют термины «измерение», «квантификация».

Измерение, по любому из определений, предполагает наличие шкалы измерения. Различают следующие типы шкал:

номинальная;

порядковая (ранговая, ординальная);

интервальная;

шкала отношений.

Тип шкалы определяется допустимым преобразованием, при котором истинные утверждения не становятся ложными, а ложные утверждения не становятся истинными.

Номинальная шкала

Номинальная шкала - шкала, в которой измерением называется классификация, при которой каждое значение определяет отдельную категорию, т.е. каждая категория «отличается» от других, но это отличие не может быть количественно измерено. Например, нумерация игроков в футбольной команде.

Номинальной шкале присущи только свойства «симметричности» и «транзитивности».

Симметричность - если  то и .

Транзитивность - если  и  то и .

Порядковая (ординальная, ранговая) шкала

Порядковая шкала ранжирует объекты по уровню свойства, т.е. «больше» или «меньше», но не позволяет сказать «на сколько больше» или «на сколько меньше».

Ординальная шкала допускает следующие операции: «равенство-неравенство» и «больше-меньше».

Для порядковой шкалы возможно любое монотонное преобразование.

Среди порядковых шкал большое распространение получили бальные шкалы.

Примерами ординальной шкалы может служить рейтинг популярных песен, успеваемость учеников в школе, оценка силы волн, и т.д.

Интервальная шкала (шкала разностей)

Интервальная шкала - шкала, которая позволяет не только упорядочить объекты по уровню свойства, но и сравнивать между собой разности количеств свойства.

Шкала разностей - интервальная шкала, масштаб в которой зафиксирован. По шкале разностей мы можем сказать, например, что температура воды 100С больше, чем 30С, но и определить разницу в 70С, между двумя значениями.

Шкала разностей допускает следующие операции: «равенство-неравенство» и «больше-меньше», «равенство-неравенство интервалов» и операцию вычитания.

Шкала отношений (пропорциональная шкала)

Шкала отношений - шкала, на которой указан абсолютный ноль. По шкале отношений можно определить во сколько раз величина одного объекта больше другого. Например, используя шкалу температур Кельвина, можно сказать, что 400К по сравнения с 200К не только больше на 200, но и в два раза «горячее».

Шкала отношений допускает следующие операции: «равенство-неравенство интервалов», «больше-меньше» и операции вычитания и деления.

Особенность экономических измерений

Естественно, что измерения в экономике отличаются от измерений в физике или механике. Экономика это так называемая «неточная» наука, так как ей свойственны большие погрешности, чем «точным» наукам.

Экономическим измерениям свойственна более низкая контролируемость их точности, т.к. в естественных науках точность измерения зависит, в основном, от самого измерения, а в экономических измерениях точность кроме самого измерения зависит от:

правильного определения экономической величины и экономического показателя;

формирования системы условий, определяющих точность экономического измерения;

выбора условий соизмеримости показателей;

разработки других специфических условий экономического измерения.

2. Изучение взаимосвязей в эконометрике

.1 Понятие о взаимосвязях. Методы выявления и измерения взаимосвязей

В природе, и тем более в обществе, все явления взаимосвязаны между собой. Урожайность зависит от качества почвы, внесения удобрений, обеспеченности производственными фондами и от многих других факторов; производительность труда от производственных затрат, обеспеченности основными и оборотными фондами и т.д.; среднедневная температура от времени года, местоположения страны удаленности от океана и т.д. Соответственно, что бы прогнозировать, то есть управлять развитием явлений, общественных и природных, необходимо установить связи, существующие между интересующими нас явлениями, их силу, вид, направление и т.д.

Так как, в статистике изучают детерминированность следствия факторами (детерминизм - обусловленность явлений множеством факторов) будем называть признак (явление) характеризующий следствие результативным признаком (зависимым признаком, результатом). Признаки, характеризующие факторы - факторными признаками (независимыми признаками). Результативные признаки принимают то или иное значение под влиянием на них признаков факторных. Соответственно размер результативного признака есть результат влияние на него факторных признаков.

В статистике различают два вида взаимосвязей между явлениями: функциональная и корреляционная.

Функциональная связь - это связь, жестко детерминированная или полная (связь равная единице или 100%), размер результативного признака зависит только от одного фактора, причем каждому конкретному значению факторного признака может соответствовать одно, или несколько четко заданных значений результативного признака.

Строго определить функциональную связь можно, только придав ей математическую формулировку. Функциональной связью является, например, связь вида:

а) , при ,

б) , при , , или

Видно, что величина признака зависит, лишь от признака , причем строго определенным образом.

Но, в мире природы и тем более в обществе функциональных связей не бывает - все явления реального мира взаимосвязаны между собой. И поэтому функциональная связь - это связь абстрактная, упрощающая расчеты, но и упрощающая объективно существующую реальность. Тем не менее, представление о связях как связях функциональных используют такие науки как химия, физика, механика, электротехника и т.д.

Обратная величина функциональной связи - это отсутствие связи (связь между явлениями равна нулю), размер результативного признака совершенно не зависит от какого-то фактора. Отсутствие связи, как и связь функциональная не существует в реальном мире - это также абстрактное понятие, упрощающее расчеты и соответственно реальность.

Корреляционная связь - это связь схоластически детерминированная, неполная. При корреляционной связи каждому значению факторного признака (признаков) соответствует множество значений результативного признака. Корреляционная связь проявляется лишь при большом числе наблюдений, в среднем.

Также различают формы связи:

.        прямая связь - с возрастанием величины фактора наблюдается рост величины результата, а при уменьшении величины фактора уменьшение величины результативного признака.

.        обратная связь - с увеличением величины фактора величина результативного признака уменьшается, а с уменьшением увеличивается.

Кроме того, по математическому выражению, связи делятся на линейные и нелинейные.

При изучении взаимосвязей общественных явлений используют различные методы, такие как:

.        сопоставление параллельных рядов;

.        метод аналитических группировок;

.        корреляционно-регрессионный анализ;

.        и др.

Изучение взаимосвязей позволяет решить следующие задачи:

.        определить наличие связи;

.        определение формы связи;

.        измерение тесноты связи;

.        прогнозирование изменения результативного признака под влиянием изменения фактора (факторов).

2.2 Метод сопоставления параллельных рядов. Корреляция альтернативных признаков

Метод сопоставления параллельных рядов является наиболее простым методом исследования взаимосвязей между явлениями.

Данный метод заключается в сопоставлении ранжированного ряда факторного признака с ранжированным рядом результативного признака. Данное сопоставление позволяет определить наличие или отсутствие связи между явлениями, а также ее направление.

Также метод параллельных радов позволяет определить тесноту связи. Для этого рассчитывают коэффициент Фехнера и коэффициент корреляции рангов Спирмена.

Расчет коэффициента Фехнера.

Для расчета данного коэффициента необходимо рассчитать отклонения значений признаков  и  от их средних значений  и , при этом определяют знак отклонений  или . Если знаки отклонений у признаков  и  совпадают, то делается вывод о согласованности вариации, если не совпадают - вариация несогласованна. Формула расчета коэффициента Фехнера:

 (10)

где:

С - число совпавших знаков отклонений  и

Н - число не совпавших отклонений  и

Коэффициент Фехнера может принимать значения от  до . В статистике принято считать, что до 0,3 связь слабая, от 0,3 до 0,7 связь средняя, свыше 0,7 связь сильная. Знак плюс показывает, что связь прямая, знак минус - связь обратная.

Необходимо учитывать, что коэффициент Фехнера определяет направление связи, но дает лишь очень грубую оценку ее величины.

Коэффициент корреляции рангов Спирмена

Коэффициент корреляции рангов учитывает согласованность рангов единиц совокупности.

Ранг - номер, который занимает единица совокупности по признакам  и .

Формула расчета коэффициента корреляции рангов:

 (11)

где:  - число единиц совокупности,

 - квадрат разности рангов.

Коэффициент корреляции рангов может принимать значения в интервале .

Корреляция альтернативных признаков

В случае, когда имеются противоположные по значению варианты признака, говорят об альтернативном признаке (да, нет). Например, продукция может быть годной или не годной.

Для исследования взаимосвязей между двумя альтернативными признаками, то есть, вариация обоих атрибутивных признаков ограничена двумя группами, используют «тетрахорические показатели». Их расчет основан на использовании определенной расчетной таблицы (табл. 1).

Таблица 1.

II I

+

-

+

a

b

-

c

d


Она состоит из четырех ячеек обозначенных буквами a, b, c, d - частоты, расположенные в I, II, III, IV квадрантах. Знаки  и  в заголовках столбцов и строк характеризуют наличие или отсутствие альтернативного признака.

К «тетрахорическим показателям» относят:

коэффициент ассоциации Пирсона

коэффициент коллигации Юла

коэффициент контингенции Юла и Кендэла

коэффициент Шарлье и др.

Рассмотрим некоторые из них.

Коэффициент ассоциации Пирсона, данный коэффициент используют для измерения тесноты взаимосвязи надежности и годности. Рассчитывается по формуле:

 (12)

Коэффициент коллигации Юла рассчитывается как:

 (13)

Данный коэффициент показывает средний размер связи.

Рассмотренные коэффициенты могут принимать значения от  до .

Если при измерении связи между качественными показателями образуется более двух групп, для определения тесноты связи используют:

коэффициент взаимной сопряженности Пирсона

коэффициент взаимной сопряженности Чупрова

коэффициент взаимной сопряженности Крамера и. д.р.

Коэффициент взаимной сопряженности Пирсона рассчитывается:

 (14)

Коэффициент взаимной сопряженности Чупрова рассчитывается:

 (15)

где:

 - число групп по первому и второму признаку соответственно.

 - показатель взаимной сопряженности

Коэффициент взаимной сопряженности Чупрова целесообразно использовать, когда число групп по каждому признаку одинаково . Если  используют коэффициент Крамера.

Показатель взаимной сопряженности  рассчитывают, используя вспомогательную таблицу (табл. 2)

Данные подставляют в формулу:

 (16)

Таблица 2. Вспомогательная таблица для расчета показателя взаимной сопряженности

y x

I

II

III

Итого

I


II


III


Итого      





Коэффициент взаимной сопряженности Крамера рассчитывается:

 (17)

где:

 - минимальное, из значений  и

При  значения коэффициентов Чупрова и Крамера совпадают.

Пример 1. По совокупности, состоящей из 27 предприятий, имеются данные о фондовооруженности тыс.руб. и производительности труда тыс.руб. (табл. 3).

Таблица 3.





1

8,0

3

15

11,1

11

2

8,2

4

16

11,6

9

3

8,3

3

17

11,8

10

4

8,4

6

18

12,0

11

5

8,9

3

19

12,1

12

6

9,2

4

20

12,3

13

7

9,3

6

21

12,5

12

8

9,4

7

22

12,9

12

9

9,7

7

23

13,0

13

10

9,9

9

24

13,2

14

11

10,2

7

25

13,7

15

12

10,3

8

26

13,8

14

13

10,6

9

27

14,0

16

14

10,9

10





Необходимо определить направление и тесноту связи с помощью коэффициента Фехнера и коэффициента корреляции рангов Спирмена.

Решение.. Рассчитаем коэффициент Фехнера.

1. В таблице 4 рассчитаем отклонения значений признаков  и  от их средних значений -  и , определим знак отклонений  или  и подсчитаем число совпадений (С) и несовпадений (Н) знаков отклонений.

Таблица 4.

x

С или Н




1

8,0

3

-2,9

-6,2

С

8,2

4

-2,7

-5,2

С

3

8,3

3

-2,6

-6,2

С

4

8,4

6

-2,5

-3,2

С

5

8,9

3

-2,0

-6,2

С

6

9,2

4

-1,7

-5,2

С

7

9,3

6

-1,6

-3,2

С

8

9,4

7

-1,5

-2,2

С

9

9,7

7

-1,2

-2,2

С

10

9,9

9

-1,0

-0,2

С

11

10,2

7

-0,7

-2,2

С

12

10,3

8

-0,6

-1,2

С

13

10,6

9

-0,3

-0,2

С

14

10,9

10

0,0

0,8

С

15

11,1

11

0,2

1,8

С

16

11,6

9

0,7

-0,2

Н

17

11,8

10

0,9

0,8

С

18

12,0

11

1,1

1,8

С

19

12,1

12

1,2

2,8

С

20

12,3

13

1,4

3,8

С

21

12,5

12

1,6

2,8

С

22

12,9

12

2,0

2,8

С

23

13,0

13

2,1

3,8

С

24

13,2

14

2,3

4,8

С

25

13,7

15

2,8

5,8

С

26

13,8

14

2,9

4,8

С

27

14,0

16

3,1

6,8

С

Среднее

10,9

9,2





. Коэффициент Фехнера будет равен:


Коэффициент Фехнера показывает сильную положительную связь между признаками  и .. Рассчитаем коэффициент корреляции рангов Спирмена.

. Назначим ранги для показателя  (табл. 5). Для этого ранжируем показатель  по возрастанию и определим ранг, который признак  занимает в ранжированном ряде.

а) Значение признака  равное 3 занимает №1, №2 и №3, соответственно ранг данного значение будет .

б) Значение признака  равное 4 занимает №4 и №5, соответственно ранг данного значение будет .

в) Значение признака  равное 6 занимает №6 и №7, соответственно ранг данного значение будет .

г) Значение признака  равное 7 занимает №8, №9 и №10, соответственно ранг данного значение будет .

д) Значение признака  равное 8 занимает №11, соответственно ранг данного значение будет .

е) Значение признака  равное 9 занимает №12, №13 и №14, соответственно ранг данного значение будет .

ж) Значение признака  равное 10 занимает №15 и №16, соответственно ранг данного значение будет .

з) Значение признака  равное 11 занимает №17 и №18, соответственно ранг данного значение будет .

и) Значение признака  равное 12 занимает №19, №20 и №21, соответственно ранг данного значение будет .

к) Значение признака  равное 13 занимает №22 и №23, соответственно ранг данного значение будет .

л) Значение признака  равное 14 занимает №24 и №25, соответственно ранг данного значение будет .

м) Значение признака  равное 15 занимает №26, соответственно ранг данного значение будет .

н) Значение признака  равное 16 занимает №27, соответственно ранг данного значение будет .

Таблица 5

 по возрастаниюранг признака


1

3

2

3


3

3


4

4

5

4


А

1

2

6

6

7

6


8

7

9

7


10

7


11

8

12

9

13

9


14

9


15

10

16

10


17

11

18

11


19

12

20

12


21

12


22

13

23

13


24

14

25

14


26

15

27

16


2. Назначим ранги для показателя  ранжированием по порядку возрастания - 1; 2; 3; . . . 27 (табл. 6).

Далее в таблице 6 проставим ранги признаков  и , рассчитаем разности рангов , квадраты разности рангов  и сумму квадратов разностей рангов (табл. 5).

Таблица 6





1

8,0

3

1

2,0

1,0

1,00

2

8,2

4

2

4,5

2,5

6,25

3

8,3

3

3

2,0

-1,0

1,00

4

8,4

6

4

6,5

2,5

6,25

5

8,9

3

5

2,0

-3,0

9,00

6

9,2

4

6

4,5

-1,5

2,25

7

9,3

6

7

6,5

-0,5

0,25

8

9,4

7

8

9,0

1,0

1,00

9

9,7

7

9

9,0

0,0

0,00

10

9,9

9

10

13,0

3,0

9,00

11

10,2

7

11

9,0

-2,0

4,00

12

10,3

8

12

11,0

-1,0

1,00

13

10,6

9

13

13,0

0,0

0,00

14

10,9

10

14

15,5

2,25

15

11,1

11

15

17,5

2,5

6,25

16

11,6

9

16

13,0

-3,0

9,00

17

11,8

10

17

15,5

-1,5

2,25

18

12,0

11

18

17,5

-0,5

0,25

19

12,1

12

19

20,0

1,0

1,00

20

12,3

13

20

22,5

2,5

6,25

21

12,5

12

21

20,0

-1,0

1,00

22

12,9

12

22

20,0

-2,0

4,00

23

13,0

13

23

22,5

-0,5

0,25

24

13,2

14

24

24,5

0,5

0,25

25

13,7

15

25

26,0

1,0

1,00

26

13,8

14

26

24,5

-1,5

2,25

27

14,0

16

27

27,0

0,0

0,00

Итого






77,00


. Рассчитаем коэффициент корреляции рангов


Связь сильная.

Пример 2. Имеются данные о количестве торговых точек, сгруппированных по уровню средней прибыли и уровню квалификации продавцов в разных торговых точках (табл. 7).

Определить тесноту связи, через коэффициенты взаимной сопряженности.

Решение.

Рассчитаем показатель взаимной сопряженности непосредственно в таблице, используя формулу:

,

. Рассчитаем коэффициент Пирсона.


и из полученного значения  (значение находится в нижнем правом углу таблицы) вычтем единицу:

. Так как  рассчитаем коэффициент Чупрова:


Коэффициент Чупрова всегда меньше чем коэффициент Пирсона.

. Коэффициент взаимной сопряженности Крамера:


Так как  значения коэффициентов Чупрова и Крамера совпадают.

Таблица 7.

Средняя прибыль Квалификация

Низкая

Средняя

Высокая

Итого

Низкий   




Средний




Высокий




Итого      






Пример 3. Группа предприятий, исследованная по влиянию на прибыль новой маркетинговой схемы, разделена на две подгруппы по надою.

Таблица 8

Схема Прибыль

Переведены на новую схему

Не переведены

Прибыль увеличилась

230 (а)

84 (b)

Прибыль не увеличилась

99 (c)

210 (d)


Рассчитаем коэффициент ассоциации Пирсона:


Полученное значение показывает среднюю, прямую связь между исследуемыми признаками.

Рассчитаем коэффициент коллигации Юла:


Полученное значение показывает, что средняя связь между исследуемыми признаками прямая, средняя.

2.3 Метод аналитических группировок

Этот метод позволяет определить взаимосвязи между двумя и более признаками.

В ходе построения аналитической группировки необходимо решить следующие вопросы:

1.    выбор факторных признаков

2.      определение числа групп

.        оценка линии регрессии

.        измерения тесноты связи

Выбор факторных признаков

Выбор основывается на всестороннем анализе изучаемого явления, экономической теории, опыте и знаниях исследователя и т.д.

Определение числа групп

В принципе, чем больше число групп, тем точнее будет описана линия регрессии, но в месте с тем снижается точность расчета средних.

В данном вопросе необходимо, что бы увеличение числа групп, для более точного описания линия регрессии, не привело к утрате закономерного характера линии регрессии, из-за малочисленности групп.

Границы интервалов групп определяют, выделяя основные типы изучаемых явлений. При расчете величин интервалов возможно использование следующей формулы предложенной американским ученым Стерджессом.

 (18)

где:

 - максимальное значение признака в совокупности

 - минимальное значение признака в совокупности- число единиц в совокупности.

При разбиении изучаемой совокупности рекомендуется соблюдение принципа равных частот, т.е. образование групп с примерно одинаковой численностью единиц.

Оценка линии регрессии

Оценка линии регрессии в данном случае основывается на вычислении среднего значения признака  для интервала значений признака .

В качестве группировочного признака, как правило, используется факторный признак.

Показатель, характеризующий влияние факторного признака на результативный признак называется показателем силы связи , который показывает, на сколько единиц изменится результативный признак, если факторный увеличится на одну единицу.

Если связь между признаками нелинейная, то есть, существенно изменяется при переходе от одной группе к другой, рассчитывается как:

 (19)

Так, например, если совокупность разбита на четыре группы, рассчитывают

); 2) ; 3)

где:

 - средне-групповые значения результативного признака.

- средние значения (или середины интервалов) факторного признака.

Для группировочного признака, среднюю величину находят как середину интервала.

В случае линейной связи важным показателем является поазатель средней силы связи .

 (20)

где:

 - средние значения результативного признака в последней и первой группах соответственно;

 - середины интервалов (или средние значения) факторного признака в последней и первой группах.

Измерение тесноты связи

Измерение тесноты связи в аналитических группировках основано на правиле сложения дисперсий - общая дисперсия всегда равна сумме средней внутригрупповой и межгрупповой дисперсий:

 (21)

где:

- общая дисперсия, характеризует вариацию признака во всей совокупности, сложившуюся под влиянием всех факторов и условий:

 или  (22)

где  - общая средняя.

 - средняя внутригрупповая дисперсия, оценивает вариацию признака, сложившуюся по влиянием других, неучтенных в данном исследовании факторов и независящую от фактора группировки. Она определяется как средняя из групповых дисперсий:

 или  (23)

 - внутригрупповая (случайная) дисперсия,

 или  (24)

где  - групповая средняя.

 - межгрупповая (систематическая) дисперсия, измеряет систематическую вариацию, обусловленную влиянием фактора, по которому произведена группировка:

эконометрика корреляция коэффициент модель

 (25)

Показателем тесноты связи между признаками в аналитической группировке служит корреляционное отношение:

 (26)

Корреляционное отношение может принимать значения от 0 до 1. Принято считать, что до 0,3 связь слабая, от 0,3 до 0,7 связь средняя, свыше 0,7 связь сильная. Чем больше корреляционное отношение, тем больше фактор, положенный в основание группировки, оказывает влияние на общую вариацию результативного признака, то есть они более тесно взаимосвязаны.

Квадрат корреляционного отношения - коэффициент детерминации:

 (27)

Показывает долю вариации результативного признака обусловленную включенным в модель фактором.

Пример 4. В таблице 9 приведены значения факторного признака  - затраты на рекламу млн.руб. и результативного признака  - прибыль млн. руб. и число предприятий в каждой группе .

Таблица 9.

Затраты на рекламу в месяц млн.руб. Число предприятий, Средняя прибыль за месяц млн. руб.



0,08-0,12

10

23,56

0,12-0,16

15

25,20

0,16-0,20

8

29,80

0,20-0,24

5

36,50


Необходимо рассчитать показатели силы связи.

Решение.

Рассчитаем среднее значение фактора  как середину интервала, и изменение средней прибыли при переходе от одной группы к другой . Результаты занесем в таблицу 10.

Таблица 10

Затраты на рекламу в месяц млн.руб. Число предприятий, Средняя прибыль за месяц млн.руб. Середина интервала млн.руб. Изменение средней прибыли млн.руб.





0,08-0,12

10

23,56

0,10

-

0,12-0,16

15

25,20

0,14

1,64

0,16-0,20

8

29,80

0,18

4,60

0,20-0,24

5

36,50

0,22

6,70

Изменение средней прибыли имеет существенные отличия при переходе от одной группы к другой, соответственно связь меду признаками нелинейная. Необходимо рассчитывать несколько показателей силы связи характеризующих взаимосвязи при переходе от одной группы к другой.

1);

Это значит, что при увеличении затрат на рекламу от 0,08 до 0,16 млн. руб. средняя прибыль будет увеличиваться в среднем на 41 руб. на каждый дополнительно потраченный на рекламу рубль.

) ;

Это значит, что при увеличении затрат на рекламу от 0,16 до 0,20 млн. руб. средняя прибыль будет увеличиваться в среднем на 115 руб. на каждый дополнительно потраченный на рекламу рубль.

) .

Это значит, что при увеличении затрат на рекламу от 0,20 до 0,24 млн. руб. средняя прибыль будет увеличиваться в среднем на 167,5 руб. на каждый дополнительно потраченный на рекламу рубль.

Различия между показателями силы связи обусловлены тем, что сила влияния затрат на прибыль не постоянна, она возрастает при переходе от одной группы к другой.

Пример 5. По данным табл. 10 необходимо рассчитать показатели силы связи.

Таблица 11

Затраты на рекламу в месяц  млн.руб.Число предприятий, Средняя прибыль за месяц  млн.руб.Середина интервала  млн.руб.Изменение средней прибыли  млн.руб.





0,08-0,12

10

23,56

0,10

-

0,12-0,16

15

25,20

0,14

1,64

0,16-0,20

8

26,86

0,18

1,66

0,20-0,24

5

28,51

0,22

1,65


Решение.

Изменения  отличаются не существенно, то есть связь между признаками линейная, рассчитаем показатель средней силы связи.

.

Это значит, что для всей совокупности, увеличение затрат на рекламу в среднем увеличит среднюю прибыль на 41,25 руб. на каждый дополнительно затраченный рубль.

Пример 6. Имеются данные о средней прибыли на отдельных торговых точках и профессиональном разряде продавцов (табл. 11)

Таблица 12

Разряд     Средняя прибыль тыс.руб. Число точек.

РазрядСредняя прибыль тыс.руб. Число точек.






 

I

60

5


I

65

3

I

68

7


I

68

4

II

67

4


II

74

5

II

75

3


II

67

4

II

71

5


II

72

3

I

70

5


II

69

4

1. Рассчитаем общую дисперсию выборки (табл. 13):


Таблица 13

№              Средняя прибыль тыс.руб. Число точек.





 







1

60

5

-8,673077

75,222265

376,111323

2

68

7

0,453033

3,171229

3

67

4

-1,673077

2,799187

11,196747

4

75

3

6,326923

40,029955

120,089864

5

71

5

2,326923

5,414571

27,072853

6

70

5

1,326923

1,760725

8,803623

7

65

3

-3,673077

13,491495

40,474484

8

68

4

-0,673077

0,453033

1,812131

9

74

5

5,326923

28,376109

141,880543

10

67

4

-1,673077

2,799187

11,196747

11

72

3

3,326923

11,068417

33,205250

12

69

4

0,326923

0,106879

0,427515

Итого


52



775,44231

Среднее

68,673077




14,912352


. Рассчитаем дисперсию для каждой группы:

Таблица 14

№              Средняя прибыль тыс.руб. Число точек.





 







1

60

5

-6,375000

40,640625

203,203125

2

68

7

1,625000

2,640625

18,484375

3

70

5

3,625000

13,140625

65,703125

4

65

3

-1,375000

1,890625

5,671875

5

68

4

1,625000

2,640625

10,562500

Итого


24



303,625000

Среднее

66,375




12,651042


а) Группа с разрядом - I (табл. 14)


Таблица 15.

№              Средняя прибыль тыс.руб. Число точек.





 







1

67

4

-3,642567

13,268294

53,073177

2

75

3

4,357433

18,987222

56,961667

3

71

5

0,357433

0,1277583

0,6387917

4

74

5

3,357433

11,272356

56,361782

5

67

4

-3,642567

13,268294

53,073177

6

72

3

1,357433

1,8426243

5,527873

7

69

4

-1,642567

2,6980263

10,792105

Итого


28



236,42857

Среднее

70,642567




8,4438776


б) Группа с разрядом равным II (табл. 15)

.

. Рассчитаем среднюю внутригрупповую дисперсию:

.

4. Найдем межгрупповую дисперсию.


Проверим через правило сложения дисперсий


. Рассчитаем корреляционное отношение:

.

То есть, фактор, положенный в основу группировки (разряд) оказывает среднее влияние на результат (среднюю прибыль).

. Рассчитаем детерминационное отношение


То есть вариация результативного признака на % обусловлена влиянием фактора - разряд продавца.

2.4 Корреляционно-регрессионный анализ

Основные понятия

Корреляция - взаимосвязь между признаками, заключается в изменении средней величины результативного признака в зависимости от значения фактора (факторов).

Регрессия - функция, позволяющая по величине одного корреляционно связанного признака вычислять средние значения другого.

Корреляция, регрессия парная - корреляция, регрессия между двумя признаками: результативным  и факторным .

Корреляция, регрессия множественная - взаимосвязь между несколькими признаками (тремя и более), один из которых является результативным признаком , другие факторными признаками .

Корреляция линейная - корреляционная зависимость между признаками носящая линейный характер.

Корреляция нелинейная - корреляционная зависимость между признаками не носит линейный характер, а выражена соответствующей кривой - парабола, гипербола, экспонента, показательная функция и т.д.

Регрессия линейная - регрессионная функция, выраженная уравнение прямой.

Регрессия нелинейная - регрессионная функция выражена соответствующей нелинейной функцией - парабола, гипербола, экспонента, показательная функция и т.д.

Парная корреляционно-регрессионная модель строится для изучения взаимосвязи между результативным признаком и одним фактором . Применяется в случае доминирующего влияния на результат лишь одного фактора, остальные факторы оказывают на результат несущественное влияние. Модель парной регрессии имеет вид: .

Множественная корреляционно-регрессионная модель применяется, когда необходимо изучить влияние на результативный признак не одного, а нескольких факторных признаков. Множественная модель регрессии имеет вид:

2.4.1 Парная регрессия. Парная корреляция

Если предполагается, что величина результативного признака  сложилась, в основном, под влиянием лишь одного факторного признака , при исследовании взаимосвязей между ними используют парную модель функции регрессии.

 (28)

Для того чтобы, построить парную корреляционно-регрессионную модель необходимо решить следующие задачи:

1.    отбор фактора,

2.      спецификация модели (выбор вида функции регрессии).

Отбор фактора в модель парной регрессии

Фактор, который будет использован в парной модели, должен отвечать следующим требованиям: его влияние на результат должно быть таким, что влиянием всех остальных факторов можно пренебречь, но он не должен находиться в функциональной зависимости с результатом.

Число наблюдений фактора  должно превышать число параметров при переменной  в 6-7 раз. Так для модели вида  необходимо не менее 6-7 наблюдений, а для модели  потребуется не менее 12-14 наблюдений.

Спецификация модели парной регрессии

В парной регрессии используют линейные и нелинейные функции:

 - линейная функция

 - полином второй степени

 - полином третьей степени и т.д.

 - равносторонняя гипербола

 - степенная функция

 - показательная функция и т.д.

Выбор вида функции в модели парной регрессии может быть осуществлен следующими методами:

1. Графический метод. В его основу положено построение и исследование графика «корреляционное поле», на основании которого делается вывод о виде функции описывающей взаимосвязь между явлениями.

2. Аналитический метод. Опирается на изучение природы взаимосвязи между исследуемыми явлениями.

3. Экспериментальный метод. Вид функции подбирается экспериментально через анализ качества подбора функции, путем сравнения остаточной дисперсии рассчитанной для разных моделей.

2.4.1.1 Парная линейная регрессия

Парная линейная регрессия наиболее часто применяется в регрессионных моделях, в силу простоты расчета и интерпретирования результатов.

Расчет регрессионной модели данного вида заключается в нахождении уравнения вида:

 (29)

или  (30)

где;

- теоретическое значение результативного признака, рассчитанное по уравнению регрессии, показывающему взаимосвязь между и.

- фактическое значение результативного признака.

 - случайная величина (возмущение, шум)

 (31)

Показывает влияние не учтенных в модели факторов, а также случайных ошибок.

- параметры уравнения.

Решение уравнения регрессии заключается в расчете его параметров. Наибольшее распространение из методов расчета параметров уравнения получил метод наименьших квадратов (МНК). МНК позволяет получать такие значения , которые минимизируют сумму квадратов отклонений фактических значений  от теоретических .

 (32)

При расчете параметров уравнения при помощи МНК необходимо решить систему из двух нормальных уравнений.

 (33)

Также используют и готовые уравнения.

Для расчета параметра :

; так как получим:

 или  (34)

где:  (35)

 (36)

Для расчета параметра :

 (37)

Параметр  - это теоретическое значение результативного признака  при  и только в этом случае имеет экономический смысл, если параметр  экономического смысла не имеет. В геометрическом представлении означает координату точки пересечения линии регрессии  с осью ординат.

Параметр  называется коэффициентом регрессии. Коэффициент регрессии показывает, на сколько единиц, в среднем изменится результативный признак, если факторный признак увеличится на одну единицу. Например, если уравнение регрессии имеет вид:


где  прибыль млн. руб. в месяц, а  затраты на маркетинг тыс. руб. в месяц. Можно сказать, что при дополнительных затратах на маркетинг на 1 тыс. руб. прибыль в среднем возрастет на 0,02 млн. руб.

Геометрически это тангенс угла наклона прямой регрессии .

Пример 7. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли (табл. 21).

Построить линейное уравнение регрессии.

Таблица 21.


1

37,8

0,3

2

38,0

0,5

3

39,0

0,7

4

37,5

0,8

5

39,5

0,9

6

36,8

1,1

7

40,0

1,3

8

40,1

1,6

9

40,0

1,7

10

39,0

2,2

11

38,0

2,5

12

41,0

2,6

13

41,6

2,7

14

41,0

3,0

15

41,9

3,2


Решение. Для расчета параметров уравнения регрессии  используем МНК. МНК в данном случае дает систему уравнений:


. Рассчитаем, в таблице 22, все возможные значения и подставим в систему.

После подстановки данных получим систему:


) Решим систему методом исключения параметра . Для этого первое уравнение разделим на 15, а второе на 25,10.


Далее из второго уравнения вычтем первое


Рассчитаем коэффициент регрессии:

.

Подставим значение в первое уравнение системы и рассчитаем параметр .


Таблица 22





1

37,80

0,30

0,09

11,34

37,792344

2

38,00

0,50

0,25

19,00

38,028410

3

39,00

0,70

0,49

27,30

38,264476

4

37,50

0,80

0,64

30,00

38,382510

5

39,50

0,90

0,81

35,55

38,500543

6

36,80

1,10

1,21

40,48

38,736609

7

40,00

1,30

1,69

52,00

38,972676

8

40,10

1,60

2,56

39,326775

9

40,00

1,70

2,89

68,00

39,444808

10

39,00

2,20

4,84

85,80

40,034974

11

38,00

2,50

6,25

95,00

40,389074

12

41,00

2,60

6,76

106,60

40,507107

13

41,60

2,70

7,29

112,32

40,625140

14

41,00

3,00

9,00

123,00

40,979240

15

41,90

3,20

10,24

134,08

41,215306

Сумма

591,20

25,10

55,01

1004,63

591,199993

В среднем

39,413333

1,673333

3,667333

66,975333


1,5187130,9312833,32715838,874862






2,3064890,86728911,0699801511,254918







2. Рассчитаем параметры уравнения , используя готовые уравнения.


Небольшие расхождения в расчете параметров  разными методами объясняются ошибками округления.

Подставим полученные значения (возьмем значения полученные в Microsoft Excel, как наиболее точные. см. далее ) в уравнение регрессии .


Коэффициент парной линейной регрессии  показывает, что при увеличении фактора - «затраты на рекламу» на 1 единицу (1 млн. руб.), результат - «средняя прибыль» увеличится, в среднем на 1,180332 млн. руб.

Далее подставляя значения фактора  в уравнение регрессии, рассчитаем теоретические значения , занесем их в последний столбик таблицы 22.

) Рассмотрим решение данной задачи в Microsoft Excel.

Первое. В новой книге Microsoft Excel внесем исходные данные (рис 1).

Рисунок 1.

Далее нажимаем кнопку Сервис и в открывшейся панели нажимаем кнопку Анализ данных.

В панели Анализ данных нажимаем Регрессия:

В панели регрессия вводим входной интервал , выделяя столбик, содержащий данные результативного признака, и входной интервал , выделяя столбик, содержащий данные фактора. Ответ можно поместить на новом рабочем листе, в новой рабочей книге, или на листе, содержащем условия выбирая выходной интервал, для чего указываем графа-клетку начала размещения ответа (рис 2).

Рисунок 2.

Нажимаем ОК. Появится таблица, содержащая результаты регрессионного анализа (рис 3).

Рисунок 3.

Параметр  в данной таблице находится на пересечении столбика «Коэффициенты» и строки «Y-пересечение», параметр - на пересечении столбика «Коэффициенты» и строки «Переменная Х1».

2.4.1.2 Парная линейная корреляция

Простейшим методом определения наличия и формы взаимосвязи является построения корреляционной таблицы и графика «корреляционное поле».

Корреляционная таблица - таблица, в которой записываются частоты сочетаний результативного и факторного показателей. В настоящее время корреляционная таблица не используется для вычисления уравнения связи.

Пример 8. Имеются данные о себестоимости единицы продукции (руб.) и затратах на рекламу (млн. руб.) (табл. 23).

Таблица 23.

210210220200240200210220210220240200













305050407030407030606030














Составим корреляционную таблицу (табл. 24).

Таблица 24.

y x

200

210

220

240

Итого

30

2

2



4

240

1

1



2

50


1

1


2

60



1

1

2

70



1

1

2

Итого

3

4

3

2

12


По корреляционной таблице можно сделать следующие выводы. Если  и  распложены по возрастанию, то расположение частот около диагонали таблицы слева вниз направо говорит о прямой форме связи, если по диагонали вверх направо, то связь обратная. Если частоты находятся равномерно по всей таблицы - связь слабая.

Корреляционное поле (графический метод изучения взаимосвязей) - точечный график, характеризующий единицу наблюдения по двум признакам. Факторный признак откладывается по оси абсцисс, результативный признак по оси ординат.

По данным примера 8 построим корреляционное поле (рис. 4).

Рисунок 4

Анализ корреляционного поля показывает, что имеется прямая связь.

Если связь между признаками обратная, то корреляционное поле будет иметь примерно такой вид (рис. 5).

Рисунок 5

Если корреляционное поле имеет следующий вид (рис. 6) можно сделать вывод об отсутствии выраженной взаимосвязи.

Рисунок 6

Корреляционная таблица и корреляционное поле показывают лишь наличие, отсутствие и направление связи. Но они не дают представления о тесноте, интенсивности связи между признаками.

Тесноту связи в парной линейной модели определяют, рассчитывая линейный коэффициент парной корреляции  или просто коэффициент корреляции. Существуют формулы расчета:

 (38)

или  (39)

где: - коэффициент регрессии;

- среднее квадратическое значение факторного признака;

- среднее квадратическое значение результативного признака;

 (40)

где - сумма квадратов отклонений обусловленная влиянием фактора ;

- общая сумма квадратов отклонений признака .

Коэффициент корреляции также можно рассчитать через значение признаков в стандартизованном масштабе:

 (41)

где:  - значения признаков в стандартизованном масштабе.

 (42)

 (43)

Коэффициент корреляции может принимать значения от  до . В статистике говорят, что если значения коэффициента парной корреляции:

меньше 0,3 (-0,3)  связь положительная (отрицательная) слабая;

от 0,3 до 0,7 (от -0,3 до -0,7)  связь положительная (отрицательная) средняя;

свыше 0,7 (-0,7) связь положительная (отрицательная) сильная;

равен 1 (-1) связь функциональная положительная (отрицательная);

равен 0 - связь отсутствует.

Другой показатель тесноты связи - коэффициент парной детерминации. Он показывает часть вариации результативного признака, которая сложилась под влиянием включенного в парную модель фактора. Коэффициент парной детерминации  рассчитывают, возводя в квадрат коэффициент парной корреляции  или по формуле:

 (44)

Коэффициент парной детерминации позволяет определять тесноту связи не только в линейных, но и в нелинейных моделях.

Коэффициент парной детерминации может принимать значения от  до .

Пример 9. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли (табл. 25).

Таблица 25.


1

37,80

0,30

2

38,00

0,50

3

39,00

0,70

4

37,50

0,80

5

39,50

0,90

6

36,80

1,10

7

40,00

1,30

8

40,10

1,60

9

40,00

1,70

10

39,00

2,20

11

38,00

2,50

12

41,00

2,60

13

41,60

2,70

14

41,00

3,00

15

41,90

3,20

Сумма

591,20

25,10

В среднем

39,413333

1,673333

1,5187130,931283




Рассчитать коэффициент парной линейной корреляции  и коэффициент парной линейной регрессии .

Решение.

) Так, как из примера 7 известно, что уравнение регрессии  используем формулу:

Коэффициент парной корреляции  показывает, что между исследуемыми признаками существует тесная положительная связь.

Возведя коэффициент корреляции в квадрат, получим коэффициент детерминации.

Коэффициент детерминации показывает, что 52% от всей вариации результативного признака обусловлено влиянием включенного в модель фактора, а 48% вариации вызвано влиянием всех остальных, не исследуемых в данной модели факторами.

) Рассмотрим решение данной задачи в Microsoft Excel.

В новой книге Microsoft Excel внесем исходные данные (рис 7).

Далее нажимаем кнопку Сервис и в открывшийся панели нажимаем кнопку Анализ данных

В панели Анализ данных нажимаем корреляция:

В панели корреляция вводим входной интервал, выделяя все столбики, содержащий и данные результативного признака и данные фактора. Ответ можно поместить на новом рабочем листе, в новой рабочей книге, или на листе, содержащем условия выбирая выходной интервал, для чего указываем графа-клетку начала размещения ответа (рис. 7).

Рисунок 7.

Нажимаем ОК.

Появится таблица парных линейных коэффициентов корреляции (рис. 8).

Рисунок 8.

На пересечении столбца 1 и столбца 2 и будет искомый коэффициент парной линейной корреляции.

2.4.1.3 Оценка надежности уравнения парной линейной регрессии, его параметров и коэффициента парной линейной корреляции

Результаты корреляционно-регрессионного анализа необходимо проверить, проведя оценку существенности, как уравнения регрессии, так и его параметров и коэффициента корреляции.

Оценка существенности уравнения регрессии в целом проводится с помощью критерия Фишера - F-критерия.

При этом исходят из представления, что если между изучаемыми признаками  и  есть связь и уравнение парной линейной регрессии эту связь отражает, то вариация результативного признака , обусловленная влиянием факторного признака  (факторная вариация) должна быть в несколько раз больше, чем вариация результативного признака, вызванная всеми другими факторами (остаточная вариация).

Для этого вначале проводят исследование дисперсии.

Общую сумму квадратов отклонений раскладывают на две части - «факторную» и «остаточную».

 (45)

где: - общая сумма квадратов отклонений;

- факторная сумма квадратов отклонений;

- остаточная сумма квадратов отклонений.

Разделив каждую сумму квадратов отклонений на соответствующее число степеней свободы ( для общей суммы,  для факторной и  для остаточной) получим дисперсию на одну степень свободы - .

 (46)

 (47)

 (48)

Для расчета F-критерия сопоставим факторную и остаточную дисперсию;

 (49)

Также F-критерий можно рассчитать по формуле:

 (50)

Оценку существенности уравнения регрессии проводят, сравнивая полученное значение F-критерия () с табличным значением (), которое берут из таблиц критических значений F-отношений при определенном уровне значимости, как правило:  или , и числе свободы: ,  (таблицы Снедекора-Фишера - приложение 2).

Если  то уравнение регрессии значимо, если меньше незначимо.

Значимость параметров уравнения  и коэффициента корреляции  проверяют при помощи критерия Стьюдента - t-критерия.

Критерий Стьюдента для коэффициента регрессии  рассчитывается как;

 (51)

где; - коэффициент регрессии.

 - стандартная ошибка коэффициента регрессии, рассчитывается как:

 (52)

Учитывая, что

 (53)

Критерий Стьюдента для параметра  рассчитывается как;

 (54)

где: - свободный член уравнения регрессии.

 - стандартная ошибка параметра , рассчитывается как:

 (55)

или  (56)

Критерий Стьюдента для коэффициента корреляции  рассчитывается как;

 (57)

или  (58)

где:  - коэффициент парной линейной корреляции.

- стандартная ошибка коэффициента корреляции, рассчитывается как:

 (59)

Кроме того, для парной линейной регрессии верно, что:

 (60)

Полученные фактические значения критерия Стьюдента сравнивают с табличными значениями при определенном уровне значимости , или , и числе степеней свободы  (приложение 1), где - число единиц наблюдения, - число параметров уравнения регрессии. Если фактическое значение  больше табличного соответствующий коэффициент статистически значим.

Пример 10. По данным примера 7 и примера 9 провести оценку существенности полученного уравнения регрессии , его параметров ,  и коэффициента корреляции .

Решение.

. Оценка статистической значимости функции регрессии проводится при помощи критерия Фишера - F-критерия.

Рассчитаем для парной линейной регрессии . Расчет  проведем по формуле:

Далее фактическое значение  необходимо сравнить с табличным значением. Табличное значение берется из таблиц значения  Фишера при разных уровнях значимости  (приложение 2). При  и числе степеней свободы , , . Так как , можно сказать, что уравнение регрессии статистически значимо.

. Оценка статистической значимости параметров уравнения регрессии  и коэффициента парной линейной корреляции  проводится при помощи критерия Стьюдента - t-критерия.

Для расчета критерия Стьюдента составим таблицу 26.

Таблица 26






1

37,80

0,30

0,09

37,792344

0,000059

1,886044

2

38,00

0,50

0,25

38,028410

0,000807

1,376710

3

39,00

0,70

0,49

38,264476

0,540996

0,947377

4

37,50

0,80

0,64

38,382510

0,778824

0,762711

5

39,50

0,90

0,81

38,500543

0,998914

0,598044

6

36,80

1,10

1,21

38,736609

3,750454

0,328711

7

40,00

1,30

1,69

38,972676

1,055395

0,139378

8

40,10

1,60

2,56

39,326775

0,597877

0,005378

9

40,00

1,70

2,89

39,444808

0,308238

0,000711

10

2,20

4,84

40,034974

1,071171

0,277378

11

38,00

2,50

6,25

40,389074

5,707675

0,683378

12

41,00

2,60

6,76

40,507107

0,242944

0,858712

13

41,60

2,70

7,29

40,625140

0,950352

1,054045

14

41,00

3,00

9,00

40,979240

0,000431

1,760045

15

41,90

3,20

10,24

41,215306

0,468806

2,330712

Сумма

591,20

25,10

55,01

591,199992

16,472942

13,009333

В среднем


1,673333





Фактически критерий Стьюдента для коэффициента регрессии  рассчитывается как;

.


Значение стандартных ошибок , можно взять из результатов регрессионного анализа в Microsoft Excel - рисунок 3, столбец - стандартная ошибка.

Фактический критерий Стьюдента для свободного члена уравнение регрессии  рассчитывается как:

.

.

Фактически критерий Стьюдента для коэффициента корреляции  рассчитывается как;


Также верно, что

Полученные фактические критерии Стьюдента с табличным значением (приложение 1) при определенном уровне значимости и числе степеней свободы . Если фактические значения t-критерия превышают табличные можно принять, что соответствующее расчетное значение статистически значимо.

Для данного примера табличное значение, при  и составит . Все фактические значения t-критерия превышают табличные. Можно сделать вывод о статистической значимости параметров уравнения регрессии  и коэффициента парной линейной корреляции  для парной линейной регрессии выраженной уравнением .

) Расчет фактического критерия Фишера и критерия Стьюдента в Microsoft Excel.

Фактические значения критериев Фишера и Стьюдента представлены в итоговой таблице, содержащей результаты регрессионного анализа - пример 7, рис. 3.

Критерий Фишера расчетный обозначен в столбике F дисперсионного анализа, t-критерии для параметров уравнения  в столбике t-статистика.

2.4.1.4 Парная нелинейная регрессия

Естественно, что кроме линейных взаимосвязей между явлениями природы, и тем более общественного мира существуют связи нелинейные. Соответственно изучать нелинейные связи при помощи линейной регрессии было бы не верно, для этого необходимо использовать нелинейные регрессии.

Но использование нелинейных регрессий связанно следующим ограничением - так как, параметры уравнения регрессии находят при помощи МНК, решая систему нормальных уравнений, а этот метод позволяет оценивать параметры или линейных уравнений или уравнений приводимых к линейному виду, то выбор нелинейных регрессий ограничен - должна существовать возможность линеаризации данных функций.

Регрессии, приводимые к линейному виду, подразделяют на два класса:. нелинейные относительно включенного в модель фактора (независимой переменной), но линейны относительно результата (зависимой переменной).

К первому классу относятся такие функции как, например:

полиномы разных степеней;

 - полином второй степени

 - полином третьей степени и т.д.

равносторонняя гипербола: .. нелинейные относительно включенного в модель результата, но линейны относительно фактора.

Ко второму классу относятся такие функции как, например:

степенная функция: .

показательная: .

экспоненциальная: .

Рассмотрим линеаризацию наиболее часто применяемых функций.

Линеаризация полиномов разных степеней

Проводится следующим образом.

В параболе второй степени,

 (61)

заменяя переменные , получим двухфакторное линейное уравнение регрессии:

 (62)

В параболе третьей степени,

 (64)

заменяя переменные , получим трехфакторное линейное уравнение регрессии:

 (65)

Аналогичным образом поступим с полиномами более высоких порядков.

Из полиномов наибольшее распространение получила парабола второго порядка.

МНК для оценки параметров функция регрессии по линеаризованной параболе второго порядка дает следующую систему уравнений:

 (66)

Пример 11. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятиях сферы торговли. Рассчитать функцию регрессии параболы второго порядка

Таблица 27


1

37,8

0,3

2

38,0

0,5

3

39,0

0,7

4

37,5

0,8

5

39,5

0,9

6

36,8

1,1

7

40,0

1,3

8

40,1

1,6

9

40,0

1,7

10

39,0

2,2

11

38,0

2,5

12

41,0

2,6

13

41,6

2,7

14

41,0

3,0

15

41,9

3,2


Решение. МНК для расчета параметров параболы второго порядка дает систему уравнений:


В таблице 28 рассчитаем все возможные значения:

Таблица 28








1

37,80

0,30

0,09

0,027

0,0081

11,34

3,402

38,023560

2

38,00

0,50

0,25

0,125

0,0625

19,00

9,500

38,158005

3

39,00

0,70

0,49

0,343

0,2401

27,30

19,110

38,307508

4

37,50

0,80

0,64

0,512

0,4096

30,00

24,000

38,387907

5

39,50

0,90

0,81

0,729

0,6561

35,55

31,995

38,472071

6

36,80

1,10

1,21

1,331

1,4641

40,48

44,528

38,651694

7

40,00

1,30

1,69

2,197

2,8561

52,00

67,600

38,846375

8

40,10

1,60

2,56

4,096

6,5536

64,16

102,656

39,166634

9

40,00

1,70

2,89

4,913

8,3521

68,00

115,600

39,280917

10

39,00

2,20

4,84

10,648

23,4256

85,80

188,760

39,908803

11

38,00

2,50

6,25

15,625

39,0625

95,00

237,500

40,330713

12

41,00

2,60

6,76

17,576

45,6976

106,60

277,160

40,478879

13

41,60

2,70

7,29

19,683

53,1441

112,32

303,264

40,630810

14

41,00

3,00

9,00

27,000

81,0000

123,00

369,000

41,109192

15

41,90

3,20

10,24

32,768

104,8576

134,08

429,056

41,446938

Итого

591,20

25,10

55,01

137,573

367,7897

1004,63

2223,131

591,200005


Подставим эти значения в систему уравнений.


Разделим каждое из уравнений системы на число при , первое на 15, второе на 25,01 и третье на 55,01.


Далее вычтем из 5-го уравнения 4-е, и из 6-го уравнения 5-е. система примет вид:


Разделим каждое уравнение на число при , 7-е на 0,5183, а 8-е на 0,30924


Вычтем из 10-го уравнения 9-е


Значение параметра

Подставим значение параметра  в уравнение (9) и найдем значение параметра

Подставим значение параметров  в уравнение (1) и найдем значение параметра

Подставим параметры в уравнение

Подставляя в полученное уравнение  и  рассчитаем теоретические значения , занесем их в последний столбик таблицы.

Линеаризацию равносторонней гиперболы

 (67)

проводят, заменяя  на , в результате получим уравнение линейной регрессии:

 (68)

МНК для оценки параметров функция регрессии по линеаризованной равносторонней гиперболе дает следующую систему уравнений:

 (69)

Также можно использовать уравнения:

 (70)

 (71)

Пример 12. Имеются данные о средней прибыли (млн. руб.) и затратах на затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли. Рассчитать функцию регрессии равносторонней гиперболы

Таблица 29


1

37,8

0,3

2

38,0

0,5

3

39,0

0,7

4

37,5

0,8

5

39,5

0,9

6

36,8

1,1

7

40,0

1,3

8

40,1

1,6

9

40,0

10

39,0

2,2

11

38,0

2,5

12

41,0

2,6

13

41,6

2,7

14

41,0

3,0

15

41,9

3,2


МНК для оценки параметров функция регрессии по линеаризованной равносторонней гиперболе дает следующую систему уравнений:


В таблице 30 рассчитаем все возможные значения:

Таблица 30






1

37,80

0,30

3,333333

126,000000

11,111111

36,808395

2

38,00

0,50

2,000000

76,000000

4,000000

38,266516

3

39,00

0,70

1,428571

55,714286

2,040816

38,891425

4

37,50

0,80

1,250000

46,875000

1,562500

39,086709

5

39,50

0,90

1,111111

43,888889

1,234568

39,238597

6

36,80

1,10

0,909091

33,454545

0,826446

39,459524

7

40,00

1,30

0,769231

30,769231

0,591716

39,612474

8

40,10

1,60

0,625000

25,062500

0,390625

39,770204

9

40,00

1,70

0,588235

23,529412

0,346021

39,810409

10

39,00

2,20

0,454545

17,727273

0,206612

39,956611

11

38,00

2,50

0,400000

15,200000

0,160000

40,016262

12

41,00

2,60

0,384615

15,769231

0,147929

40,033086

13

41,60

2,70

0,370370

15,407407

0,137174

40,048664

14

41,00

3,00

0,333333

13,666667

0,111111

40,089168

15

41,90

3,20

0,312500

13,093750

0,097656

40,111951

Итого

591,20

25,10

14,269937

552,158190

22,964285

591,199995


Подставим полученные значения в систему уравнений


Разделим первое уравнение на 15, а второе на 14,269937


Вычтем из второго уравнения первое


Подставим значение параметра  в первое уравнение и рассчитаем параметр


Уравнение регрессии примет вид


Подставляя в полученное уравнение регрессии значение , рассчитаем .

Линеаризацию степенной функции

 (72)

проводят путем логарифмирования обеих частей уравнения, получая уравнение вида:

 (73)

Обозначив через , получим линейное уравнение регрессии:

 (74)

МНК для оценки параметров функция регрессии по линеаризованной степенной функции дает следующую систему уравнений:

 (75)

Также можно использовать уравнения:

 (76)

 (77)

Рассчитав параметры , и составив линейное уравнение регрессии необходимо провести его потенцирование, что бы вернуться к степенной функции.

 (78)

Пример 13. Имеются данные о средней прибыли (млн. руб.) и затратах на затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли. Рассчитать степенную функцию

Таблица 31.


1

37,8

0,3

2

38,0

0,5

3

39,0

0,7

4

37,5

0,8

5

39,5

0,9

6

36,8

1,1

7

40,0

1,3

8

40,1

1,6

9

40,0

1,7

10

39,0

2,2

11

38,0

2,5

12

41,0

2,6

13

41,6

2,7

14

41,0

3,0

15

41,9

3,2


Решение. Для расчета параметров данной функции проведем ее линеаризацию, прологарифмировав обе части уравнения

Обозначив через , получим линейное уравнение регрессии:


МНК для оценки параметров функция регрессии по линеаризованной степенной функции дает следующую систему уравнений:


В таблице 32 рассчитаем все возможные значения:

Таблица 32






1

37,80

0,30

1,577492

-0,522879

-0,824837

37,183851

2

38,00

0,50

1,579784

-0,301030

-0,475562

37,910774

3

39,00

0,70

1,591065

-0,154902

-0,246459

38,397333

4

37,50

0,80

1,574031

-0,096910

-0,152539

38,592153

5

39,50

0,90

1,596597

-0,045757

-0,073056

38,764817

6

36,80

1,10

1,565848

0,041393

0,064815

39,060772

7

40,00

1,30

1,602060

0,113943

0,182544

39,308870

8

40,10

1,60

1,603144

0,204120

0,327234

39,619441

9

40,00

1,70

1,602060

0,230449

0,369193

39,710581

10

39,00

2,20

1,591065

0,342423

0,544817

40,100534

11

38,00

2,50

1,579784

0,397940

0,628659

40,295293

12

41,00

2,60

1,612784

0,414973

0,669262

40,355237

13

41,60

2,70

1,619093

0,431364

0,698418

40,413002

14

41,00

3,00

1,612784

0,477121

0,769493

40,574705

15

41,90

3,20

1,622214

0,505150

0,819461

40,674075

Итого

591,20

25,10

23,929804

2,037398

3,301443

590,961438

В среднем



1,595320

0,135827

0,220096


0,089930








Подставим полученные значения в уравнение


Выполним потенцирование полученного уравнения


Подставляя в полученное уравнение значение фактора , рассчитаем .

Линеаризацию показательной функции

Показательная функция

 (79)

также проводят путем логарифмирования обеих частей уравнения:


Обозначив через , получим линейное уравнение регрессии:

 (81)

МНК для оценки параметров функция регрессии по линеаризованной степенной функции дает следующую систему уравнений:

 (82)

Также можно использовать уравнения:

 (83)

 (84)

Рассчитав параметры , и составив линейное уравнение регрессии необходимо провести его потенцирование, что бы вернуться к показательной функции.

 (85)

Пример 14. Имеются данные о средней прибыли (млн. руб.) и затратах на затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли. Рассчитать показательную функцию

Таблица 33


1

37,8

0,3

2

38,0

0,5

3

39,0

0,7

4

37,5

0,8

5

39,5

0,9

6

36,8

1,1

7

40,0

1,3

8

40,1

1,6

9

40,0

1,7

10

39,0

2,2

11

38,0

2,5

12

41,0

2,6

13

41,6

2,7

14

41,0

3,0

15

41,9

3,2


Решение. Для расчета параметров данной функции проведем ее линеаризацию, прологарифмировав обе части уравнения


Обозначив через , получим линейное уравнение регрессии:


МНК для оценки параметров функция регрессии по линеаризованной степенной функции дает следующую систему уравнений:


В таблице 34 рассчитаем все возможные значения:

Таблица 34





1

37,80

0,30

1,577492

0,473248

37,806262

2

38,00

0,50

1,579784

0,789892

38,032035

3

39,00

0,70

1,591065

1,113745

38,259157

4

37,50

0,80

1,574031

1,259225

38,373226

5

39,50

0,90

1,596597

1,436937

38,487635

6

36,80

1,10

1,565848

1,722433

38,717477

7

40,00

1,30

1,602060

2,082678

38,948692

8

40,10

1,60

1,603144

2,565031

39,298106

9

40,00

1,70

1,602060

2,723502

39,415272

10

39,00

2,20

1,591065

3,500342

40,006365

11

38,00

2,50

1,579784

3,949459

40,365268

12

41,00

2,60

1,612784

4,193238

40,485616

13

41,60

2,70

1,619093

4,371552

40,606323

14

41,00

3,00

1,612784

4,838352

40,970608

15

41,90

3,20

1,622214

5,191085

41,215278

Итого

591,20

25,10

23,929804

40,210718

590,987319

В среднем


1,673333

1,595320

2,680715


0,867289








Получили линеаризованное уравнение


Произведем потенцирование линейного уравнения для возврата к показательной функции.

Подставим в полученное уравнение значения фактора , рассчитаем значения .

2.4.1.5 Коэффициенты эластичности в парных моделях

Коэффициенты регрессии  выражены в натуральных единицах, то есть являются именованными величинами, поэтому коэффициенты регрессии, выраженные в разных единицах несопоставимы между собой. Для сопоставления разноименных коэффициентов корреляции линейных и нелинейных моделей удобно использовать коэффициент эластичности.

 (86)

где:

- первая производная функции регрессии для соответствующей формы связи.

Так как коэффициент эластичности не всегда величина постоянная, а часто зависит от значения , обычно рассчитывают средний коэффициент эластичности.

 (87)

Коэффициент средней эластичности для некоторых функций рассчитывается как:

уравнения прямой :

 (88)

парабола второго порядка


уравнение равносторонней гиперболы :

 (89)

степенного уравнения :

 (90)

показательного уравнения :

 (91)

Коэффициент средней эластичности показывает, на сколько процентов в среднем изменится результативный признак, если факторный признак увеличится на один процент.

Коэффициент средней эластичности позволяет ранжировать факторы по силе влияния на результат, чем больше коэффициент для -го фактора, тем сильнее данный фактор влияет на результат.

Пример 15. Исходя из рассчитанных уравнений регрессии (табл. 35) рассчитать коэффициенты средней эластичности для линейной функции, полинома второй степени, равносторонней гиперболы, степенной и показательной функций.

Таблица 35

Функция

Уравнение регрессии

Линейная              


1,6713


 

Парабола второй степени


Равносторонняя гипербола


Степенная


Показательная



Рассчитать коэффициенты средней эластичности для каждого уравнения регрессии.

Решение.

1. Для линейной функции


. Для полинома второй степени


. Для равносторонней гиперболы

. Для степенной функции


. Для показательной функции


Пример 16. По группе предприятий, рассчитаны уравнения парной линейной регрессии, отражающие зависимость средней прибыли от уровня оплаты труда и затрат на маркетинг (табл. 36).

Таблица 36

Признак-фактор

Уравнение парной линейной регрессии

Среднее значение фактора

Уровень оплаты труда, 62,4



Затраты на маркетинг, 189,07




Используя коэффициенты средней эластичности определить степень влияния каждого из факторов.

Решение.

По формуле коэффициента средней эластичности для линейной функции  рассчитаем данный коэффициент по каждому из факторов.

а) по фактору


б) по фактору


Исходя из рассчитанных коэффициентов средней эластичности, можно сказать, что фактор  оказывает более сильное влияние на урожайность, чем фактор .

2.4.1.6 Парная нелинейная корреляция

В нелинейных моделях для определения силы связи рассчитывают индекс корреляции:

 (92)

где;

- остаточная дисперсия результативного признака.

- общая дисперсия результативного признака.

Отсюда:  (93)

Величина индекса корреляции может принимать значения от  до , то есть, он показывает только тесноту связи, но не показывает ее направление.

Квадрат индекса корреляции - индекс детерминации характеризует долю вариации результативного  признака обусловленную влиянием включенного в модель фактора .

 (94)

Величина индекса детерминации определяет качество подбора функции регрессии, чем индекс детерминации выше, тем «лучше» выбор формы уравнения регрессии.

Пример 17. По данным примера 12 (функция регрессии равносторонней гиперболы) рассчитать индекс корреляции, (табл. 37).

Решение.

. Рассчитаем индекс корреляции


Индекс множественной корреляции показывает, что между исследуемыми явлениями существует средняя связь.

Таблица 37






1

37,80

36,808395

-1,6133

2,6027

0,9602

0,9220

2

38,00

38,266516

-1,4133

1,9974

-0,2770

0,0767

3

39,00

38,891425

-0,4133

0,1708

0,1071

0,0115

4

37,50

39,086709

0,0867

0,0075

0,2649

0,0702

5

39,50

39,238597

-1,9133

3,6607

-1,6938

2,8690

6

36,80

39,459524

-2,6133

6,8293

-2,6529

7,0379

7

40,00

39,612474

0,5867

0,3442

0,3964

0,1571

8

40,10

39,770204

0,6867

0,4716

0,3409

0,1162

9

40,00

39,810409

0,5867

0,3442

0,2013

0,0405

10

39,00

39,956611

-0,4133

0,1708

-0,9428

0,8889

11

38,00

40,016262

-1,4133

1,9974

-2,0016

4,0064

12

41,00

40,033086

1,5867

2,5176

0,9984

0,9968

13

41,60

40,048664

2,1867

4,7817

1,5664

2,4536

14

41,00

1,5867

2,5176

0,9265

0,8584

15

41,90

40,111951

2,4867

6,1837

1,8040

3,2544

Сумма

591,2000



34,5973


23,7596

В среднем

39,4133







Рассчитаем индекс детерминации


Индекс детерминации показывает, что вариация результативного признака на 31% обусловлена влиянием включенного в модель фактора.

2.4.1.7 Оценка надежности параметров парной нелинейной регрессии и корреляции

Как и в парной линейной регрессии, в регрессии нелинейной оценку надежности уравнения в целом проводят с помощью критерия Фишера, а оценку параметров уравнения и коэффициента детерминации проводят с помощью критерия Стьюдента.

Общая формула фактический F-критерия имеет вид;

 (95)

где:

 - индекс детерминации.

 - число наблюдений.

 - число параметров при переменных .

В случае нелинейной регрессии  отлично для разных видов регрессии, и формула F-критерия различна для различных функций.

Например. Для степенной  и показательной   и:

 (96)

Для параболы второго порядка   и:

 (97)

Для параболы третьего порядка   и:

 (98)

Как и в случае линейной регрессии, критерий Фишера фактический сравнивают с критерием Фишера табличным, при определенном уровне значимости  или , и числе свободы - ,  (таблицы Снедекора-Фишера - приложение 2).

Значимость параметров уравнения парной нелинейной регрессии и индекса корреляции проверяется, аналогично парной линейной регрессии используя критерий Стьюдента (см. 2.3.1.3).

Критерий Стьюдента для коэффициента регрессии  рассчитывается как;

 (51)

где; - коэффициент регрессии.

 - стандартная ошибка коэффициента регрессии, рассчитывается как:

 (52)

Учитывая, что

 (53)

Критерий Стьюдента для параметра  рассчитывается как;

 (54)

где: - свободный член уравнения регрессии.

 - стандартная ошибка параметра , рассчитывается как:

 (55)

или  (56)

Критерий Стьюдента для индекса корреляции  рассчитывается как;

 (57)

или  (58)

где:  - индекс корреляции.

- стандартная ошибка индекса корреляции, рассчитывается как:

 (59)

Качество подбора модели  определяют, рассчитывая среднюю ошибку аппроксимации. Для расчета средней ошибки аппроксимации используют формулы:

 (99)

 (100)

где  (101)

 (102)

Чем меньше средняя ошибка аппроксимации, тем выше качество модели. Допустимый предел  не более 10%.

Пример 18. Необходимо оценить существенность уравнения регрессии равносторонней гиперболы

, при:

где:  - индекс детерминации.

 - число наблюдений.

Решение. Оценку существенности уравнения нелинейной регрессии проведем, используя критерий Фишера (F-критерий)

.

 - число параметров при переменных .

Найдем критерий Фишера табличный, при уровне значимости , и числе свободы - ,  (таблицы Снедекора-Фишера - приложение 2) - .

Так как  уравнение регрессии признаем статистически значимым.

Пример 19. По данным примеров 7; 11; 12; 13; 14 рассчитаем средние ошибки аппроксимации для линейной функции, функции параболы второй степени, равносторонней гиперболы, степенной и показательной функций.

Решение. Для расчета средней ошибки аппроксимации используем формулу:

, где

Расчет произведем в таблице 38. Средние ошибки аппроксимации составили для:

линейной функции

параболы второго порядка

функции равносторонней гиперболы

степенной функции

показательной функции

Соответственно линейная функция наиболее качественно описывает существующую взаимосвязь между исследуемыми явлениями. Но все регрессии находятся в допустимых пределах ( не более 10%).

Таблица 38

№              Линейная

Парабола второго порядка

Гипербола




 











1

37,8

37,792344

0,007656

0,020254

38,023560

0,223560

0,591429

36,808395

0,991605

2,623294

2

38,0

38,028410

0,028410

0,074763

38,158005

0,158005

0,415803

38,266516

0,266516

0,701358

3

39,0

38,264476

0,735524

1,885959

38,307508

0,692492

1,775621

38,891425

0,108575

0,278397

4

37,5

38,382510

0,882510

2,353360

38,387907

0,887907

2,367752

39,086709

1,586709

4,231224

5

39,5

38,500543

0,999457

2,530271

38,472071

1,027929

2,602352

39,238597

0,261403

0,661780

6

36,8

38,736609

1,936609

5,262524

38,651694

1,851694

5,031777

39,459524

2,659524

7,226967

7

40,0

38,972676

1,027324

2,568310

38,846375

1,153625

2,884063

39,612474

0,387526

0,968815

8

40,1

39,326775

0,773225

1,928242

39,166634

0,933366

2,327596

39,770204

0,329796

0,822434

9

40,0

39,444808

0,555192

1,387980

39,280917

0,719083

1,797708

39,810409

0,189591

0,473978

10

39,0

40,034974

1,034974

2,653779

39,908803

0,908803

2,330264

39,956611

0,956611

2,452849

11

38,0

40,389074

2,389074

6,287037

40,330713

2,330713

6,133455

40,016262

2,016262

5,305953

12

41,0

40,507107

0,492893

1,202178

40,478879

0,521121

1,271027

40,033086

0,966914

2,358327

13

41,6

40,625140

0,974860

2,343413

40,630810

0,969190

2,329784

40,048664

1,551336

3,729173

14

41,0

40,979240

0,020760

0,050634

41,109192

0,109192

0,266322

40,089168

0,910832

2,221541

15

41,9

41,215306

0,684694

1,634115

41,446938

0,453062

1,081294

40,111951

1,788049

4,267420

Итого

591,2



32,182820



33,206244



38,323509

В среднем




2,145521



2,213750



2,554901


Продолжение табл. 38

№              Степенная

Показательная



 








1

37,8

37,183851

0,616149

1,630024

37,806262

0,006262

0,016566

2

38,0

37,910774

0,089226

0,234805

38,032035

0,032035

0,084303

3

39,0

38,397333

0,602667

1,545300

38,259157

0,740843

1,899597

4

37,5

38,592153

1,092153

2,912408

38,373226

0,873226

2,328603

5

39,5

38,764817

0,735183

1,861223

38,487635

1,012365

2,562949

6

36,8

39,060772

2,260772

6,143402

38,717477

1,917477

5,210535

7

40,0

39,308870

0,691130

1,727825

38,948692

1,051308

2,628270

8

40,1

39,619441

0,480559

1,198401

39,298106

0,801894

1,999736

9

40,0

39,710581

0,289419

0,723548

39,415272

0,584728

1,461820

10

39,0

40,100534

1,100534

2,821882

40,006365

1,006365

2,580423

11

38,0

40,295293

2,295293

40,365268

2,365268

6,224389

12

41,0

40,355237

0,644763

1,572593

40,485616

0,514384

1,254595

13

41,6

40,413002

1,186998

2,853361

40,606323

0,993677

2,388647

14

41,0

40,574705

0,425295

1,037305

40,970608

0,029392

0,071688

15

41,9

40,674075

1,225925

2,925835

41,215278

0,684722

1,634181

Итого

591,2



35,228156

590,987320


32,346303

В среднем




2,348544



2,156420


2.4.1.8 Прогнозирование на основе парной модели регрессии

Расчет доверительных интервалов для прогнозного значения , параметров уравнения регрессии и коэффициента (индекса) корреляции .

Парные модели регрессии позволяют прогнозировать значение результативного признака  как точечный прогноз путем подстановки в уравнение регрессии соответствующего конкретного прогнозного значения .

Естественно, что полученное точечное значение  рассчитанное для  не может быть на 100% точным, поэтому необходим дополнительный расчет стандартной ошибки для функции регрессии и для индивидуальных значений зависимой переменной, и построение соответствующих интервалов  которые с заданной вероятностью  (- уровень значимости) накрывают неизвестное значение . Также доверительные интервалы рассчитываются для параметров уравнения регрессии  и коэффициента (индекса) корреляции .

Расчет доверительного интервала для функции регрессии

Доверительный интервал для уравнения регрессии  имеет вид:

 (103)

где:

- предельная ошибка

 (104)

 - стандартная ошибка

 (105)

- остаточное стандартное отклонение на одну степень свободы

 (106)

- табличное значение критерия Стьюдента для числа степеней свободы  и определенного уровня значимости .

Необходимо помнить, что прогноз значений результативного признака  по уравнению регрессии тем точнее, чем значение фактора  ближе к . Если же значение  выходит за рамки обследованных значений  результаты прогноза ухудшаются тем больше, чем больше разница между  и .

Расчет доверительного интервала для индивидуальных значений результативного признака

При построение доверительного интервала для индивидуальных значений результативного признака , в отличие от доверительного интервала для функции регрессии необходимо учитывать вариацию вокруг линии регрессии. В результате стандартная ошибка индивидуальных значений  при  равна

 (107)

Доверительный интервал примет вид:

 (108)

где

- предельная ошибка

 (109)

Точность интервала рассчитывают как отношение максимального значения интервала к минимальному значению

 (110)

Чем меньше отношение, тем меньше интервал, то есть он более точен.

Расчет доверительных интервалов для параметров уравнения регрессии

Для свободного члена уравнения регрессии  доверительный интервал имеет вид:

 (111)

Где

- предельная ошибка

 (112)

 - стандартная ошибка

 (55)

Для коэффициента регрессии  доверительный интервал имеет вид:

 (113)

где

- предельная ошибка

 (114)

- стандартная ошибка

 (52)

Пример 20. По данным примера 7 и примера 9, необходимо:

. провести прогнозирование на основе парной линейной модели регрессии  для индивидуального значения результативного признака  при .

. рассчитать доверительные интервалы для

а) функции регрессии

б) индивидуального прогнозного значения , при

в) свободно члена уравнения регрессии

г) коэффициента регрессии

Решение.

) Рассчитаем прогнозное значение результативного признака, подставив индивидуальное значение фактора  в линейное уравнение регрессии

) Рассчитаем доверительные интервалы

a)    Доверительный интервал прогноза для функции регрессии рассчитаем как:

Где:


Для расчетов используем таблицу 39.

 табличное значение критерия Стьюдента для числа степеней свободы  и определенного уровня значимости .

Доверительный интервал прогноза показывает, что с вероятностью  прогнозное значение  средней прибыли по совокупности предприятий для конкретного значения фактора  будет находиться в интервале от 35,187403 до 41,223517, не принимая нулевых значений, т.е. являются статистически значимыми.

Таблица 39






1

37,80

0,30

0,09

37,792344

1,886044

0,000059

2

38,00

0,50

0,25

38,028410

1,376710

0,000807

3

39,00

0,70

0,49

38,264476

0,947377

0,540996

4

37,50

0,80

0,64

38,382510

0,762711

0,778824

5

39,50

0,90

0,81

38,500543

0,598044

0,998914

6

36,80

1,10

1,21

38,736609

0,328711

3,750454

7

40,00

1,30

1,69

38,972676

0,139378

1,055395

8

40,10

1,60

2,56

39,326775

0,005378

0,597877

9

40,00

1,70

2,89

39,444808

0,000711

0,308238

10

39,00

2,20

4,84

40,034974

0,277378

1,071171

11

38,00

2,50

6,25

40,389074

0,683378

5,707675

12

41,00

2,60

6,76

40,507107

0,858712

0,242944

13

41,60

2,70

7,29

40,625140

1,054045

0,950352

14

41,00

3,00

9,00

40,979240

1,760045

0,000431

15

41,90

3,20

10,24

41,215306

2,330712

0,468806

Итого

591,20

25,10

55,01

591,199992

13,009333

16,472942

В среднем


1,673333






б) Рассчитаем доверительный интервал для индивидуального прогнозного значения , при

Доверительный интервал примет вид:


Доверительный интервал прогноза показывает, что с вероятностью  прогнозное значение  индивидуальной средней прибыли для конкретного значения фактора  будет находиться в интервале от 35,148114 до 41,262806, не принимая нулевых значений, т.е. являются статистически значимыми.

в) Рассчитаем доверительный интервал для свободного члена уравнения .


где


Доверительный интервал прогноза показывает, что с вероятностью  значение параметра  находится в интервале от 36,147123 до 38,729365, не принимая нулевых значений, т.е. являются статистически значимыми.

г) Для коэффициента регрессии  доверительный интервал имеет вид:


где


Доверительный интервал показывает, что с вероятностью  прогнозное значение  будет находиться в интервале от 0,505907 до 0,674425, не принимая нулевых значений, т.е. является статистически значимым.

2.4.2 Множественная регрессия. Множественная Корреляция

.4.2.1 Множественная регрессия

В тех случаях, когда известно, что на результативный признак существенное влияние оказывает не один, как в парной модели, а несколько факторов, причем их влиянием нельзя пренебречь рассчитывают функцию не парной, а множественной регрессии.

 (115)

Множественная модель позволяет установить связь результативного признака с каждым отдельно взятым фактором, при условии неизменяемости других включенных в модель факторных признаков.

При построении функции множественной регрессии, как и в парной регрессии, необходимо решить две задачи:

. отбор факторов,

. спецификация модели.

Отбор факторов модели множественной регрессии

Так как, во множественной регрессии исследуют влияние на результат нескольких факторов, то в отличии от парной модели, имеются особые требования к их отбору.

1. Все факторы должны быть выражены в количественных единицах. Качественные факторы, при включении их в модель, необходимо перевести в количественные, например, путем пересчета в баллы.

Факторы, включенные в модель не должны быть интеркоррелированы, то есть факторы во множественной модели не должны находится в сильной корреляционной связи между собой, сила связи между факторами не должна быть выше чем сила связи между каким то фактором и результатом. В статистике говорят, что факторы явно коррелированны если коэффициент корреляции между ними , а если связь между ними близка к функциональной, то наличие такой связи называется мультиколлинеарностью.

Спецификация модели множественной регрессии

Функция множественной регрессии может, как и парной регрессии, иметь линейный или нелинейный вид.

Наиболее широкое распространение получила линейная функция:

 (116)

Но при значительной вариации признаков возможно применение нелинейных функций. Данные функции, так же, как и в парной регрессии должны иметь возможность свей линеаризации. Из всего множества нелинейных функций чаще всего используют:

1. Множественная степенная функция

 (117)

. Множественная показательная функция

 (118)

. Множественная экспонента

 (119)

. Множественная гипербола

 (120)

. Множественная парабола второго порядка

 (121)

Выбор вида функции проводится аналитическим или экспериментальным методами.

Расчет параметров уравнения множественной регрессии

Параметры множественной регрессии, как и параметры парной регрессии можно определить, используя МНК. Так для расчета параметров уравнения множественной линейной регрессии:


МНК даст систему уравнений:

 (122)

Параметры уравнения находим как отношение частных определителей к определителю системы

, , ,…,  (123)

где

- определитель системы, находится, как:

 (124)

- частные определители системы рассчитывают, заменяя соответствующий столбец матрицы определителя системы данными левой части системы.

Параметр  во множественной регрессии называется свободным членом уравнения регрессии и также как в парной регрессии не имеет экономической интерпретации. Параметр - коэффициентом регрессии, он показывает, на сколько единиц, в среднем, изменится результативный признак , если соответствующий данному коэффициенту фактор  увеличится на одну единицу при постоянной величине остальных факторов.

Коэффициенты регрессии можно рассчитать и используя уравнения регрессии в стандартизованном виде представив все переменные уравнения как центрированные и нормированные. Для этого выразим их как отношение их отклонений от средних величин на их стандартное отклонение:

 (125)

где

- стандартизованные переменные:

 (126)

 (127)

 - стандартизованные коэффициенты регрессии , показывают на сколько, в среднем, среднеквадратических отклонений изменится вариация результативного признака, если вариация соответствующего фактора  увеличится на одно среднеквадратическое отклонение, при постоянной величине остальных факторов. Расчет параметров уравнения в стандартизированной форме более прост, так как, по сравнению с уравнением в натуральной форме отсутствует параметр .

МНК для уравнения множественной регрессии в стандартизированном масштабе даст следующую систему уравнений:

 (128)

где

 - коэффициент парной корреляции (38)

или  (39)

Как, и в уравнении в натуральном масштабе параметры стандартизированного уравнения можно найти методом определителей:

 (129)

где:

 (130)

Определитель  получается из определителя , заменой в нем соответствующего столбца столбцом свободных членов исходной системы.

Кроме того,  можно рассчитать используя их взаимосвязь с коэффициентами парной линейной корреляции. Так, например,  для двухфакторной линейной модели, выраженной в стандартизованном масштабе,  рассчитываются, как:

 (131)

Определив значение -коэффициентов и зная, что между -коэффициентами и коэффициентами регрессии в натуральном масштабе  существует следующая взаимосвязь:

 или  (132)

От уравнения множественной регрессии в стандартизованном виде

 (125)

перейдем к уравнению в натуральном масштабе

 (116)

параметр , который мы не рассчитали в стандартизованном уравнении, рассчитаем, как

 (133)

Расчет параметров нелинейных уравнений множественной регрессии ведется так же, как и в линейной модели используя МНК. Разница заключается в том, что нелинейные модели вначале линеаризуются, и расчет параметров проводится по преобразованным данным (см. парную регрессию).

2.4.2.2 Частные уравнения регрессии

Частные уравнения регрессии, рассчитываются на основе множественного уравнения регрессии:

 (116)

Они показывают изолированное влияние одного конкретного  фактора на результативный признак , при зафиксированном, на среднем уровне, положении остальных, включенных в модель факторов. Влияния зафиксированных факторов в уравнениях частной регрессии присоединены к свободному члену уравнения регрессии .

Частные множественные регрессии записываются, как:

 (134)

Обозначение  показывает, что изучается влияние на результат , фактора , при зафиксированном на среднем уровне положении факторов . Обозначение  показывает, что изучается влияние на результат , фактора , при зафиксированном на среднем уровне положении факторов , и т, д. Знак  в нижнем индексе обозначения отделяет фактор влияния, которого исследуется, от факторов, влияние которых изолируется.

Частные уравнения множественной регрессии для линейной модели имеют вид:

 (135)

На основе частных уравнений регрессии рассчитывают частные коэффициенты эластичности:

 (136)

Частные коэффициенты эластичности отличаются от средних коэффициентов.

Частный коэффициент эластичности показывает, на сколько, в среднем, процентов изменится результат при подстановке в уравнение регрессии конкретного значения .

Средний коэффициент эластичности показывает, на сколько в среднем процентов изменится результат, если соответствующий данному коэффициенту фактор увеличится на 1%, при зафиксированных, на средних уровнях величин остальных, включенных в модель, факторов.

 (137)

Пример 20. Имеются данные по 40 хозяйствам о средней урожайности (ц/га), качества почвы  (балов), затратах труда  (чел-час./1га.), внесение минеральных удобрений  (ц.д.в. на 1га.), стоимость ОС  (тыс. руб. на 100 га.) (табл. 42).

Таблица 42

№              Урожайность, ц/га

Качество пашни, балов

Затраты труда чел.-час на 1 га Внесение мин. удобрений на 1 га ц.д.в.

Стоимость ОФ на тыс.руб. 100 га






 

1

10,49

67

15,45

0,76

18,21

10,048113

2

8,57

53

16,13

1,06

19,17

9,601560

3

70

17,59

1,06

20,42

11,593826

4

9,23

51

18,84

0,52

20,00

8,633346

5

11,97

70

18,43

0,99

20,37

11,524121

6

8,56

56

12,44

0,67

21,04

8,887059

7

12,18

55

15,50

1,02

20,25

9,800000

8

7,93

47

16,34

0,44

17,68

7,427264

9

15,75

89

17,13

1,22

28,19

14,929855

10

13,61

74

17,10

0,72

22,63

11,502371

11

13,99

52

27,16

1,59

40,16

15,194027

12

12,57

87

14,92

1,23

21,12

13,414848

13

10,93

65

18,17

0,82

26,01

11,506605

14

9,86

54

17,24

0,98

17,99

9,461020

15

7,39

48

14,64

0,41

21,90

7,917362

16

9,23

61

14,70

0,79

20,47

9,804117

17

15,40

79

28,81

1,20

29,01

15,372985

18

13,14

85

21,87

0,99

23,40

13,824023

19

13,12

83

16,88

0,91

25,53

13,217642

20

10,27

64

16,65

0,83

21,18

10,512752

21

9,12

55

16,10

0,81

20,24

9,395289

22

13,42

72

18,02

1,21

20,22

12,140147

23

10,29

69

16,91

0,78

24,89

11,485126

24

11,55

72

14,90

0,86

20,86

11,101097

25

15,26

87

17,64

1,21

28,42

14,808601

26

12,35

79

14,41

1,20

19,73

12,305857

27

8,24

49

12,62

1,07

18,57

8,749497

28

10,41

64

18,13

0,79

21,07

10,573475

29

9,62

52

17,30

0,77

24,46

9,806811

30

10,76

65

17,16

0,82

20,46

10,532588

31

8,35

51

14,65

0,63

22,82

8,842748

32

10,31

75

13,66

0,79

19,89

10,941740

33

9,38

55

12,07

0,73

22,92

9,174913

34

14,93

72

14,38

1,05

33,99

13,502339

35

12,46

79

14,53

1,03

22,95

12,436891

36

10,45

59

16,54

0,92

23,20

10,534678

37

12,38

80

21,64

0,95

21,64

12,955222

38

7,74

76

10,27

0,65

16,87

9,872332

39

14,49

89

19,44

1,05

24,49

14,236792

40

8,50

47

15,05

0,56

17,89

7,582986

Итого

445,15

2657,00

671,41

36,09

900,31

445,152022

Среднее

11,128750

66,425000

16,785250

0,902250

22,507750


2,30556112,9593353,4585730,2406924,463267








Необходимо построить уравнение множественной линейной регрессии, рассчитать парные коэффициенты регрессии, частные и средние коэффициенты эластичности, провести прогнозирование урожайности, при различных значениях факторов, то есть рассчитать:

·   максимально возможную урожайность,

·   минимальную урожайность,

·   урожайность для средних значений фактора,

·   частные уравнения регрессии, при максимальном значении одного фактора и средних значениях двух других факторов.

Решение.

1) Уравнение множественной линейной регрессии для нашего примера имеет вид:


Для решения данного уравнения представим его в стандартизированном масштабе:


где: - стандартизованные переменные:

,

 - стандартизованные коэффициенты регрессии

МНК для решения множественного уравнения линейной регрессии в стандартизованном виде дает систему уравнений:


Для нашего примера:

Между стандартизированными переменными и коэффициентами парной корреляции существует следующая взаимосвязь:

) Рассчитаем коэффициенты парной корреляции. Расчет проведем, используя программу Microsoft, таблица 43.

Таблица 43


Столбец 1 y

Столбец 2 x1

Столбец 3 x2

Столбец 4 x3

Столбец 5 x4

Столбец 1 y

1,000000





Столбец 2 x1

0,749996

1,000000




Столбец 3 x2

0,545459

0,188222

1,000000



Столбец 4 x3

0,731053

0,474013

0,466501

1,000000


Столбец 5 x4

0,640037

0,223318

0,549570

0,539163

1,000000


3) Подставим значения коэффициентов корреляции в систему.


Для решения системы уравнения воспользуемся методом Гаусса.

). Составим матрицу, в которую внесем все числа (коэффициенты) при переменных , за горизонтальную черту вынесем итог по каждому уравнению:

 - матрица 1

) Далее необходимо привести к нулю первые коэффициенты строк 2,3,4, первая строка остается без изменений - рабочая строка. Для этого:

а) Умножим первую (рабочую) строку на число противоположное 1-му коэффициенту второй строки матрицы 1, т.е. на , получим

суммируем полученную строку со второй строкой матрицы 1, получим расчетную строку 1.

б) Умножим первую (рабочую) строку на число противоположное 1-му коэффициенту третьей строки матрицы 1, т.е. на  получим

суммируем полученную строку с третьей строкой матрицы 1, получим расчетную строку 2.

в) Умножим первую (рабочую) строку на число противоположное 1-му коэффициенту четвертой строки матрицы 1, т.е. на  получим

суммируем полученную строку с четвертой строкой матрицы 1, получим расчетную строку 3.

) Составим новую матрицу (матрица 2). Первой строкой данной матрицы будет первая строка матрицы 1, второй строкой (рабочей) - расчетная строка 1, третьей - строка 2, четвертой - строка 3.

 - матрица 2

) Далее, необходимо привести к нулю вторые коэффициенты строк 3 и 4 матрицы 2, первая строка остается без изменений, рабочей будет вторая строка. Для этого:

а) Найдем число, которое при умножении на второй коэффициент рабочей строки матрицы 2 - , даст число, противоположное (с другим знаком) второму коэффициенту третьей строки - . Для этого найдем отношение: , так как второй коэффициент третьей строки число положительное, полученное число возьмем со знаком минус  и умножим на него вторую (рабочую) строку матрицы 2:

суммируем полученную строку с третьей строкой матрицы 2, получим расчетную строку 4:

б) Найдем число, которое при умножении на второй коэффициент рабочей строки матрицы 2 - , даст число, противоположное (с другим знаком) второму коэффициенту четвертой строки - . Для этого найдем отношение: , так как второй коэффициент четвертой строки число положительное, полученное число возьмем со знаком минус  и умножим на него вторую (рабочую) строку матрицы 2:

). Составим новую матрицу - 3. Первые две строки возьмем без изменений из матрицы два, третьей строкой (рабочей) будет расчетная строка 4, четвертой строкой - расчетная строка 5.

 - матрица 3

) Далее необходимо привести к нулю третий коэффициент строки 4. Для этого:

Найдем число, которое при умножении на третий коэффициент рабочей строки матрицы 3 - , даст число, противоположное (с другим знаком) третьему коэффициенту четвертой строки - . Для этого найдем отношение , так как третий коэффициент четвертой строки число положительное, полученное число возьмем со знакам минус  и умножим на него третью (рабочую) строку матрицы 3.

суммируем полученную строку с четвертой строкой матрицы 3

) Составим новую матрицу - 4. Первые три строки возьмем без изменений из матрицы три, а четвертой строкой - расчетная строка 6.

 - матрица 4

) Подставим полученные коэффициенты в систему


) Рассчитаем значение стандартизированных коэффициентов регрессии .

а) Из четвертого уравнения системы рассчитаем:

б) Подставим полученное значения  в третье уравнение системы и рассчитаем значение :

в) Подставим значения  и  во второе уравнения системы и получим значение :

г) Подставим значения , ,  во второе уравнения системы и получим значение :

) Зная, что между -коэффициентами и коэффициентами регрессии в натуральном масштабе  существует следующая взаимосвязь:

 соответственно

а)

б)

в)

г)

Таким образом, используя метод Гаусса, рассчитали коэффициенты регрессии , параметр  найдем по формуле:


) Подставим рассчитанные параметры в уравнение множественной регрессии:


а) Коэффициент регрессии  показывает, что при увеличении фактора  - качество пашни на 1 балл, средняя урожайность в среднем возрастет на 0,096083 ц/га., при фиксированном положении остальных факторов.

б) Коэффициент регрессии  показывает, что при увеличении фактора  - затраты труда на 1 чел.-час./га, средняя урожайность в среднем возрастет на 0,113165 ц/га., при фиксированном положении остальных факторов.

в) Коэффициент регрессии  показывает, что при увеличении фактора  - внесение минеральных удобрений на 1 ц.д.в./га средняя урожайность в среднем возрастет на 2,243155 ц/га., при фиксированном положении остальных факторов.

г) Коэффициент регрессии  показывает, что при увеличении фактора  - стоимость ОФ на одну тыс.руб./100га, средняя урожайность в среднем возрастет на 0,15490 ц/га., при фиксированном положении остальных факторов.

) Проведем прогнозирование средней урожайности на основе полученного уравнения множественной регрессии:

а) Рассчитаем максимально возможную урожайность, для этого по каждому из факторов , в уравнение подставим максимальное значение, если коэффициент  регрессии для данного фактора положителен, или минимальное значение, если коэффициент регрессии  для данного фактора отрицателен. В нашем примере все коэффициенты регрессии  положительны, соответственно значения факторов берем максимальные , , , , и подставляем в уравнение.

б) Рассчитаем минимально возможную урожайность, для этого по каждому из факторов , в уравнение подставим минимальное значение, если коэффициент  регрессии для данного фактора положителен, или максимальное значение, если коэффициент регрессии  для данного фактора отрицателен. В нашем примере все коэффициенты регрессии  положительны, соответственно значения факторов берем минимальные , , , , и подставляем в уравнение.

в) Рассчитаем среднюю возможную урожайность, для этого по каждому из факторов , в уравнение подставим средние значения , , , .

) Рассчитаем частные уравнения регрессии

а) Рассчитаем среднюю возможную урожайность при максимальном значении фактора  (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .

б) Рассчитаем среднюю возможную урожайность при максимальном значении фактора  (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .

в) Рассчитаем среднюю возможную урожайность при максимальном значении фактора  (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .

г) Рассчитаем среднюю возможную урожайность при максимальном значении фактора  (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .

) На основе частных уравнений регрессии рассчитаем частные коэффициенты эластичности:


а) При максимальном значении фактора , и зафиксированных на среднем уровне значении остальных факторов , , .


то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения  на 0,64%, и зафиксированных на среднем уровне значении остальных факторов.

б) При максимальном значении фактора  (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .


то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения  на 0,26%, и зафиксированных на среднем уровне значении остальных факторов.

в) При максимальном значении фактора  (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .


то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения  на 0,28%, и зафиксированных на среднем уровне значении остальных факторов.

г) При максимальном значении фактора  (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .


то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения  на 0,45%, и зафиксированных на среднем уровне значении остальных факторов.

) Рассчитаем средние коэффициенты эластичности для каждого фактора:

а) Рассчитаем средний коэффициент эластичности для фактора


то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,57%, при фиксированном положении остальных факторов.

б) Рассчитаем средний коэффициент эластичности для фактора


то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,17%, при фиксированном положении остальных факторов.

в) Рассчитаем средний коэффициент эластичности для фактора


то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,18%, при фиксированном положении остальных факторов.

г) Рассчитаем средний коэффициент эластичности для фактора

то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,31%, при фиксированном положении остальных факторов.

) Коэффициенты средней эластичности позволяют ранжировать факторы по степени их влияния на результативный признак, для нашего примера:

.        - качество пашни, балов

.        - стоимость ОФ тыс.руб. на 100га

.        - внесение минеральных удобрений на 1га.тыс.руб.

.        - затраты труда, чел.-час.

) Расчет множественной регрессионной модели в программе Microsoft Excel аналогичен расчету парной регрессии и рассмотрен в примере 1 (вводим входной интервал, выделяя все столбики содержащие факторы ). Для данного примера приведем таблицу, содержащую результаты - рисунок 9.

Рисунок 9.

Параметр  в данной таблице находится на пересечении столбика «Коэффициенты» и строки «Y-пересечение», параметр - на пересечении столбика «Коэффициенты» и строки «Переменная Х1», - строки «Переменная Х2», - строки «переменная Х3», - строки «Переменная Х4».

2.4.2.3 Множественная корреляция

Силу связи во множественных моделях изучают с помощью показателя множественной корреляции и его квадрата - показателя множественной детерминации.

Показатель множественной корреляции  - показывает тесноту связи между результативным признаком и всеми включенными в модель факторами. Может принимать значения от 0 до 1, то есть в отличие от парной модели не показывает направление связи.

Показатель множественной детерминации  - показывает часть вариации результативного признака, которая сложилась под влиянием всех включенных в модель факторов.

В статистике и эконометрике показатель множественной корреляции (детерминации) принято называть индексом или коэффициентом множественной (совокупной) корреляции.

Для линейной множественной функции и для функций нелинейных по переменным (полиномы разных степеней, равносторонняя гипербола и т.п. функции) индекс множественной корреляции совпадает с коэффициентом множественной корреляции.

Коэффициент (индекс) множественной корреляции рассчитывают, используя следующие формулы:

 (138)

где:

- остаточная дисперсия (139)

 - общая дисперсия для признака  (140)

 (141)

Коэффициент множественной корреляции можно рассчитать и, как:

 (142)

где:

- парные коэффициенты корреляции между результативным признаком и одним из факторов .

Для функций нелинейных по оцениваемым параметрам (степенная, показательная, экспоненциальная и т. п. функции) индекс множественной корреляции не совпадает с коэффициентом множественной корреляции. Его называют «» и определяют как

 (143)

Коэффициенты (индексы) множественной детерминации получают, возводя коэффициенты (индексы) корреляции в квадрат, или по формулам.

 (144)

 (145)

 (146)

Скорректированный индекс множественной детерминации

Индекс множественной детерминации используют для определения качества регрессии, чем больше , к единице тем выше качество подбора регрессии.

Но использование только одного индекса детерминации для определения наилучшего уравнения регрессии недостаточно. Необходимо учитывать, что при увеличении факторов включенных в уравнение регрессии, при одном и том же числе наблюдений , при расчете показателей корреляции, за счет использования остаточной дисперсии появляется систематическая ошибка - чем больше число параметров в уравнении регрессии, при одном и том же числе наблюдений , тем больше получается расчетный показатель тесноты связи. Если число факторов приближается к числу наблюдений, то расчетный показатель корреляции будет близок к единице, то есть показывать тесную связь, даже если связь незначительна. Для того чтобы избежать этого рассчитывают скорректированный индекс множественной детерминации.

 (147)

или

 (148)

Скорректированный индекс множественной корреляции рассчитывают соответственно как:

 (149)

или

 (150)

где:

- для линейной множественной модели - число факторов включенных в регрессионную модель. Для нелинейной модели - число параметров при  и их линеаризации ( и так далее), которое может быть больше числа факторов.

- число наблюдений.

В силу сказанного выше необходимо понимать, что нельзя перегружать множественную модель факторами, так как снижается достоверность расчетов, принято считать, что на каждые 8-10 наблюдений в модель целесообразно включать один фактор.

2.4.2.4 Частная корреляция

Множественный коэффициент (индекс) корреляции показывает тесноту связи между результатом и всеми включенными в модель факторами, для того, чтобы изучить силу связи между результатом и только одним из включенных в модель факторов, рассчитывают частные коэффициенты корреляции, для каждого из факторов включенных в модель.

Частный коэффициент корреляции показывает тесноту связи между результативным признаком и только одним фактором при элиминировании (устранении) влияния всех остальных включенных в модель факторов.

В зависимости от того, влияние скольких факторов необходимо исключать различают частные коэффициенты разных порядков: нулевого, первого, второго, третьего и т.д. Так, например:

·   Коэффициенты частной корреляции нулевого порядка - коэффициенты парной корреляции, так как нет необходимости устранять влияние даже одного фактора.

Коэффициенты частной корреляции первого порядка - коэффициенты частной корреляции, в которых элиминируется влияние одного фактора (,,и т.д.).

Коэффициенты корреляции второго порядка - коэффициенты частной корреляции, в которых элиминируется влияние двух факторов (,,и т.д.) и так далее.

Коэффициенты частной корреляции более высоких порядков рассчитываются через коэффициенты корреляции более низких порядков. Коэффициенты первого порядка через коэффициенты нулевого порядка, второго порядка через коэффициенты первого порядка и т.д. Рекуррентная формула для расчета коэффициентов частной корреляции  порядка имеет вид:

 (151)

Коэффициенты частной корреляции могут принимать значения в пределах от -1 до 1.

Также частные коэффициенты корреляции можно рассчитать через множественные коэффициенты детерминации. Так коэффициент частной корреляции второго порядка рассчитывается как:

 или и т.д. (152)

В общем виде уравнение для расчета коэффициентов частной корреляции  порядка имеет вид:

 (153)

где

- коэффициент множественной детерминации  для всех факторов.

- коэффициент множественной детерминации без включения в модель фактора .

Рассчитанные через множественные коэффициенты детерминации частные коэффициенты корреляции могут принимать значения в интервале от 0 до 1.

Кроме того, частные коэффициенты корреляции можно рассчитать через . Так, например, частные коэффициенты корреляции первого порядка для двухфакторной линейной модели, выраженной в стандартизованном масштабе :

 (131)

Отсюда:

 и  (154)

Возводя в квадрат коэффициенты частной корреляции, получают коэффициенты частной детерминации.

Частные коэффициенты корреляции используют при формировании корреляционно-регрессионной модели, для отбора факторов. При этом из модели исключают факторы несущественные по критерию Стьюдента.

Коэффициент частной детерминации показывает долю вариации результативного признака дополнительно сложившуюся при включении в модель фактора , в вариации признака, не объясненную включенными до этого в модель факторами. Можно рассчитать по формуле на основе коэффициентов множественной детерминации.

 (155)

где

- коэффициент множественной детерминации  для всех факторов.

- коэффициент множественной детерминации без включения в модель фактора .

Зная коэффициенты частной детерминации, последовательно нулевого, первого, второго и более высоких порядков, определяют коэффициент множественной корреляции.

 (156)

Пример 21. По данным примера 20 необходимо рассчитать:

1.      линейный индекс множественной корреляции, детерминации

2.      линейные коэффициенты частной корреляции первого и второго порядков, детерминации.

Решение.

. Рассчитаем индекс множественной корреляции по формуле:


В таблице 44 рассчитаем все возможные значения.

Таблица 44




1

10,49

0,408002

10,048113

0,195264

2

8,57

6,547202

9,601560

1,064116

3

10,95

0,031952

11,593826

0,414512

4

9,23

3,605252

8,633346

0,355996

5

11,97

0,707702

11,524121

0,198808

6

8,56

6,598477

8,887059

0,106968

7

12,18

1,105127

9,800000

5,664400

8

7,93

10,232002

7,427264

0,252743

9

15,75

21,355952

14,929855

0,672638

10

13,61

6,156602

11,502371

4,442100

11

13,99

8,186752

15,194027

1,449681

12

12,57

2,077202

13,414848

0,713768

13

10,93

0,039502

11,506605

0,332473

14

9,86

1,609727

9,461020

0,159185

15

7,39

13,978252

7,917362

0,278111

16

9,23

3,605252

9,804117

0,329610

17

15,40

18,243577

15,372985

0,000730

18

13,14

4,045127

13,824023

0,467887

19

13,12

3,965077

13,217642

0,009534

20

10,27

0,737452

10,512752

0,058929

21

9,12

4,035077

9,395289

0,075784

22

13,42

5,249827

12,140147

1,638024

23

10,29

0,703502

11,485126

1,428326

24

11,55

0,177452

11,101097

0,201514

25

15,26

17,067227

14,808601

0,203761

26

12,35

1,491452

12,305857

0,001949

27

8,24

8,344877

8,749497

0,259587

28

10,41

0,516602

10,573475

0,026724

29

9,62

2,276327

9,806811

0,034898

30

10,76

0,135977

10,532588

0,051716

31

8,35

7,721452

8,842748

0,242801

32

10,31

0,670352

10,941740

0,399095

33

9,38

3,058127

9,174913

0,042061

34

14,93

14,449502

13,502339

2,038216

35

12,46

1,772227

12,436891

0,000534

36

10,45

0,460702

10,534678

0,007170

37

12,38

1,565627

0,330880

38

7,74

11,483627

9,872332

4,546840

39

14,49

11,298002

14,236792

0,064114

40

8,50

6,910327

7,582986

0,840915

Итого

445,150000

212,624438

445,152025

29,602363

В среднем

11,128750






Рассчитаем индекс множественной корреляции по формуле:


Значение стандартизованных коэффициентов регрессии и коэффициенты корреляции  из примера 21.


Индекс множественной корреляции  показывает, что между результативным признаком и всеми тремя включенными м модель факторами существует тесная связь (направление связи индекс множественной корреляции не определяет).

Индекс множественной детерминации:

Индекс множественной детерминации  показывает, что 86% вариации результативного признака обусловлено влиянием включенных в модель факторов.

Расчет множественного индекса корреляции  и множественного индекса детерминации  произведем в программе Microsoft Excel рассмотрен в примере 20, рисунок 9.

. Рассчитаем частные коэффициенты корреляции по рекуррентной формуле:


Для этого воспользуемся матрицей парных коэффициентов корреляции из примера 20, (табл. 45).

Таблица 45


Столбец 1 y

Столбец 2 x1

Столбец 3 x2

Столбец 4 x3

Столбец 5 x4

Столбец 1 y

1,000000





Столбец 2 x1

0,749996

1,000000




Столбец 3 x2

0,545459

0,188222

1,000000



Столбец 4 x3

0,731053

0,474013

0,466501

1,000000


Столбец 5 x4

0,640037

0,223318

0,549570

0,539163

1,000000


а) Рассчитаем частные коэффициенты корреляции и детерминации первого порядка.

коэффициенты частной корреляции и детерминации первого порядка между результативным признаком  и фактором :


коэффициенты частной корреляции и детерминации первого порядка между результативным признаком  и фактором :

коэффициенты частной корреляции и детерминации первого порядка между результативным признаком  и фактором :


коэффициенты частной корреляции и детерминации первого порядка между результативным признаком  и фактором :


коэффициенты частной корреляции первого порядка между факторами (для расчета частных коэффициентов второго порядка):


б) Рассчитаем частные коэффициенты корреляции и детерминации второго порядка.

коэффициенты частной корреляции и детерминации второго порядка между результативным признаком  и фактором :


коэффициенты частной корреляции и детерминации второго порядка между результативным признаком  и фактором :


коэффициенты частной корреляции и детерминации второго порядка между результативным признаком  и фактором :


коэффициенты частной корреляции и детерминации второго порядка между результативным признаком  и фактором :


Коэффициенты частной корреляции третьего порядка рассчитываем аналогичным образом через частные коэффициенты корреляции второго порядка.

2.4.2.5 Оценка надежности параметров множественной регрессии и корреляции

Оценка значимости множественного уравнения регрессии в целом проводится с помощью , (критерия Фишера).

 (157)

где:

 - факторная дисперсия (158)

 - остаточная дисперсия (159)критерий можно рассчитать и по формуле:

 (160)

где:

- для линейной множественной модели - число факторов включенных в регрессионную модель. Для нелинейной модели - число параметров при  и их линеаризации ( и так далее), которое может быть больше числа факторов

- число наблюдений

Если расчетный  превышает табличный при определенном уровне значимости  или , и числе свободы - ,  (таблицы Снедекора-Фишера - приложение 2) можно сказать, что уравнение множественной регрессии статистически значимо.

Величина  позволяет также оценить статистическую значимость и коэффициента (индекса) множественной корреляции .

Кроме оценки уравнения в целом, большое практическое значение имеет статистическая оценка значимости каждого отдельно включенного в модель фактора, через частные критерии Фишера , (). Данная оценка позволяет оценить целесообразность включения в модель множественной регрессии каждого из факторов после введения в модель остальных факторов.

Расчет частного , для фактора  проводится по формуле:

 (161)

 - коэффициент множественной детерминации для модели, включающей все факторы

- коэффициент множественной детерминации для модели, без включения фактора

Расчета частного  в общем виде, для фактора  проводится по формуле:

 (162)

Расчета частного , для оценки значимости влияния фактора  после включения в модель других факторов проводится по формуле:

 (163)

Если величина расчетного частного  превышает величину табличного при определенном уровне значимости  или , и числе свободы - ,  (таблицы Снедекора-Фишера - приложение 2), можно сказать, что включение в модель фактора , после введения в модель остальных факторов, целесообразно. Если величина расчетного частного  меньше табличного значения, можно сказать, что включение в модель фактора , после введения в модель остальных факторов, статистически неоправданно, и его необходимо исключить из рассматриваемой модели.

Зная величину частного критерия Фишера , рассчитывают частные критерии Стьюдента, для определения значимости каждого из коэффициентов чистой регрессии .

 (164)

Критерий Стьюдента  также можно рассчитать по формуле:

 (165)

где:

- коэффициент чистой регрессии для фактора

 - стандартная ошибка  (166)

где:

 - коэффициент детерминации множественного уравнения регрессии

- коэффициент множественной детерминации зависимости фактора  со всеми остальными факторами уравнения множественной регрессии

- среднеквадратическое отклонение результативного признака

- среднеквадратическое отклонение факторного признака

Полученные фактические значения критерия Стьюдента сравнивают с табличными значениями при определенном уровне значимости , или , и числе степеней свободы  (приложение 1). Если фактическое значение  больше табличного соответствующий коэффициент регрессии статистически значим.

Фактические значения критерия Стьюдента сравнивают с табличными значениями при определенном уровне значимости , или , и числе степеней свободы , где - число исключенных переменных (приложение 1). Если фактическое значение  больше табличного соответствующий коэффициент частной корреляции статистически значим.

Пример 22. По данным примеров 20 и 21 необходимо:

. провести оценку существенности уравнения регрессии и его параметров:

. рассчитать частные . Оценить с их помощью статистическую значимость включения факторов , , , решить вопрос включения в регрессионную модель одних факторов после включения других.

Решение.

. Оценку существенности множественного уравнения проведем, используя критерий Фишера (F-критерий)

.

где:

 - число факторов включенных в регрессионную модель.

- число наблюдений

Табличное значение  для данной модели при уровне значимости , и числе свободы - ,  (значение 35 в приложении 2 отсутствует, возьмем ближайшее значение 30) будет равно 2,69.

Расчетное значение  значительно больше табличного, соответственно множественное уравнение регрессии признается статистически значимым.

Расчет фактического , в программе Microsoft Excel - рисунок 9.

. Рассчитаем частные  для оценки значимости влияния фактора  после включения в модель других факторов


Табличное значение  при уровне значимости , и числе свободы - ,  будет равно 4,12.

а)

Фактическое значение  больше табличного. Значит включение в модель фактора  после факторов ,, статистически значимо.

б)

Фактическое значение  больше табличного. Значит включение в модель фактора  после факторов , ,  статистически значимо.

в)

Фактическое значение  больше табличного. Значит включение в модель фактора  после факторов ,, статистически значимо.

г)

Фактическое значение  больше табличного. Значит включение в модель фактора  после факторов ,, статистически значимо.

где: - коэффициент множественной детерминации для множественной регрессионной модели со всеми включенными в нее факторами.

 - коэффициент множественной детерминации для множественной регрессионной модели без фактора .

 - коэффициент множественной детерминации для множественной регрессионной модели без фактора .

 - коэффициент множественной детерминации для множественной регрессионной модели без фактора .

 - коэффициент множественной детерминации для множественной регрессионной модели без фактора .

Значения коэффициентов , , , ,  рассчитаем в программе Microsoft Excel, методика расчета рассмотрена в примере 20 рисунок 9.

. Статистическую оценку значимости коэффициентов регрессии  по  Стьюдента. Зная частные  воспользуемся следующей формулой:

а)

б)

в)

г)

Табличное значение критерия Стьюдента при, и числе степеней свободы  (значение 35 в приложении 1 отсутствует, возьмем ближайшее значение 30) равно 2,0423. Все фактические значения критерия Стьюдента больше табличного, то есть можно сделать вывод о статистической значимости всех коэффициентов регрессии .

Расчет  и критериев Стьюдента для  в программе Microsoft Excel приведен на рисунке 9.  обозначен как F, а критерии Стьюдента как t-статистика.

Литература

Айвазян С.А., Иванова С.С. Эконометрика. Краткий курс: учеб. пособие / С.А. Айвазян, С.С. Иванова. - М.: Маркет ДС, 2007. - 104 с.

Бородич С.А. Вводный курс эконометрики: Учебное пособие. - Мн.: БГУ, 2010. - 354 с.

Бывшев В.А. Эконометрика: учеб. пособие / В.А. Бывшев. - М.: Финансы и статистика, 2008. - 480 с.

Доугерти Кристофер. Введение в эконометрику: Учебник для экон. спец. вузов / Пер. с англ. Е.Н. Лукаш и др. - М.: ИНФРА-М, 2007. - 402 с.

Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы: Учебник. - М.: Финансы и статистика, 2013. - 352 с.

Дуброва Т.А. Прогнозирование социально-экономических процессов. Статистические методы и модели: учеб. пособие / Т.А. Дуброва. - М.: Маркет ДС, 2007. - 192 с.

Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учебник. -3-е изд., перераб. и доп. - М.: Дело, 2010.- 400 с.

Методы математической статистики в обработке экономической информации: учеб. пособие / Т.Т. Цымбаленко, А.Н. Баудаков, О.С. Цымбаленко и др.; под ред. проф. Т.Т. Цымбаленко. - М.: Финансы и статистика; Ставрополь: АРГУС, 2007. - 200 с.

Палий И.А. Прикладная статистика: Учебное пособие. - М.: Издательско-торговая корпорация "Дашков и К", 2008. - 224 с.

Порядина О.В. Эконометрическое моделирование линейных уравнений регрессии: Учебное пособие. - Йошкар-Ола: МарГТУ, 2005. - 92 с.

Практикум по эконометрике: Учеб. пособие / И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2007. - 344 с.

Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2 т. 2-у изд., испр. - Т. 2: Айвазян С.А. Основы эконометрики. - М.: ЮНИТИ-ДАНА, 2001. - 432 с.

Симчера В.М. Методы многомерного анализа статистических данных: учеб. пособие. - М.: Финансы и статистика, 2008. - 400 с.

Чураков Е.П. Прогнозирование эконометрических временных рядов: учеб. пособие / Е.П. Чураков. - М.: Финансы и статистика, 2008. - 208 с.

Эконометрика: учеб. / под ред. д-ра экон. наук, проф. В.С. Мхитаряна. - М.: Проспект, 2008. - 384 с.

Эконометрика: учеб. / под ред. И.И. Елисеевой. - М.: Проспект, 2009. - 288 с.

Эконометрика: Учебник/И.И. Елисеева, С.В. Курышева, Т.В. Костеева и др., Под ред. И.И. Елисеевой. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2005. - 576 с.

Похожие работы на - Предмет и метод эконометрики. Эконометрические взаимосвязи

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!