Предмет и метод эконометрики. Эконометрические взаимосвязи

Вид работы:

Курсовая работа (т)
Предмет:

Менеджмент
Язык:

Русский
,
Формат файла:
MS Word

895,42 Кб
Опубликовано:

2015-06-29

Все курсовые работы по менеджменту

Скачать курсовую работу Читать текст online Заказать курсовую
*Помощь в написании! Посмотреть все курсовые работы

Вы можете узнать стоимость помощи в написании студенческой работы.

Предмет и метод эконометрики. Эконометрические взаимосвязи

Контрольно-курсовая работа

Предмет и метод эконометрики. Эконометрические взаимосвязи

Содержание

1. Эконометрика, предмет и метод

.1 Предмет и метод

.2Эконометрическая модель

.3 Измерения в экономике

. Изучение взаимосвязей в эконометрике

.1 Понятие о взаимосвязях в эконометрике

.2 Метод сопоставления параллельных рядов. Корреляция альтернативных признаков

.3 Метод аналитических группировок

.4 Корреляционно-регрессионный анализ

.4.1 Парная регрессия. Парная корреляция

.4.1.1 Парная линейная регрессия

.4.1.2 Парная линейная корреляция

.4.1.3 Оценка надежности параметров парной линейной регрессии и корреляции

.4.1.4 Парная нелинейная регрессия

.4.1.5 Коэффициенты эластичности в парных моделях

.4.1.6 Парная нелинейная корреляция

.4.1.7 Оценка надежности параметров парной нелинейной регрессии и корреляции

.4.1.8 Прогнозирование на основе парной модели регрессии. Расчет доверительных интервалов для прогнозного значения , параметров уравнения регрессии и коэффициента (индекса) корреляции

.4.2 Множественная регрессия. Множественная корреляция

.4.2.1 Множественная регрессия

.4.2.2 Частные уравнения регрессии

.4.2.3 Множественная корреляция

.4.2.4 Частная корреляция

.4.2.5 Оценка надежности параметров множественной регрессии и корреляции

Литература

1. Эконометрика, предмет и метод

.1 Предмет и метод

Термин «эконометрика» впервые введен в Австро-Венгрии П. Цьемпой. Слово эконометрика это комбинация слов «эконом» и «метрика» т.е. экономика и измерение. Соответственно эконометрика это измерение в экономике.

На данный момент под эконометрикой понимают науку, которая занимается измерением и анализом экономических явлений.

В основу эконометрики положены три основных компонента:

. экономическая теория;

. статистические методы;

. математические методы.

Эконометрика это слияние всех этих трех компонентов, каждый из которых является ее неотъемлемой частью.

В основе метода эконометрики лежат методы статистики, такие как:

. регрессионный анализ;

. корреляционный анализ;

. выделение тренда динамического ряда;

. изучение сезонных и циклических колебаний динамического ряда;

. статистическое оценивание результатов и т.д.

Но так как, эконометрика является эмпирической наукой и решает конкретные экономические задачи, методы эконометрического анализа должны исключать проявление процессов искажающих результаты статистического анализа. К таким процессам относятся:

1. асимметричность связей;

2. мультиколлинеарность переменных;

. гетероскедастичность;

. автокорреляция;

. ложная корреляция;

. наличие лагов и т.д.

1.2 Эконометрическая модель

Эконометрические модели являются главным инструментом в эконометрике. Невозможно, например, абсолютно точно подсчитать спрос на автомобили в следующем году. Но можно, зная основные факторы, влияющие на спрос, построить модель спроса.

Эконометрическая модель - теоретическая модель экономических процессов, которая является средством прогнозирования эмпирических экономических процессов.

В эконометрике используют три класса эконометрических моделей:

1. Модели временных рядов.

2. Регрессионные модели с одним уравнением.

. Системы одновременных уравнений.

Моделью временных рядов называется эконометрическая модель, в которой результативных признак - функция переменной времени, или переменных относящихся к другим моментам времени. К моделям временных рядов относятся:

1. Модель тренда - отражает зависимость результативного признака от трендовой компоненты:

(1)

где:

временной тренд, заданный функцией определенного вида, линейной или нелинейной.

- случайная компонента.

2. Модель сезонности - отражает зависимость результативного признака от сезонной компоненты

(2)

где:

сезонная компонента.

- случайная компонента.

3. Тренда и сезонности - отражает зависимость результативного признака и от трендовой и от сезонной компоненты. Может быть:

аддитивная (дополняющая) модель

, (3)

мультипликативная (множительная) модель

(4)

4. К моделям, отражающим зависимость результативного признака от переменных, относящихся к другим моментам времени относятся:

модель с распределенным лагом - модель, отражающая зависимость результативного признака от предыдущих значений факторных признаков.

модель авторегрессии - модель, отражающая зависимость результативного признака от предыдущих значений результативных признаков.

модели ожидания - модель, отражающая зависимость результативного признака от будущих значений факторных или результативных переменных.

Регрессионной моделью с одним уравнением называется модель, в которой результативный признак представляется в виде функции факторных переменных:

(5)

где

- результативный признак (зависимая переменная).

- факторные признаки (независимые или объясняющие переменные).

Регрессионные модели с одним уравнением в зависимости от вида функции делятся на линейные и нелинейные.

Наиболее часто в экономике используют следующие модели с одним уравнением:

. Функция цены, где цена товара зависит от объема поставки и цен конкурентов :

(6)

. Функция спроса, где величина спроса товара зависит от его цены , от цен конкурентов , и доходов потребителей :

(7)

. Производственная функция, где зависимость объема производства товара зависит от производственных факторов, например затрат капитала и затрат труда :

(8)

Системы одновременных уравнений - модели, которые описываются системами взаимосвязанных регрессионных уравнений.

Системы уравнений могут быть тождественными или поведенческими.

Тождественные системы уравнений состоят из уравнений, вид которых и значения параметров известны.

Поведенческие системы уравнений состоят из уравнений, вид которых и значение параметров требуется оценить, а также уравнения, которые в качестве независимых переменных могут включать, кроме факторных переменных, результативные признаки из других уравнений системы.

К системам одновременных уравнений относится, например, модель спроса и предложения из трех уравнений:

(9)

где

- предложение товара в момент времени .

- спрос на товар в момент времени .

- цена товара в момент времени .

- цена товара в предыдущий момент времени .

- доход потребителя в момент времени .

Системы одновременных уравнений могут включать в себя большое количество уравнений, например, модель Уортона американской экономики, содержит более одной тысячи уравнений, которые решаются одновременно.

1.3 Измерения в экономике

В настоящее время термин «измерение» употребляется в трех значениях:

. Измерение - это получение, сравнение и упорядочение информации. Предполагает сравнение объектов исследования по наличию или отсутствию исследуемого свойства. Данному понятию соответствуют термины «классификация», «нумерация».

. Измерение - это операция, в результате которой получается численное значение величины измеряемого признака. Данному понятию соответствуют термины «шкалирование», «топология», «упорядочение».

. Измерение - измерение с обязательным наличием единицы измерения, т.е. сравнение изучаемых объектов с эталоном. Данному понятию соответствуют термины «измерение», «квантификация».

Измерение, по любому из определений, предполагает наличие шкалы измерения. Различают следующие типы шкал:

номинальная;

порядковая (ранговая, ординальная);

интервальная;

шкала отношений.

Тип шкалы определяется допустимым преобразованием, при котором истинные утверждения не становятся ложными, а ложные утверждения не становятся истинными.

Номинальная шкала

Номинальная шкала - шкала, в которой измерением называется классификация, при которой каждое значение определяет отдельную категорию, т.е. каждая категория «отличается» от других, но это отличие не может быть количественно измерено. Например, нумерация игроков в футбольной команде.

Номинальной шкале присущи только свойства «симметричности» и «транзитивности».

Симметричность - если то и .

Транзитивность - если и то и .

Порядковая (ординальная, ранговая) шкала

Порядковая шкала ранжирует объекты по уровню свойства, т.е. «больше» или «меньше», но не позволяет сказать «на сколько больше» или «на сколько меньше».

Ординальная шкала допускает следующие операции: «равенство-неравенство» и «больше-меньше».

Для порядковой шкалы возможно любое монотонное преобразование.

Среди порядковых шкал большое распространение получили бальные шкалы.

Примерами ординальной шкалы может служить рейтинг популярных песен, успеваемость учеников в школе, оценка силы волн, и т.д.

Интервальная шкала (шкала разностей)

Интервальная шкала - шкала, которая позволяет не только упорядочить объекты по уровню свойства, но и сравнивать между собой разности количеств свойства.

Шкала разностей - интервальная шкала, масштаб в которой зафиксирован. По шкале разностей мы можем сказать, например, что температура воды 100С больше, чем 30С, но и определить разницу в 70С, между двумя значениями.

Шкала разностей допускает следующие операции: «равенство-неравенство» и «больше-меньше», «равенство-неравенство интервалов» и операцию вычитания.

Шкала отношений (пропорциональная шкала)

Шкала отношений - шкала, на которой указан абсолютный ноль. По шкале отношений можно определить во сколько раз величина одного объекта больше другого. Например, используя шкалу температур Кельвина, можно сказать, что 400К по сравнения с 200К не только больше на 200, но и в два раза «горячее».

Шкала отношений допускает следующие операции: «равенство-неравенство интервалов», «больше-меньше» и операции вычитания и деления.

Особенность экономических измерений

Естественно, что измерения в экономике отличаются от измерений в физике или механике. Экономика это так называемая «неточная» наука, так как ей свойственны большие погрешности, чем «точным» наукам.

Экономическим измерениям свойственна более низкая контролируемость их точности, т.к. в естественных науках точность измерения зависит, в основном, от самого измерения, а в экономических измерениях точность кроме самого измерения зависит от:

правильного определения экономической величины и экономического показателя;

формирования системы условий, определяющих точность экономического измерения;

выбора условий соизмеримости показателей;

разработки других специфических условий экономического измерения.

2. Изучение взаимосвязей в эконометрике

.1 Понятие о взаимосвязях. Методы выявления и измерения взаимосвязей

В природе, и тем более в обществе, все явления взаимосвязаны между собой. Урожайность зависит от качества почвы, внесения удобрений, обеспеченности производственными фондами и от многих других факторов; производительность труда от производственных затрат, обеспеченности основными и оборотными фондами и т.д.; среднедневная температура от времени года, местоположения страны удаленности от океана и т.д. Соответственно, что бы прогнозировать, то есть управлять развитием явлений, общественных и природных, необходимо установить связи, существующие между интересующими нас явлениями, их силу, вид, направление и т.д.

Так как, в статистике изучают детерминированность следствия факторами (детерминизм - обусловленность явлений множеством факторов) будем называть признак (явление) характеризующий следствие результативным признаком (зависимым признаком, результатом). Признаки, характеризующие факторы - факторными признаками (независимыми признаками). Результативные признаки принимают то или иное значение под влиянием на них признаков факторных. Соответственно размер результативного признака есть результат влияние на него факторных признаков.

В статистике различают два вида взаимосвязей между явлениями: функциональная и корреляционная.

Функциональная связь - это связь, жестко детерминированная или полная (связь равная единице или 100%), размер результативного признака зависит только от одного фактора, причем каждому конкретному значению факторного признака может соответствовать одно, или несколько четко заданных значений результативного признака.

Строго определить функциональную связь можно, только придав ей математическую формулировку. Функциональной связью является, например, связь вида:

а) , при ,

б) , при , , или

Видно, что величина признака зависит, лишь от признака , причем строго определенным образом.

Но, в мире природы и тем более в обществе функциональных связей не бывает - все явления реального мира взаимосвязаны между собой. И поэтому функциональная связь - это связь абстрактная, упрощающая расчеты, но и упрощающая объективно существующую реальность. Тем не менее, представление о связях как связях функциональных используют такие науки как химия, физика, механика, электротехника и т.д.

Обратная величина функциональной связи - это отсутствие связи (связь между явлениями равна нулю), размер результативного признака совершенно не зависит от какого-то фактора. Отсутствие связи, как и связь функциональная не существует в реальном мире - это также абстрактное понятие, упрощающее расчеты и соответственно реальность.

Корреляционная связь - это связь схоластически детерминированная, неполная. При корреляционной связи каждому значению факторного признака (признаков) соответствует множество значений результативного признака. Корреляционная связь проявляется лишь при большом числе наблюдений, в среднем.

Также различают формы связи:

. прямая связь - с возрастанием величины фактора наблюдается рост величины результата, а при уменьшении величины фактора уменьшение величины результативного признака.

. обратная связь - с увеличением величины фактора величина результативного признака уменьшается, а с уменьшением увеличивается.

Кроме того, по математическому выражению, связи делятся на линейные и нелинейные.

При изучении взаимосвязей общественных явлений используют различные методы, такие как:

. сопоставление параллельных рядов;

. метод аналитических группировок;

. корреляционно-регрессионный анализ;

. и др.

Изучение взаимосвязей позволяет решить следующие задачи:

. определить наличие связи;

. определение формы связи;

. измерение тесноты связи;

. прогнозирование изменения результативного признака под влиянием изменения фактора (факторов).

2.2 Метод сопоставления параллельных рядов. Корреляция альтернативных признаков

Метод сопоставления параллельных рядов является наиболее простым методом исследования взаимосвязей между явлениями.

Данный метод заключается в сопоставлении ранжированного ряда факторного признака с ранжированным рядом результативного признака. Данное сопоставление позволяет определить наличие или отсутствие связи между явлениями, а также ее направление.

Также метод параллельных радов позволяет определить тесноту связи. Для этого рассчитывают коэффициент Фехнера и коэффициент корреляции рангов Спирмена.

Расчет коэффициента Фехнера.

Для расчета данного коэффициента необходимо рассчитать отклонения значений признаков и от их средних значений и , при этом определяют знак отклонений или . Если знаки отклонений у признаков и совпадают, то делается вывод о согласованности вариации, если не совпадают - вариация несогласованна. Формула расчета коэффициента Фехнера:

(10)

где:

С - число совпавших знаков отклонений и

Н - число не совпавших отклонений и

Коэффициент Фехнера может принимать значения от до . В статистике принято считать, что до 0,3 связь слабая, от 0,3 до 0,7 связь средняя, свыше 0,7 связь сильная. Знак плюс показывает, что связь прямая, знак минус - связь обратная.

Необходимо учитывать, что коэффициент Фехнера определяет направление связи, но дает лишь очень грубую оценку ее величины.

Коэффициент корреляции рангов Спирмена

Коэффициент корреляции рангов учитывает согласованность рангов единиц совокупности.

Ранг - номер, который занимает единица совокупности по признакам и .

Формула расчета коэффициента корреляции рангов:

(11)

где: - число единиц совокупности,

- квадрат разности рангов.

Коэффициент корреляции рангов может принимать значения в интервале .

Корреляция альтернативных признаков

В случае, когда имеются противоположные по значению варианты признака, говорят об альтернативном признаке (да, нет). Например, продукция может быть годной или не годной.

Для исследования взаимосвязей между двумя альтернативными признаками, то есть, вариация обоих атрибутивных признаков ограничена двумя группами, используют «тетрахорические показатели». Их расчет основан на использовании определенной расчетной таблицы (табл. 1).

Таблица 1.

II I	+	-
+	a	b
-	c	d

Она состоит из четырех ячеек обозначенных буквами a, b, c, d - частоты, расположенные в I, II, III, IV квадрантах. Знаки и в заголовках столбцов и строк характеризуют наличие или отсутствие альтернативного признака.

К «тетрахорическим показателям» относят:

коэффициент ассоциации Пирсона

коэффициент коллигации Юла

коэффициент контингенции Юла и Кендэла

коэффициент Шарлье и др.

Рассмотрим некоторые из них.

Коэффициент ассоциации Пирсона, данный коэффициент используют для измерения тесноты взаимосвязи надежности и годности. Рассчитывается по формуле:

(12)

Коэффициент коллигации Юла рассчитывается как:

(13)

Данный коэффициент показывает средний размер связи.

Рассмотренные коэффициенты могут принимать значения от до .

Если при измерении связи между качественными показателями образуется более двух групп, для определения тесноты связи используют:

коэффициент взаимной сопряженности Пирсона

коэффициент взаимной сопряженности Чупрова

коэффициент взаимной сопряженности Крамера и. д.р.

Коэффициент взаимной сопряженности Пирсона рассчитывается:

(14)

Коэффициент взаимной сопряженности Чупрова рассчитывается:

(15)

где:

- число групп по первому и второму признаку соответственно.

- показатель взаимной сопряженности

Коэффициент взаимной сопряженности Чупрова целесообразно использовать, когда число групп по каждому признаку одинаково . Если используют коэффициент Крамера.

Показатель взаимной сопряженности рассчитывают, используя вспомогательную таблицу (табл. 2)

Данные подставляют в формулу:

(16)

Таблица 2. Вспомогательная таблица для расчета показателя взаимной сопряженности

y x	I	II	III	Итого
I	…	…
II	…	…
III	…	…

Итого

Коэффициент взаимной сопряженности Крамера рассчитывается:

(17)

где:

- минимальное, из значений и

При значения коэффициентов Чупрова и Крамера совпадают.

Пример 1. По совокупности, состоящей из 27 предприятий, имеются данные о фондовооруженности тыс.руб. и производительности труда тыс.руб. (табл. 3).

Таблица 3.

№	№
1	8,0	3	15	11,1	11
2	8,2	4	16	11,6	9
3	8,3	3	17	11,8	10
4	8,4	6	18	12,0	11
5	8,9	3	19	12,1	12
6	9,2	4	20	12,3	13
7	9,3	6	21	12,5	12
8	9,4	7	22	12,9	12
9	9,7	7	23	13,0	13
10	9,9	9	24	13,2	14
11	10,2	7	25	13,7	15
12	10,3	8	26	13,8	14
13	10,6	9	27	14,0	16
14	10,9	10

Необходимо определить направление и тесноту связи с помощью коэффициента Фехнера и коэффициента корреляции рангов Спирмена.

Решение.. Рассчитаем коэффициент Фехнера.

1. В таблице 4 рассчитаем отклонения значений признаков и от их средних значений - и , определим знак отклонений или и подсчитаем число совпадений (С) и несовпадений (Н) знаков отклонений.

Таблица 4.

№	x	С или Н
1	8,0	3	-2,9	-6,2	С	8,2	4	-2,7	-5,2	С
3	8,3	3	-2,6	-6,2	С
4	8,4	6	-2,5	-3,2	С
5	8,9	3	-2,0	-6,2	С
6	9,2	4	-1,7	-5,2	С
7	9,3	6	-1,6	-3,2	С
8	9,4	7	-1,5	-2,2	С
9	9,7	7	-1,2	-2,2	С
10	9,9	9	-1,0	-0,2	С
11	10,2	7	-0,7	-2,2	С
12	10,3	8	-0,6	-1,2	С
13	10,6	9	-0,3	-0,2	С
14	10,9	10	0,0	0,8	С
15	11,1	11	0,2	1,8	С
16	11,6	9	0,7	-0,2	Н
17	11,8	10	0,9	0,8	С
18	12,0	11	1,1	1,8	С
19	12,1	12	1,2	2,8	С
20	12,3	13	1,4	3,8	С
21	12,5	12	1,6	2,8	С
22	12,9	12	2,0	2,8	С
23	13,0	13	2,1	3,8	С
24	13,2	14	2,3	4,8	С
25	13,7	15	2,8	5,8	С
26	13,8	14	2,9	4,8	С
27	14,0	16	3,1	6,8	С
Среднее	10,9	9,2

. Коэффициент Фехнера будет равен:

Коэффициент Фехнера показывает сильную положительную связь между признаками и .. Рассчитаем коэффициент корреляции рангов Спирмена.

. Назначим ранги для показателя (табл. 5). Для этого ранжируем показатель по возрастанию и определим ранг, который признак занимает в ранжированном ряде.

а) Значение признака равное 3 занимает №1, №2 и №3, соответственно ранг данного значение будет .

б) Значение признака равное 4 занимает №4 и №5, соответственно ранг данного значение будет .

в) Значение признака равное 6 занимает №6 и №7, соответственно ранг данного значение будет .

г) Значение признака равное 7 занимает №8, №9 и №10, соответственно ранг данного значение будет .

д) Значение признака равное 8 занимает №11, соответственно ранг данного значение будет .

е) Значение признака равное 9 занимает №12, №13 и №14, соответственно ранг данного значение будет .

ж) Значение признака равное 10 занимает №15 и №16, соответственно ранг данного значение будет .

з) Значение признака равное 11 занимает №17 и №18, соответственно ранг данного значение будет .

и) Значение признака равное 12 занимает №19, №20 и №21, соответственно ранг данного значение будет .

к) Значение признака равное 13 занимает №22 и №23, соответственно ранг данного значение будет .

л) Значение признака равное 14 занимает №24 и №25, соответственно ранг данного значение будет .

м) Значение признака равное 15 занимает №26, соответственно ранг данного значение будет .

н) Значение признака равное 16 занимает №27, соответственно ранг данного значение будет .

Таблица 5

№	по возрастаниюранг признака
1	3
2	3
3	3
4	4
5	4
А	1	2
6	6
7	6
8	7
9	7
10	7
11	8
12	9
13	9
14	9
15	10
16	10
17	11
18	11
19	12
20	12
21	12
22	13
23	13
24	14
25	14
26	15
27	16

2. Назначим ранги для показателя ранжированием по порядку возрастания - 1; 2; 3; . . . 27 (табл. 6).

Далее в таблице 6 проставим ранги признаков и , рассчитаем разности рангов , квадраты разности рангов и сумму квадратов разностей рангов (табл. 5).

Таблица 6

№
1	8,0	3	1	2,0	1,0	1,00
2	8,2	4	2	4,5	2,5	6,25
3	8,3	3	3	2,0	-1,0	1,00
4	8,4	6	4	6,5	2,5	6,25
5	8,9	3	5	2,0	-3,0	9,00
6	9,2	4	6	4,5	-1,5	2,25
7	9,3	6	7	6,5	-0,5	0,25
8	9,4	7	8	9,0	1,0	1,00
9	9,7	7	9	9,0	0,0	0,00
10	9,9	9	10	13,0	3,0	9,00
11	10,2	7	11	9,0	-2,0	4,00
12	10,3	8	12	11,0	-1,0	1,00
13	10,6	9	13	13,0	0,0	0,00
14	10,9	10	14	15,5	2,25
15	11,1	11	15	17,5	2,5	6,25
16	11,6	9	16	13,0	-3,0	9,00
17	11,8	10	17	15,5	-1,5	2,25
18	12,0	11	18	17,5	-0,5	0,25
19	12,1	12	19	20,0	1,0	1,00
20	12,3	13	20	22,5	2,5	6,25
21	12,5	12	21	20,0	-1,0	1,00
22	12,9	12	22	20,0	-2,0	4,00
23	13,0	13	23	22,5	-0,5	0,25
24	13,2	14	24	24,5	0,5	0,25
25	13,7	15	25	26,0	1,0	1,00
26	13,8	14	26	24,5	-1,5	2,25
27	14,0	16	27	27,0	0,0	0,00
Итого						77,00

. Рассчитаем коэффициент корреляции рангов

Связь сильная.

Пример 2. Имеются данные о количестве торговых точек, сгруппированных по уровню средней прибыли и уровню квалификации продавцов в разных торговых точках (табл. 7).

Определить тесноту связи, через коэффициенты взаимной сопряженности.

Решение.

Рассчитаем показатель взаимной сопряженности непосредственно в таблице, используя формулу:

. Рассчитаем коэффициент Пирсона.

и из полученного значения (значение находится в нижнем правом углу таблицы) вычтем единицу:

. Так как рассчитаем коэффициент Чупрова:

Коэффициент Чупрова всегда меньше чем коэффициент Пирсона.

. Коэффициент взаимной сопряженности Крамера:

Так как значения коэффициентов Чупрова и Крамера совпадают.

Таблица 7.

Средняя прибыль Квалификация

Низкая

Средняя

Высокая

Итого

Низкий

Средний

Высокий

Итого

Пример 3. Группа предприятий, исследованная по влиянию на прибыль новой маркетинговой схемы, разделена на две подгруппы по надою.

Таблица 8

Схема Прибыль	Переведены на новую схему	Не переведены
Прибыль увеличилась	230 (а)	84 (b)
Прибыль не увеличилась	99 (c)	210 (d)

Рассчитаем коэффициент ассоциации Пирсона:

Полученное значение показывает среднюю, прямую связь между исследуемыми признаками.

Рассчитаем коэффициент коллигации Юла:

Полученное значение показывает, что средняя связь между исследуемыми признаками прямая, средняя.

2.3 Метод аналитических группировок

Этот метод позволяет определить взаимосвязи между двумя и более признаками.

В ходе построения аналитической группировки необходимо решить следующие вопросы:

1. выбор факторных признаков

2. определение числа групп

. оценка линии регрессии

. измерения тесноты связи

Выбор факторных признаков

Выбор основывается на всестороннем анализе изучаемого явления, экономической теории, опыте и знаниях исследователя и т.д.

Определение числа групп

В принципе, чем больше число групп, тем точнее будет описана линия регрессии, но в месте с тем снижается точность расчета средних.

В данном вопросе необходимо, что бы увеличение числа групп, для более точного описания линия регрессии, не привело к утрате закономерного характера линии регрессии, из-за малочисленности групп.

Границы интервалов групп определяют, выделяя основные типы изучаемых явлений. При расчете величин интервалов возможно использование следующей формулы предложенной американским ученым Стерджессом.

(18)

где:

- максимальное значение признака в совокупности

- минимальное значение признака в совокупности- число единиц в совокупности.

При разбиении изучаемой совокупности рекомендуется соблюдение принципа равных частот, т.е. образование групп с примерно одинаковой численностью единиц.

Оценка линии регрессии

Оценка линии регрессии в данном случае основывается на вычислении среднего значения признака для интервала значений признака .

В качестве группировочного признака, как правило, используется факторный признак.

Показатель, характеризующий влияние факторного признака на результативный признак называется показателем силы связи , который показывает, на сколько единиц изменится результативный признак, если факторный увеличится на одну единицу.

Если связь между признаками нелинейная, то есть, существенно изменяется при переходе от одной группе к другой, рассчитывается как:

(19)

Так, например, если совокупность разбита на четыре группы, рассчитывают

); 2) ; 3)

где:

- средне-групповые значения результативного признака.

- средние значения (или середины интервалов) факторного признака.

Для группировочного признака, среднюю величину находят как середину интервала.

В случае линейной связи важным показателем является поазатель средней силы связи .

(20)

где:

- средние значения результативного признака в последней и первой группах соответственно;

- середины интервалов (или средние значения) факторного признака в последней и первой группах.

Измерение тесноты связи

Измерение тесноты связи в аналитических группировках основано на правиле сложения дисперсий - общая дисперсия всегда равна сумме средней внутригрупповой и межгрупповой дисперсий:

(21)

где:

- общая дисперсия, характеризует вариацию признака во всей совокупности, сложившуюся под влиянием всех факторов и условий:

или (22)

где - общая средняя.

- средняя внутригрупповая дисперсия, оценивает вариацию признака, сложившуюся по влиянием других, неучтенных в данном исследовании факторов и независящую от фактора группировки. Она определяется как средняя из групповых дисперсий:

или (23)

- внутригрупповая (случайная) дисперсия,

или (24)

где - групповая средняя.

- межгрупповая (систематическая) дисперсия, измеряет систематическую вариацию, обусловленную влиянием фактора, по которому произведена группировка:

эконометрика корреляция коэффициент модель

(25)

Показателем тесноты связи между признаками в аналитической группировке служит корреляционное отношение:

(26)

Корреляционное отношение может принимать значения от 0 до 1. Принято считать, что до 0,3 связь слабая, от 0,3 до 0,7 связь средняя, свыше 0,7 связь сильная. Чем больше корреляционное отношение, тем больше фактор, положенный в основание группировки, оказывает влияние на общую вариацию результативного признака, то есть они более тесно взаимосвязаны.

Квадрат корреляционного отношения - коэффициент детерминации:

(27)

Показывает долю вариации результативного признака обусловленную включенным в модель фактором.

Пример 4. В таблице 9 приведены значения факторного признака - затраты на рекламу млн.руб. и результативного признака - прибыль млн. руб. и число предприятий в каждой группе .

Таблица 9.

Затраты на рекламу в месяц млн.руб. Число предприятий, Средняя прибыль за месяц млн. руб.
0,08-0,12	10	23,56
0,12-0,16	15	25,20
0,16-0,20	8	29,80
0,20-0,24	5	36,50

Необходимо рассчитать показатели силы связи.

Решение.

Рассчитаем среднее значение фактора как середину интервала, и изменение средней прибыли при переходе от одной группы к другой . Результаты занесем в таблицу 10.

Таблица 10

Затраты на рекламу в месяц млн.руб. Число предприятий, Средняя прибыль за месяц млн.руб. Середина интервала млн.руб. Изменение средней прибыли млн.руб.
0,08-0,12	10	23,56	0,10	-
0,12-0,16	15	25,20	0,14	1,64
0,16-0,20	8	29,80	0,18	4,60
0,20-0,24	5	36,50	0,22	6,70

Изменение средней прибыли имеет существенные отличия при переходе от одной группы к другой, соответственно связь меду признаками нелинейная. Необходимо рассчитывать несколько показателей силы связи характеризующих взаимосвязи при переходе от одной группы к другой.

1);

Это значит, что при увеличении затрат на рекламу от 0,08 до 0,16 млн. руб. средняя прибыль будет увеличиваться в среднем на 41 руб. на каждый дополнительно потраченный на рекламу рубль.

) ;

Это значит, что при увеличении затрат на рекламу от 0,16 до 0,20 млн. руб. средняя прибыль будет увеличиваться в среднем на 115 руб. на каждый дополнительно потраченный на рекламу рубль.

) .

Это значит, что при увеличении затрат на рекламу от 0,20 до 0,24 млн. руб. средняя прибыль будет увеличиваться в среднем на 167,5 руб. на каждый дополнительно потраченный на рекламу рубль.

Различия между показателями силы связи обусловлены тем, что сила влияния затрат на прибыль не постоянна, она возрастает при переходе от одной группы к другой.

Пример 5. По данным табл. 10 необходимо рассчитать показатели силы связи.

Таблица 11

Затраты на рекламу в месяц млн.руб.Число предприятий, Средняя прибыль за месяц млн.руб.Середина интервала млн.руб.Изменение средней прибыли млн.руб.
0,08-0,12	10	23,56	0,10	-
0,12-0,16	15	25,20	0,14	1,64
0,16-0,20	8	26,86	0,18	1,66
0,20-0,24	5	28,51	0,22	1,65

Решение.

Изменения отличаются не существенно, то есть связь между признаками линейная, рассчитаем показатель средней силы связи.

Это значит, что для всей совокупности, увеличение затрат на рекламу в среднем увеличит среднюю прибыль на 41,25 руб. на каждый дополнительно затраченный рубль.

Пример 6. Имеются данные о средней прибыли на отдельных торговых точках и профессиональном разряде продавцов (табл. 11)

Таблица 12

Разряд Средняя прибыль тыс.руб. Число точек.

РазрядСредняя прибыль тыс.руб. Число точек.


I	60	5	I	65	3
I	68	7	I	68	4
II	67	4	II	74	5
II	75	3	II	67	4
II	71	5	II	72	3
I	70	5	II	69	4

1. Рассчитаем общую дисперсию выборки (табл. 13):

Таблица 13

№ Средняя прибыль тыс.руб. Число точек.



1	60	5	-8,673077	75,222265	376,111323
2	68	7	0,453033	3,171229
3	67	4	-1,673077	2,799187	11,196747
4	75	3	6,326923	40,029955	120,089864
5	71	5	2,326923	5,414571	27,072853
6	70	5	1,326923	1,760725	8,803623
7	65	3	-3,673077	13,491495	40,474484
8	68	4	-0,673077	0,453033	1,812131
9	74	5	5,326923	28,376109	141,880543
10	67	4	-1,673077	2,799187	11,196747
11	72	3	3,326923	11,068417	33,205250
12	69	4	0,326923	0,106879	0,427515
Итого		52			775,44231
Среднее	68,673077				14,912352

. Рассчитаем дисперсию для каждой группы:

Таблица 14

№ Средняя прибыль тыс.руб. Число точек.



1	60	5	-6,375000	40,640625	203,203125
2	68	7	1,625000	2,640625	18,484375
3	70	5	3,625000	13,140625	65,703125
4	65	3	-1,375000	1,890625	5,671875
5	68	4	1,625000	2,640625	10,562500
Итого		24			303,625000
Среднее	66,375				12,651042

а) Группа с разрядом - I (табл. 14)

Таблица 15.

№ Средняя прибыль тыс.руб. Число точек.



1	67	4	-3,642567	13,268294	53,073177
2	75	3	4,357433	18,987222	56,961667
3	71	5	0,357433	0,1277583	0,6387917
4	74	5	3,357433	11,272356	56,361782
5	67	4	-3,642567	13,268294	53,073177
6	72	3	1,357433	1,8426243	5,527873
7	69	4	-1,642567	2,6980263	10,792105
Итого		28			236,42857
Среднее	70,642567				8,4438776

б) Группа с разрядом равным II (табл. 15)

. Рассчитаем среднюю внутригрупповую дисперсию:

4. Найдем межгрупповую дисперсию.

Проверим через правило сложения дисперсий

. Рассчитаем корреляционное отношение:

То есть, фактор, положенный в основу группировки (разряд) оказывает среднее влияние на результат (среднюю прибыль).

. Рассчитаем детерминационное отношение

То есть вариация результативного признака на % обусловлена влиянием фактора - разряд продавца.

2.4 Корреляционно-регрессионный анализ

Основные понятия

Корреляция - взаимосвязь между признаками, заключается в изменении средней величины результативного признака в зависимости от значения фактора (факторов).

Регрессия - функция, позволяющая по величине одного корреляционно связанного признака вычислять средние значения другого.

Корреляция, регрессия парная - корреляция, регрессия между двумя признаками: результативным и факторным .

Корреляция, регрессия множественная - взаимосвязь между несколькими признаками (тремя и более), один из которых является результативным признаком , другие факторными признаками .

Корреляция линейная - корреляционная зависимость между признаками носящая линейный характер.

Корреляция нелинейная - корреляционная зависимость между признаками не носит линейный характер, а выражена соответствующей кривой - парабола, гипербола, экспонента, показательная функция и т.д.

Регрессия линейная - регрессионная функция, выраженная уравнение прямой.

Регрессия нелинейная - регрессионная функция выражена соответствующей нелинейной функцией - парабола, гипербола, экспонента, показательная функция и т.д.

Парная корреляционно-регрессионная модель строится для изучения взаимосвязи между результативным признаком и одним фактором . Применяется в случае доминирующего влияния на результат лишь одного фактора, остальные факторы оказывают на результат несущественное влияние. Модель парной регрессии имеет вид: .

Множественная корреляционно-регрессионная модель применяется, когда необходимо изучить влияние на результативный признак не одного, а нескольких факторных признаков. Множественная модель регрессии имеет вид:

2.4.1 Парная регрессия. Парная корреляция

Если предполагается, что величина результативного признака сложилась, в основном, под влиянием лишь одного факторного признака , при исследовании взаимосвязей между ними используют парную модель функции регрессии.

(28)

Для того чтобы, построить парную корреляционно-регрессионную модель необходимо решить следующие задачи:

1. отбор фактора,

2. спецификация модели (выбор вида функции регрессии).

Отбор фактора в модель парной регрессии

Фактор, который будет использован в парной модели, должен отвечать следующим требованиям: его влияние на результат должно быть таким, что влиянием всех остальных факторов можно пренебречь, но он не должен находиться в функциональной зависимости с результатом.

Число наблюдений фактора должно превышать число параметров при переменной в 6-7 раз. Так для модели вида необходимо не менее 6-7 наблюдений, а для модели потребуется не менее 12-14 наблюдений.

Спецификация модели парной регрессии

В парной регрессии используют линейные и нелинейные функции:

- линейная функция

- полином второй степени

- полином третьей степени и т.д.

- равносторонняя гипербола

- степенная функция

- показательная функция и т.д.

Выбор вида функции в модели парной регрессии может быть осуществлен следующими методами:

1. Графический метод. В его основу положено построение и исследование графика «корреляционное поле», на основании которого делается вывод о виде функции описывающей взаимосвязь между явлениями.

2. Аналитический метод. Опирается на изучение природы взаимосвязи между исследуемыми явлениями.

3. Экспериментальный метод. Вид функции подбирается экспериментально через анализ качества подбора функции, путем сравнения остаточной дисперсии рассчитанной для разных моделей.

2.4.1.1 Парная линейная регрессия

Парная линейная регрессия наиболее часто применяется в регрессионных моделях, в силу простоты расчета и интерпретирования результатов.

Расчет регрессионной модели данного вида заключается в нахождении уравнения вида:

(29)

или (30)

где;

- теоретическое значение результативного признака, рассчитанное по уравнению регрессии, показывающему взаимосвязь между и.

- фактическое значение результативного признака.

- случайная величина (возмущение, шум)

(31)

Показывает влияние не учтенных в модели факторов, а также случайных ошибок.

- параметры уравнения.

Решение уравнения регрессии заключается в расчете его параметров. Наибольшее распространение из методов расчета параметров уравнения получил метод наименьших квадратов (МНК). МНК позволяет получать такие значения , которые минимизируют сумму квадратов отклонений фактических значений от теоретических .

(32)

При расчете параметров уравнения при помощи МНК необходимо решить систему из двух нормальных уравнений.

(33)

Также используют и готовые уравнения.

Для расчета параметра :

; так как получим:

или (34)

где: (35)

(36)

Для расчета параметра :

(37)

Параметр - это теоретическое значение результативного признака при и только в этом случае имеет экономический смысл, если параметр экономического смысла не имеет. В геометрическом представлении означает координату точки пересечения линии регрессии с осью ординат.

Параметр называется коэффициентом регрессии. Коэффициент регрессии показывает, на сколько единиц, в среднем изменится результативный признак, если факторный признак увеличится на одну единицу. Например, если уравнение регрессии имеет вид:

где прибыль млн. руб. в месяц, а затраты на маркетинг тыс. руб. в месяц. Можно сказать, что при дополнительных затратах на маркетинг на 1 тыс. руб. прибыль в среднем возрастет на 0,02 млн. руб.

Геометрически это тангенс угла наклона прямой регрессии .

Пример 7. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли (табл. 21).

Построить линейное уравнение регрессии.

Таблица 21.

№
1	37,8	0,3
2	38,0	0,5
3	39,0	0,7
4	37,5	0,8
5	39,5	0,9
6	36,8	1,1
7	40,0	1,3
8	40,1	1,6
9	40,0	1,7
10	39,0	2,2
11	38,0	2,5
12	41,0	2,6
13	41,6	2,7
14	41,0	3,0
15	41,9	3,2

Решение. Для расчета параметров уравнения регрессии используем МНК. МНК в данном случае дает систему уравнений:

. Рассчитаем, в таблице 22, все возможные значения и подставим в систему.

После подстановки данных получим систему:

) Решим систему методом исключения параметра . Для этого первое уравнение разделим на 15, а второе на 25,10.

Далее из второго уравнения вычтем первое

Рассчитаем коэффициент регрессии:

Подставим значение в первое уравнение системы и рассчитаем параметр .

Таблица 22

№
1	37,80	0,30	0,09	11,34	37,792344
2	38,00	0,50	0,25	19,00	38,028410
3	39,00	0,70	0,49	27,30	38,264476
4	37,50	0,80	0,64	30,00	38,382510
5	39,50	0,90	0,81	35,55	38,500543
6	36,80	1,10	1,21	40,48	38,736609
7	40,00	1,30	1,69	52,00	38,972676
8	40,10	1,60	2,56	39,326775
9	40,00	1,70	2,89	68,00	39,444808
10	39,00	2,20	4,84	85,80	40,034974
11	38,00	2,50	6,25	95,00	40,389074
12	41,00	2,60	6,76	106,60	40,507107
13	41,60	2,70	7,29	112,32	40,625140
14	41,00	3,00	9,00	123,00	40,979240
15	41,90	3,20	10,24	134,08	41,215306
Сумма	591,20	25,10	55,01	1004,63	591,199993
В среднем	39,413333	1,673333	3,667333	66,975333
1,5187130,9312833,32715838,874862
2,3064890,86728911,0699801511,254918

2. Рассчитаем параметры уравнения , используя готовые уравнения.

Небольшие расхождения в расчете параметров разными методами объясняются ошибками округления.

Подставим полученные значения (возьмем значения полученные в Microsoft Excel, как наиболее точные. см. далее ) в уравнение регрессии .

Коэффициент парной линейной регрессии показывает, что при увеличении фактора - «затраты на рекламу» на 1 единицу (1 млн. руб.), результат - «средняя прибыль» увеличится, в среднем на 1,180332 млн. руб.

Далее подставляя значения фактора в уравнение регрессии, рассчитаем теоретические значения , занесем их в последний столбик таблицы 22.

) Рассмотрим решение данной задачи в Microsoft Excel.

Первое. В новой книге Microsoft Excel внесем исходные данные (рис 1).

Рисунок 1.

Далее нажимаем кнопку Сервис и в открывшейся панели нажимаем кнопку Анализ данных.

В панели Анализ данных нажимаем Регрессия:

В панели регрессия вводим входной интервал , выделяя столбик, содержащий данные результативного признака, и входной интервал , выделяя столбик, содержащий данные фактора. Ответ можно поместить на новом рабочем листе, в новой рабочей книге, или на листе, содержащем условия выбирая выходной интервал, для чего указываем графа-клетку начала размещения ответа (рис 2).

Рисунок 2.

Нажимаем ОК. Появится таблица, содержащая результаты регрессионного анализа (рис 3).

Рисунок 3.

Параметр в данной таблице находится на пересечении столбика «Коэффициенты» и строки «Y-пересечение», параметр - на пересечении столбика «Коэффициенты» и строки «Переменная Х1».

2.4.1.2 Парная линейная корреляция

Простейшим методом определения наличия и формы взаимосвязи является построения корреляционной таблицы и графика «корреляционное поле».

Корреляционная таблица - таблица, в которой записываются частоты сочетаний результативного и факторного показателей. В настоящее время корреляционная таблица не используется для вычисления уравнения связи.

Пример 8. Имеются данные о себестоимости единицы продукции (руб.) и затратах на рекламу (млн. руб.) (табл. 23).

Таблица 23.

210210220200240200210220210220240200

305050407030407030606030

Составим корреляционную таблицу (табл. 24).

Таблица 24.

y x	200	210	220	240	Итого
30	2	2			4
240	1	1			2
50		1	1		2
60			1	1	2
70			1	1	2
Итого	3	4	3	2	12

По корреляционной таблице можно сделать следующие выводы. Если и распложены по возрастанию, то расположение частот около диагонали таблицы слева вниз направо говорит о прямой форме связи, если по диагонали вверх направо, то связь обратная. Если частоты находятся равномерно по всей таблицы - связь слабая.

Корреляционное поле (графический метод изучения взаимосвязей) - точечный график, характеризующий единицу наблюдения по двум признакам. Факторный признак откладывается по оси абсцисс, результативный признак по оси ординат.

По данным примера 8 построим корреляционное поле (рис. 4).

Рисунок 4

Анализ корреляционного поля показывает, что имеется прямая связь.

Если связь между признаками обратная, то корреляционное поле будет иметь примерно такой вид (рис. 5).

Рисунок 5

Если корреляционное поле имеет следующий вид (рис. 6) можно сделать вывод об отсутствии выраженной взаимосвязи.

Рисунок 6

Корреляционная таблица и корреляционное поле показывают лишь наличие, отсутствие и направление связи. Но они не дают представления о тесноте, интенсивности связи между признаками.

Тесноту связи в парной линейной модели определяют, рассчитывая линейный коэффициент парной корреляции или просто коэффициент корреляции. Существуют формулы расчета:

(38)

или (39)

где: - коэффициент регрессии;

- среднее квадратическое значение факторного признака;

- среднее квадратическое значение результативного признака;

(40)

где - сумма квадратов отклонений обусловленная влиянием фактора ;

- общая сумма квадратов отклонений признака .

Коэффициент корреляции также можно рассчитать через значение признаков в стандартизованном масштабе:

(41)

где: - значения признаков в стандартизованном масштабе.

(42)

(43)

Коэффициент корреляции может принимать значения от до . В статистике говорят, что если значения коэффициента парной корреляции:

меньше 0,3 (-0,3)  связь положительная (отрицательная) слабая;

от 0,3 до 0,7 (от -0,3 до -0,7)  связь положительная (отрицательная) средняя;

свыше 0,7 (-0,7) связь положительная (отрицательная) сильная;

равен 1 (-1) связь функциональная положительная (отрицательная);

равен 0 - связь отсутствует.

Другой показатель тесноты связи - коэффициент парной детерминации. Он показывает часть вариации результативного признака, которая сложилась под влиянием включенного в парную модель фактора. Коэффициент парной детерминации рассчитывают, возводя в квадрат коэффициент парной корреляции или по формуле:

(44)

Коэффициент парной детерминации позволяет определять тесноту связи не только в линейных, но и в нелинейных моделях.

Коэффициент парной детерминации может принимать значения от до .

Пример 9. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли (табл. 25).

Таблица 25.

№
1	37,80	0,30
2	38,00	0,50
3	39,00	0,70
4	37,50	0,80
5	39,50	0,90
6	36,80	1,10
7	40,00	1,30
8	40,10	1,60
9	40,00	1,70
10	39,00	2,20
11	38,00	2,50
12	41,00	2,60
13	41,60	2,70
14	41,00	3,00
15	41,90	3,20
Сумма	591,20	25,10
В среднем	39,413333	1,673333
1,5187130,931283

Рассчитать коэффициент парной линейной корреляции и коэффициент парной линейной регрессии .

Решение.

) Так, как из примера 7 известно, что уравнение регрессии используем формулу:

Коэффициент парной корреляции показывает, что между исследуемыми признаками существует тесная положительная связь.

Возведя коэффициент корреляции в квадрат, получим коэффициент детерминации.

Коэффициент детерминации показывает, что 52% от всей вариации результативного признака обусловлено влиянием включенного в модель фактора, а 48% вариации вызвано влиянием всех остальных, не исследуемых в данной модели факторами.

) Рассмотрим решение данной задачи в Microsoft Excel.

В новой книге Microsoft Excel внесем исходные данные (рис 7).

Далее нажимаем кнопку Сервис и в открывшийся панели нажимаем кнопку Анализ данных

В панели Анализ данных нажимаем корреляция:

В панели корреляция вводим входной интервал, выделяя все столбики, содержащий и данные результативного признака и данные фактора. Ответ можно поместить на новом рабочем листе, в новой рабочей книге, или на листе, содержащем условия выбирая выходной интервал, для чего указываем графа-клетку начала размещения ответа (рис. 7).

Рисунок 7.

Нажимаем ОК.

Появится таблица парных линейных коэффициентов корреляции (рис. 8).

Рисунок 8.

На пересечении столбца 1 и столбца 2 и будет искомый коэффициент парной линейной корреляции.

2.4.1.3 Оценка надежности уравнения парной линейной регрессии, его параметров и коэффициента парной линейной корреляции

Результаты корреляционно-регрессионного анализа необходимо проверить, проведя оценку существенности, как уравнения регрессии, так и его параметров и коэффициента корреляции.

Оценка существенности уравнения регрессии в целом проводится с помощью критерия Фишера - F-критерия.

При этом исходят из представления, что если между изучаемыми признаками и есть связь и уравнение парной линейной регрессии эту связь отражает, то вариация результативного признака , обусловленная влиянием факторного признака (факторная вариация) должна быть в несколько раз больше, чем вариация результативного признака, вызванная всеми другими факторами (остаточная вариация).

Для этого вначале проводят исследование дисперсии.

Общую сумму квадратов отклонений раскладывают на две части - «факторную» и «остаточную».

(45)

где: - общая сумма квадратов отклонений;

- факторная сумма квадратов отклонений;

- остаточная сумма квадратов отклонений.

Разделив каждую сумму квадратов отклонений на соответствующее число степеней свободы ( для общей суммы, для факторной и для остаточной) получим дисперсию на одну степень свободы - .

(46)

(47)

(48)

Для расчета F-критерия сопоставим факторную и остаточную дисперсию;

(49)

Также F-критерий можно рассчитать по формуле:

(50)

Оценку существенности уравнения регрессии проводят, сравнивая полученное значение F-критерия () с табличным значением (), которое берут из таблиц критических значений F-отношений при определенном уровне значимости, как правило: или , и числе свободы: , (таблицы Снедекора-Фишера - приложение 2).

Если то уравнение регрессии значимо, если меньше незначимо.

Значимость параметров уравнения и коэффициента корреляции проверяют при помощи критерия Стьюдента - t-критерия.

Критерий Стьюдента для коэффициента регрессии рассчитывается как;

(51)

где; - коэффициент регрессии.

- стандартная ошибка коэффициента регрессии, рассчитывается как:

(52)

Учитывая, что

(53)

Критерий Стьюдента для параметра рассчитывается как;

(54)

где: - свободный член уравнения регрессии.

- стандартная ошибка параметра , рассчитывается как:

(55)

или (56)

Критерий Стьюдента для коэффициента корреляции рассчитывается как;

(57)

или (58)

где: - коэффициент парной линейной корреляции.

- стандартная ошибка коэффициента корреляции, рассчитывается как:

(59)

Кроме того, для парной линейной регрессии верно, что:

(60)

Полученные фактические значения критерия Стьюдента сравнивают с табличными значениями при определенном уровне значимости , или , и числе степеней свободы (приложение 1), где - число единиц наблюдения, - число параметров уравнения регрессии. Если фактическое значение больше табличного соответствующий коэффициент статистически значим.

Пример 10. По данным примера 7 и примера 9 провести оценку существенности полученного уравнения регрессии , его параметров , и коэффициента корреляции .

Решение.

. Оценка статистической значимости функции регрессии проводится при помощи критерия Фишера - F-критерия.

Рассчитаем для парной линейной регрессии . Расчет проведем по формуле:

Далее фактическое значение необходимо сравнить с табличным значением. Табличное значение берется из таблиц значения Фишера при разных уровнях значимости (приложение 2). При и числе степеней свободы , , . Так как , можно сказать, что уравнение регрессии статистически значимо.

. Оценка статистической значимости параметров уравнения регрессии и коэффициента парной линейной корреляции проводится при помощи критерия Стьюдента - t-критерия.

Для расчета критерия Стьюдента составим таблицу 26.

Таблица 26

№
1	37,80	0,30	0,09	37,792344	0,000059	1,886044
2	38,00	0,50	0,25	38,028410	0,000807	1,376710
3	39,00	0,70	0,49	38,264476	0,540996	0,947377
4	37,50	0,80	0,64	38,382510	0,778824	0,762711
5	39,50	0,90	0,81	38,500543	0,998914	0,598044
6	36,80	1,10	1,21	38,736609	3,750454	0,328711
7	40,00	1,30	1,69	38,972676	1,055395	0,139378
8	40,10	1,60	2,56	39,326775	0,597877	0,005378
9	40,00	1,70	2,89	39,444808	0,308238	0,000711
10	2,20	4,84	40,034974	1,071171	0,277378
11	38,00	2,50	6,25	40,389074	5,707675	0,683378
12	41,00	2,60	6,76	40,507107	0,242944	0,858712
13	41,60	2,70	7,29	40,625140	0,950352	1,054045
14	41,00	3,00	9,00	40,979240	0,000431	1,760045
15	41,90	3,20	10,24	41,215306	0,468806	2,330712
Сумма	591,20	25,10	55,01	591,199992	16,472942	13,009333
В среднем		1,673333

Фактически критерий Стьюдента для коэффициента регрессии рассчитывается как;

Значение стандартных ошибок , можно взять из результатов регрессионного анализа в Microsoft Excel - рисунок 3, столбец - стандартная ошибка.

Фактический критерий Стьюдента для свободного члена уравнение регрессии рассчитывается как:

Фактически критерий Стьюдента для коэффициента корреляции рассчитывается как;

Также верно, что

Полученные фактические критерии Стьюдента с табличным значением (приложение 1) при определенном уровне значимости и числе степеней свободы . Если фактические значения t-критерия превышают табличные можно принять, что соответствующее расчетное значение статистически значимо.

Для данного примера табличное значение, при и составит . Все фактические значения t-критерия превышают табличные. Можно сделать вывод о статистической значимости параметров уравнения регрессии и коэффициента парной линейной корреляции для парной линейной регрессии выраженной уравнением .

) Расчет фактического критерия Фишера и критерия Стьюдента в Microsoft Excel.

Фактические значения критериев Фишера и Стьюдента представлены в итоговой таблице, содержащей результаты регрессионного анализа - пример 7, рис. 3.

Критерий Фишера расчетный обозначен в столбике F дисперсионного анализа, t-критерии для параметров уравнения в столбике t-статистика.

2.4.1.4 Парная нелинейная регрессия

Естественно, что кроме линейных взаимосвязей между явлениями природы, и тем более общественного мира существуют связи нелинейные. Соответственно изучать нелинейные связи при помощи линейной регрессии было бы не верно, для этого необходимо использовать нелинейные регрессии.

Но использование нелинейных регрессий связанно следующим ограничением - так как, параметры уравнения регрессии находят при помощи МНК, решая систему нормальных уравнений, а этот метод позволяет оценивать параметры или линейных уравнений или уравнений приводимых к линейному виду, то выбор нелинейных регрессий ограничен - должна существовать возможность линеаризации данных функций.

Регрессии, приводимые к линейному виду, подразделяют на два класса:. нелинейные относительно включенного в модель фактора (независимой переменной), но линейны относительно результата (зависимой переменной).

К первому классу относятся такие функции как, например:

полиномы разных степеней;

- полином второй степени

- полином третьей степени и т.д.

равносторонняя гипербола: .. нелинейные относительно включенного в модель результата, но линейны относительно фактора.

Ко второму классу относятся такие функции как, например:

степенная функция: .

показательная: .

экспоненциальная: .

Рассмотрим линеаризацию наиболее часто применяемых функций.

Линеаризация полиномов разных степеней

Проводится следующим образом.

В параболе второй степени,

(61)

заменяя переменные , получим двухфакторное линейное уравнение регрессии:

(62)

В параболе третьей степени,

(64)

заменяя переменные , получим трехфакторное линейное уравнение регрессии:

(65)

Аналогичным образом поступим с полиномами более высоких порядков.

Из полиномов наибольшее распространение получила парабола второго порядка.

МНК для оценки параметров функция регрессии по линеаризованной параболе второго порядка дает следующую систему уравнений:

(66)

Пример 11. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятиях сферы торговли. Рассчитать функцию регрессии параболы второго порядка

Таблица 27

№
1	37,8	0,3
2	38,0	0,5
3	39,0	0,7
4	37,5	0,8
5	39,5	0,9
6	36,8	1,1
7	40,0	1,3
8	40,1	1,6
9	40,0	1,7
10	39,0	2,2
11	38,0	2,5
12	41,0	2,6
13	41,6	2,7
14	41,0	3,0
15	41,9	3,2

Решение. МНК для расчета параметров параболы второго порядка дает систему уравнений:

В таблице 28 рассчитаем все возможные значения:

Таблица 28

№
1	37,80	0,30	0,09	0,027	0,0081	11,34	3,402	38,023560
2	38,00	0,50	0,25	0,125	0,0625	19,00	9,500	38,158005
3	39,00	0,70	0,49	0,343	0,2401	27,30	19,110	38,307508
4	37,50	0,80	0,64	0,512	0,4096	30,00	24,000	38,387907
5	39,50	0,90	0,81	0,729	0,6561	35,55	31,995	38,472071
6	36,80	1,10	1,21	1,331	1,4641	40,48	44,528	38,651694
7	40,00	1,30	1,69	2,197	2,8561	52,00	67,600	38,846375
8	40,10	1,60	2,56	4,096	6,5536	64,16	102,656	39,166634
9	40,00	1,70	2,89	4,913	8,3521	68,00	115,600	39,280917
10	39,00	2,20	4,84	10,648	23,4256	85,80	188,760	39,908803
11	38,00	2,50	6,25	15,625	39,0625	95,00	237,500	40,330713
12	41,00	2,60	6,76	17,576	45,6976	106,60	277,160	40,478879
13	41,60	2,70	7,29	19,683	53,1441	112,32	303,264	40,630810
14	41,00	3,00	9,00	27,000	81,0000	123,00	369,000	41,109192
15	41,90	3,20	10,24	32,768	104,8576	134,08	429,056	41,446938
Итого	591,20	25,10	55,01	137,573	367,7897	1004,63	2223,131	591,200005

Подставим эти значения в систему уравнений.

Разделим каждое из уравнений системы на число при , первое на 15, второе на 25,01 и третье на 55,01.

Далее вычтем из 5-го уравнения 4-е, и из 6-го уравнения 5-е. система примет вид:

Разделим каждое уравнение на число при , 7-е на 0,5183, а 8-е на 0,30924

Вычтем из 10-го уравнения 9-е

Значение параметра

Подставим значение параметра в уравнение (9) и найдем значение параметра

Подставим значение параметров в уравнение (1) и найдем значение параметра

Подставим параметры в уравнение

Подставляя в полученное уравнение и рассчитаем теоретические значения , занесем их в последний столбик таблицы.

Линеаризацию равносторонней гиперболы

(67)

проводят, заменяя на , в результате получим уравнение линейной регрессии:

(68)

МНК для оценки параметров функция регрессии по линеаризованной равносторонней гиперболе дает следующую систему уравнений:

(69)

Также можно использовать уравнения:

(70)

(71)

Пример 12. Имеются данные о средней прибыли (млн. руб.) и затратах на затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли. Рассчитать функцию регрессии равносторонней гиперболы

Таблица 29

№
1	37,8	0,3
2	38,0	0,5
3	39,0	0,7
4	37,5	0,8
5	39,5	0,9
6	36,8	1,1
7	40,0	1,3
8	40,1	1,6
9	40,0
10	39,0	2,2
11	38,0	2,5
12	41,0	2,6
13	41,6	2,7
14	41,0	3,0
15	41,9	3,2

В таблице 30 рассчитаем все возможные значения:

Таблица 30

№
1	37,80	0,30	3,333333	126,000000	11,111111	36,808395
2	38,00	0,50	2,000000	76,000000	4,000000	38,266516
3	39,00	0,70	1,428571	55,714286	2,040816	38,891425
4	37,50	0,80	1,250000	46,875000	1,562500	39,086709
5	39,50	0,90	1,111111	43,888889	1,234568	39,238597
6	36,80	1,10	0,909091	33,454545	0,826446	39,459524
7	40,00	1,30	0,769231	30,769231	0,591716	39,612474
8	40,10	1,60	0,625000	25,062500	0,390625	39,770204
9	40,00	1,70	0,588235	23,529412	0,346021	39,810409
10	39,00	2,20	0,454545	17,727273	0,206612	39,956611
11	38,00	2,50	0,400000	15,200000	0,160000	40,016262
12	41,00	2,60	0,384615	15,769231	0,147929	40,033086
13	41,60	2,70	0,370370	15,407407	0,137174	40,048664
14	41,00	3,00	0,333333	13,666667	0,111111	40,089168
15	41,90	3,20	0,312500	13,093750	0,097656	40,111951
Итого	591,20	25,10	14,269937	552,158190	22,964285	591,199995

Подставим полученные значения в систему уравнений

Разделим первое уравнение на 15, а второе на 14,269937

Вычтем из второго уравнения первое

Подставим значение параметра в первое уравнение и рассчитаем параметр

Уравнение регрессии примет вид

Подставляя в полученное уравнение регрессии значение , рассчитаем .

Линеаризацию степенной функции

(72)

проводят путем логарифмирования обеих частей уравнения, получая уравнение вида:

(73)

Обозначив через , получим линейное уравнение регрессии:

(74)

МНК для оценки параметров функция регрессии по линеаризованной степенной функции дает следующую систему уравнений:

(75)

Также можно использовать уравнения:

(76)

(77)

Рассчитав параметры , и составив линейное уравнение регрессии необходимо провести его потенцирование, что бы вернуться к степенной функции.

(78)

Пример 13. Имеются данные о средней прибыли (млн. руб.) и затратах на затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли. Рассчитать степенную функцию

Таблица 31.

№
1	37,8	0,3
2	38,0	0,5
3	39,0	0,7
4	37,5	0,8
5	39,5	0,9
6	36,8	1,1
7	40,0	1,3
8	40,1	1,6
9	40,0	1,7
10	39,0	2,2
11	38,0	2,5
12	41,0	2,6
13	41,6	2,7
14	41,0	3,0
15	41,9	3,2

Решение. Для расчета параметров данной функции проведем ее линеаризацию, прологарифмировав обе части уравнения

Обозначив через , получим линейное уравнение регрессии:

В таблице 32 рассчитаем все возможные значения:

Таблица 32

№
1	37,80	0,30	1,577492	-0,522879	-0,824837	37,183851
2	38,00	0,50	1,579784	-0,301030	-0,475562	37,910774
3	39,00	0,70	1,591065	-0,154902	-0,246459	38,397333
4	37,50	0,80	1,574031	-0,096910	-0,152539	38,592153
5	39,50	0,90	1,596597	-0,045757	-0,073056	38,764817
6	36,80	1,10	1,565848	0,041393	0,064815	39,060772
7	40,00	1,30	1,602060	0,113943	0,182544	39,308870
8	40,10	1,60	1,603144	0,204120	0,327234	39,619441
9	40,00	1,70	1,602060	0,230449	0,369193	39,710581
10	39,00	2,20	1,591065	0,342423	0,544817	40,100534
11	38,00	2,50	1,579784	0,397940	0,628659	40,295293
12	41,00	2,60	1,612784	0,414973	0,669262	40,355237
13	41,60	2,70	1,619093	0,431364	0,698418	40,413002
14	41,00	3,00	1,612784	0,477121	0,769493	40,574705
15	41,90	3,20	1,622214	0,505150	0,819461	40,674075
Итого	591,20	25,10	23,929804	2,037398	3,301443	590,961438
В среднем			1,595320	0,135827	0,220096
0,089930

Подставим полученные значения в уравнение

Выполним потенцирование полученного уравнения

Подставляя в полученное уравнение значение фактора , рассчитаем .

Линеаризацию показательной функции

Показательная функция

(79)

также проводят путем логарифмирования обеих частей уравнения:

Обозначив через , получим линейное уравнение регрессии:

(81)

(82)

Также можно использовать уравнения:

(83)

(84)

Рассчитав параметры , и составив линейное уравнение регрессии необходимо провести его потенцирование, что бы вернуться к показательной функции.

(85)

Пример 14. Имеются данные о средней прибыли (млн. руб.) и затратах на затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли. Рассчитать показательную функцию

Таблица 33

№
1	37,8	0,3
2	38,0	0,5
3	39,0	0,7
4	37,5	0,8
5	39,5	0,9
6	36,8	1,1
7	40,0	1,3
8	40,1	1,6
9	40,0	1,7
10	39,0	2,2
11	38,0	2,5
12	41,0	2,6
13	41,6	2,7
14	41,0	3,0
15	41,9	3,2

Обозначив через , получим линейное уравнение регрессии:

В таблице 34 рассчитаем все возможные значения:

Таблица 34

№
1	37,80	0,30	1,577492	0,473248	37,806262
2	38,00	0,50	1,579784	0,789892	38,032035
3	39,00	0,70	1,591065	1,113745	38,259157
4	37,50	0,80	1,574031	1,259225	38,373226
5	39,50	0,90	1,596597	1,436937	38,487635
6	36,80	1,10	1,565848	1,722433	38,717477
7	40,00	1,30	1,602060	2,082678	38,948692
8	40,10	1,60	1,603144	2,565031	39,298106
9	40,00	1,70	1,602060	2,723502	39,415272
10	39,00	2,20	1,591065	3,500342	40,006365
11	38,00	2,50	1,579784	3,949459	40,365268
12	41,00	2,60	1,612784	4,193238	40,485616
13	41,60	2,70	1,619093	4,371552	40,606323
14	41,00	3,00	1,612784	4,838352	40,970608
15	41,90	3,20	1,622214	5,191085	41,215278
Итого	591,20	25,10	23,929804	40,210718	590,987319
В среднем		1,673333	1,595320	2,680715
0,867289

Получили линеаризованное уравнение

Произведем потенцирование линейного уравнения для возврата к показательной функции.

Подставим в полученное уравнение значения фактора , рассчитаем значения .

2.4.1.5 Коэффициенты эластичности в парных моделях

Коэффициенты регрессии выражены в натуральных единицах, то есть являются именованными величинами, поэтому коэффициенты регрессии, выраженные в разных единицах несопоставимы между собой. Для сопоставления разноименных коэффициентов корреляции линейных и нелинейных моделей удобно использовать коэффициент эластичности.

(86)

где:

- первая производная функции регрессии для соответствующей формы связи.

Так как коэффициент эластичности не всегда величина постоянная, а часто зависит от значения , обычно рассчитывают средний коэффициент эластичности.

(87)

Коэффициент средней эластичности для некоторых функций рассчитывается как:

уравнения прямой :

(88)

парабола второго порядка

уравнение равносторонней гиперболы :

(89)

степенного уравнения :

(90)

показательного уравнения :

(91)

Коэффициент средней эластичности показывает, на сколько процентов в среднем изменится результативный признак, если факторный признак увеличится на один процент.

Коэффициент средней эластичности позволяет ранжировать факторы по силе влияния на результат, чем больше коэффициент для -го фактора, тем сильнее данный фактор влияет на результат.

Пример 15. Исходя из рассчитанных уравнений регрессии (табл. 35) рассчитать коэффициенты средней эластичности для линейной функции, полинома второй степени, равносторонней гиперболы, степенной и показательной функций.

Таблица 35

Функция

Уравнение регрессии

Линейная

1,6713
Парабола второй степени
Равносторонняя гипербола
Степенная
Показательная

Рассчитать коэффициенты средней эластичности для каждого уравнения регрессии.

Решение.

1. Для линейной функции

. Для полинома второй степени

. Для равносторонней гиперболы

. Для степенной функции

. Для показательной функции

Пример 16. По группе предприятий, рассчитаны уравнения парной линейной регрессии, отражающие зависимость средней прибыли от уровня оплаты труда и затрат на маркетинг (табл. 36).

Таблица 36

Признак-фактор	Уравнение парной линейной регрессии	Среднее значение фактора
Уровень оплаты труда, 62,4
Затраты на маркетинг, 189,07

Используя коэффициенты средней эластичности определить степень влияния каждого из факторов.

Решение.

По формуле коэффициента средней эластичности для линейной функции рассчитаем данный коэффициент по каждому из факторов.

а) по фактору

б) по фактору

Исходя из рассчитанных коэффициентов средней эластичности, можно сказать, что фактор оказывает более сильное влияние на урожайность, чем фактор .

2.4.1.6 Парная нелинейная корреляция

В нелинейных моделях для определения силы связи рассчитывают индекс корреляции:

(92)

где;

- остаточная дисперсия результативного признака.

- общая дисперсия результативного признака.

Отсюда: (93)

Величина индекса корреляции может принимать значения от до , то есть, он показывает только тесноту связи, но не показывает ее направление.

Квадрат индекса корреляции - индекс детерминации характеризует долю вариации результативного признака обусловленную влиянием включенного в модель фактора .

(94)

Величина индекса детерминации определяет качество подбора функции регрессии, чем индекс детерминации выше, тем «лучше» выбор формы уравнения регрессии.

Пример 17. По данным примера 12 (функция регрессии равносторонней гиперболы) рассчитать индекс корреляции, (табл. 37).

Решение.

. Рассчитаем индекс корреляции

Индекс множественной корреляции показывает, что между исследуемыми явлениями существует средняя связь.

Таблица 37

№
1	37,80	36,808395	-1,6133	2,6027	0,9602	0,9220
2	38,00	38,266516	-1,4133	1,9974	-0,2770	0,0767
3	39,00	38,891425	-0,4133	0,1708	0,1071	0,0115
4	37,50	39,086709	0,0867	0,0075	0,2649	0,0702
5	39,50	39,238597	-1,9133	3,6607	-1,6938	2,8690
6	36,80	39,459524	-2,6133	6,8293	-2,6529	7,0379
7	40,00	39,612474	0,5867	0,3442	0,3964	0,1571
8	40,10	39,770204	0,6867	0,4716	0,3409	0,1162
9	40,00	39,810409	0,5867	0,3442	0,2013	0,0405
10	39,00	39,956611	-0,4133	0,1708	-0,9428	0,8889
11	38,00	40,016262	-1,4133	1,9974	-2,0016	4,0064
12	41,00	40,033086	1,5867	2,5176	0,9984	0,9968
13	41,60	40,048664	2,1867	4,7817	1,5664	2,4536
14	41,00	1,5867	2,5176	0,9265	0,8584
15	41,90	40,111951	2,4867	6,1837	1,8040	3,2544
Сумма	591,2000			34,5973		23,7596
В среднем	39,4133

Рассчитаем индекс детерминации

Индекс детерминации показывает, что вариация результативного признака на 31% обусловлена влиянием включенного в модель фактора.

2.4.1.7 Оценка надежности параметров парной нелинейной регрессии и корреляции

Как и в парной линейной регрессии, в регрессии нелинейной оценку надежности уравнения в целом проводят с помощью критерия Фишера, а оценку параметров уравнения и коэффициента детерминации проводят с помощью критерия Стьюдента.

Общая формула фактический F-критерия имеет вид;

(95)

где:

- индекс детерминации.

- число наблюдений.

- число параметров при переменных .

В случае нелинейной регрессии отлично для разных видов регрессии, и формула F-критерия различна для различных функций.

Например. Для степенной и показательной и:

(96)

Для параболы второго порядка и:

(97)

Для параболы третьего порядка и:

(98)

Как и в случае линейной регрессии, критерий Фишера фактический сравнивают с критерием Фишера табличным, при определенном уровне значимости или , и числе свободы - , (таблицы Снедекора-Фишера - приложение 2).

Значимость параметров уравнения парной нелинейной регрессии и индекса корреляции проверяется, аналогично парной линейной регрессии используя критерий Стьюдента (см. 2.3.1.3).

Критерий Стьюдента для коэффициента регрессии рассчитывается как;

(51)

где; - коэффициент регрессии.

- стандартная ошибка коэффициента регрессии, рассчитывается как:

(52)

Учитывая, что

(53)

Критерий Стьюдента для параметра рассчитывается как;

(54)

где: - свободный член уравнения регрессии.

- стандартная ошибка параметра , рассчитывается как:

(55)

или (56)

Критерий Стьюдента для индекса корреляции рассчитывается как;

(57)

или (58)

где: - индекс корреляции.

- стандартная ошибка индекса корреляции, рассчитывается как:

(59)

Качество подбора модели определяют, рассчитывая среднюю ошибку аппроксимации. Для расчета средней ошибки аппроксимации используют формулы:

(99)

(100)

где (101)

(102)

Чем меньше средняя ошибка аппроксимации, тем выше качество модели. Допустимый предел не более 10%.

Пример 18. Необходимо оценить существенность уравнения регрессии равносторонней гиперболы

, при:

где: - индекс детерминации.

- число наблюдений.

Решение. Оценку существенности уравнения нелинейной регрессии проведем, используя критерий Фишера (F-критерий)

- число параметров при переменных .

Найдем критерий Фишера табличный, при уровне значимости , и числе свободы - , (таблицы Снедекора-Фишера - приложение 2) - .

Так как уравнение регрессии признаем статистически значимым.

Пример 19. По данным примеров 7; 11; 12; 13; 14 рассчитаем средние ошибки аппроксимации для линейной функции, функции параболы второй степени, равносторонней гиперболы, степенной и показательной функций.

Решение. Для расчета средней ошибки аппроксимации используем формулу:

, где

Расчет произведем в таблице 38. Средние ошибки аппроксимации составили для:

линейной функции

параболы второго порядка

функции равносторонней гиперболы

степенной функции

показательной функции

Соответственно линейная функция наиболее качественно описывает существующую взаимосвязь между исследуемыми явлениями. Но все регрессии находятся в допустимых пределах ( не более 10%).

Таблица 38

№ Линейная

Парабола второго порядка

Гипербола



1	37,8	37,792344	0,007656	0,020254	38,023560	0,223560	0,591429	36,808395	0,991605	2,623294
2	38,0	38,028410	0,028410	0,074763	38,158005	0,158005	0,415803	38,266516	0,266516	0,701358
3	39,0	38,264476	0,735524	1,885959	38,307508	0,692492	1,775621	38,891425	0,108575	0,278397
4	37,5	38,382510	0,882510	2,353360	38,387907	0,887907	2,367752	39,086709	1,586709	4,231224
5	39,5	38,500543	0,999457	2,530271	38,472071	1,027929	2,602352	39,238597	0,261403	0,661780
6	36,8	38,736609	1,936609	5,262524	38,651694	1,851694	5,031777	39,459524	2,659524	7,226967
7	40,0	38,972676	1,027324	2,568310	38,846375	1,153625	2,884063	39,612474	0,387526	0,968815
8	40,1	39,326775	0,773225	1,928242	39,166634	0,933366	2,327596	39,770204	0,329796	0,822434
9	40,0	39,444808	0,555192	1,387980	39,280917	0,719083	1,797708	39,810409	0,189591	0,473978
10	39,0	40,034974	1,034974	2,653779	39,908803	0,908803	2,330264	39,956611	0,956611	2,452849
11	38,0	40,389074	2,389074	6,287037	40,330713	2,330713	6,133455	40,016262	2,016262	5,305953
12	41,0	40,507107	0,492893	1,202178	40,478879	0,521121	1,271027	40,033086	0,966914	2,358327
13	41,6	40,625140	0,974860	2,343413	40,630810	0,969190	2,329784	40,048664	1,551336	3,729173
14	41,0	40,979240	0,020760	0,050634	41,109192	0,109192	0,266322	40,089168	0,910832	2,221541
15	41,9	41,215306	0,684694	1,634115	41,446938	0,453062	1,081294	40,111951	1,788049	4,267420
Итого	591,2			32,182820			33,206244			38,323509
В среднем				2,145521			2,213750			2,554901

Продолжение табл. 38

№ Степенная

Показательная



1	37,8	37,183851	0,616149	1,630024	37,806262	0,006262	0,016566
2	38,0	37,910774	0,089226	0,234805	38,032035	0,032035	0,084303
3	39,0	38,397333	0,602667	1,545300	38,259157	0,740843	1,899597
4	37,5	38,592153	1,092153	2,912408	38,373226	0,873226	2,328603
5	39,5	38,764817	0,735183	1,861223	38,487635	1,012365	2,562949
6	36,8	39,060772	2,260772	6,143402	38,717477	1,917477	5,210535
7	40,0	39,308870	0,691130	1,727825	38,948692	1,051308	2,628270
8	40,1	39,619441	0,480559	1,198401	39,298106	0,801894	1,999736
9	40,0	39,710581	0,289419	0,723548	39,415272	0,584728	1,461820
10	39,0	40,100534	1,100534	2,821882	40,006365	1,006365	2,580423
11	38,0	40,295293	2,295293	40,365268	2,365268	6,224389
12	41,0	40,355237	0,644763	1,572593	40,485616	0,514384	1,254595
13	41,6	40,413002	1,186998	2,853361	40,606323	0,993677	2,388647
14	41,0	40,574705	0,425295	1,037305	40,970608	0,029392	0,071688
15	41,9	40,674075	1,225925	2,925835	41,215278	0,684722	1,634181
Итого	591,2			35,228156	590,987320		32,346303
В среднем				2,348544			2,156420

2.4.1.8 Прогнозирование на основе парной модели регрессии

Расчет доверительных интервалов для прогнозного значения , параметров уравнения регрессии и коэффициента (индекса) корреляции .

Парные модели регрессии позволяют прогнозировать значение результативного признака как точечный прогноз путем подстановки в уравнение регрессии соответствующего конкретного прогнозного значения .

Естественно, что полученное точечное значение рассчитанное для не может быть на 100% точным, поэтому необходим дополнительный расчет стандартной ошибки для функции регрессии и для индивидуальных значений зависимой переменной, и построение соответствующих интервалов которые с заданной вероятностью (- уровень значимости) накрывают неизвестное значение . Также доверительные интервалы рассчитываются для параметров уравнения регрессии и коэффициента (индекса) корреляции .

Расчет доверительного интервала для функции регрессии

Доверительный интервал для уравнения регрессии имеет вид:

(103)

где:

- предельная ошибка

(104)

- стандартная ошибка

(105)

- остаточное стандартное отклонение на одну степень свободы

(106)

- табличное значение критерия Стьюдента для числа степеней свободы и определенного уровня значимости .

Необходимо помнить, что прогноз значений результативного признака по уравнению регрессии тем точнее, чем значение фактора ближе к . Если же значение выходит за рамки обследованных значений результаты прогноза ухудшаются тем больше, чем больше разница между и .

Расчет доверительного интервала для индивидуальных значений результативного признака

При построение доверительного интервала для индивидуальных значений результативного признака , в отличие от доверительного интервала для функции регрессии необходимо учитывать вариацию вокруг линии регрессии. В результате стандартная ошибка индивидуальных значений при равна

(107)

Доверительный интервал примет вид:

(108)

где

- предельная ошибка

(109)

Точность интервала рассчитывают как отношение максимального значения интервала к минимальному значению

(110)

Чем меньше отношение, тем меньше интервал, то есть он более точен.

Расчет доверительных интервалов для параметров уравнения регрессии

Для свободного члена уравнения регрессии доверительный интервал имеет вид:

(111)

Где

- предельная ошибка

(112)

- стандартная ошибка

(55)

Для коэффициента регрессии доверительный интервал имеет вид:

(113)

где

- предельная ошибка

(114)

- стандартная ошибка

(52)

Пример 20. По данным примера 7 и примера 9, необходимо:

. провести прогнозирование на основе парной линейной модели регрессии для индивидуального значения результативного признака при .

. рассчитать доверительные интервалы для

а) функции регрессии

б) индивидуального прогнозного значения , при

в) свободно члена уравнения регрессии

г) коэффициента регрессии

Решение.

) Рассчитаем прогнозное значение результативного признака, подставив индивидуальное значение фактора в линейное уравнение регрессии

) Рассчитаем доверительные интервалы

a) Доверительный интервал прогноза для функции регрессии рассчитаем как:

Где:

Для расчетов используем таблицу 39.

табличное значение критерия Стьюдента для числа степеней свободы и определенного уровня значимости .

Доверительный интервал прогноза показывает, что с вероятностью прогнозное значение средней прибыли по совокупности предприятий для конкретного значения фактора будет находиться в интервале от 35,187403 до 41,223517, не принимая нулевых значений, т.е. являются статистически значимыми.

Таблица 39

№
1	37,80	0,30	0,09	37,792344	1,886044	0,000059
2	38,00	0,50	0,25	38,028410	1,376710	0,000807
3	39,00	0,70	0,49	38,264476	0,947377	0,540996
4	37,50	0,80	0,64	38,382510	0,762711	0,778824
5	39,50	0,90	0,81	38,500543	0,598044	0,998914
6	36,80	1,10	1,21	38,736609	0,328711	3,750454
7	40,00	1,30	1,69	38,972676	0,139378	1,055395
8	40,10	1,60	2,56	39,326775	0,005378	0,597877
9	40,00	1,70	2,89	39,444808	0,000711	0,308238
10	39,00	2,20	4,84	40,034974	0,277378	1,071171
11	38,00	2,50	6,25	40,389074	0,683378	5,707675
12	41,00	2,60	6,76	40,507107	0,858712	0,242944
13	41,60	2,70	7,29	40,625140	1,054045	0,950352
14	41,00	3,00	9,00	40,979240	1,760045	0,000431
15	41,90	3,20	10,24	41,215306	2,330712	0,468806
Итого	591,20	25,10	55,01	591,199992	13,009333	16,472942
В среднем		1,673333

б) Рассчитаем доверительный интервал для индивидуального прогнозного значения , при

Доверительный интервал примет вид:

Доверительный интервал прогноза показывает, что с вероятностью прогнозное значение индивидуальной средней прибыли для конкретного значения фактора будет находиться в интервале от 35,148114 до 41,262806, не принимая нулевых значений, т.е. являются статистически значимыми.

в) Рассчитаем доверительный интервал для свободного члена уравнения .

где

Доверительный интервал прогноза показывает, что с вероятностью значение параметра находится в интервале от 36,147123 до 38,729365, не принимая нулевых значений, т.е. являются статистически значимыми.

г) Для коэффициента регрессии доверительный интервал имеет вид:

где

Доверительный интервал показывает, что с вероятностью прогнозное значение будет находиться в интервале от 0,505907 до 0,674425, не принимая нулевых значений, т.е. является статистически значимым.

2.4.2 Множественная регрессия. Множественная Корреляция

.4.2.1 Множественная регрессия

В тех случаях, когда известно, что на результативный признак существенное влияние оказывает не один, как в парной модели, а несколько факторов, причем их влиянием нельзя пренебречь рассчитывают функцию не парной, а множественной регрессии.

(115)

Множественная модель позволяет установить связь результативного признака с каждым отдельно взятым фактором, при условии неизменяемости других включенных в модель факторных признаков.

При построении функции множественной регрессии, как и в парной регрессии, необходимо решить две задачи:

. отбор факторов,

. спецификация модели.

Отбор факторов модели множественной регрессии

Так как, во множественной регрессии исследуют влияние на результат нескольких факторов, то в отличии от парной модели, имеются особые требования к их отбору.

1. Все факторы должны быть выражены в количественных единицах. Качественные факторы, при включении их в модель, необходимо перевести в количественные, например, путем пересчета в баллы.

Факторы, включенные в модель не должны быть интеркоррелированы, то есть факторы во множественной модели не должны находится в сильной корреляционной связи между собой, сила связи между факторами не должна быть выше чем сила связи между каким то фактором и результатом. В статистике говорят, что факторы явно коррелированны если коэффициент корреляции между ними , а если связь между ними близка к функциональной, то наличие такой связи называется мультиколлинеарностью.

Спецификация модели множественной регрессии

Функция множественной регрессии может, как и парной регрессии, иметь линейный или нелинейный вид.

Наиболее широкое распространение получила линейная функция:

(116)

Но при значительной вариации признаков возможно применение нелинейных функций. Данные функции, так же, как и в парной регрессии должны иметь возможность свей линеаризации. Из всего множества нелинейных функций чаще всего используют:

1. Множественная степенная функция

(117)

. Множественная показательная функция

(118)

. Множественная экспонента

(119)

. Множественная гипербола

(120)

. Множественная парабола второго порядка

(121)

Выбор вида функции проводится аналитическим или экспериментальным методами.

Расчет параметров уравнения множественной регрессии

Параметры множественной регрессии, как и параметры парной регрессии можно определить, используя МНК. Так для расчета параметров уравнения множественной линейной регрессии:

МНК даст систему уравнений:

(122)

Параметры уравнения находим как отношение частных определителей к определителю системы

, , ,…, (123)

где

- определитель системы, находится, как:

(124)

- частные определители системы рассчитывают, заменяя соответствующий столбец матрицы определителя системы данными левой части системы.

Параметр во множественной регрессии называется свободным членом уравнения регрессии и также как в парной регрессии не имеет экономической интерпретации. Параметр - коэффициентом регрессии, он показывает, на сколько единиц, в среднем, изменится результативный признак , если соответствующий данному коэффициенту фактор увеличится на одну единицу при постоянной величине остальных факторов.

Коэффициенты регрессии можно рассчитать и используя уравнения регрессии в стандартизованном виде представив все переменные уравнения как центрированные и нормированные. Для этого выразим их как отношение их отклонений от средних величин на их стандартное отклонение:

(125)

где

- стандартизованные переменные:

(126)

(127)

- стандартизованные коэффициенты регрессии , показывают на сколько, в среднем, среднеквадратических отклонений изменится вариация результативного признака, если вариация соответствующего фактора увеличится на одно среднеквадратическое отклонение, при постоянной величине остальных факторов. Расчет параметров уравнения в стандартизированной форме более прост, так как, по сравнению с уравнением в натуральной форме отсутствует параметр .

МНК для уравнения множественной регрессии в стандартизированном масштабе даст следующую систему уравнений:

(128)

где

- коэффициент парной корреляции (38)

или (39)

Как, и в уравнении в натуральном масштабе параметры стандартизированного уравнения можно найти методом определителей:

(129)

где:

(130)

Определитель получается из определителя , заменой в нем соответствующего столбца столбцом свободных членов исходной системы.

Кроме того, можно рассчитать используя их взаимосвязь с коэффициентами парной линейной корреляции. Так, например, для двухфакторной линейной модели, выраженной в стандартизованном масштабе, рассчитываются, как:

(131)

Определив значение -коэффициентов и зная, что между -коэффициентами и коэффициентами регрессии в натуральном масштабе существует следующая взаимосвязь:

или (132)

От уравнения множественной регрессии в стандартизованном виде

(125)

перейдем к уравнению в натуральном масштабе

(116)

параметр , который мы не рассчитали в стандартизованном уравнении, рассчитаем, как

(133)

Расчет параметров нелинейных уравнений множественной регрессии ведется так же, как и в линейной модели используя МНК. Разница заключается в том, что нелинейные модели вначале линеаризуются, и расчет параметров проводится по преобразованным данным (см. парную регрессию).

2.4.2.2 Частные уравнения регрессии

Частные уравнения регрессии, рассчитываются на основе множественного уравнения регрессии:

(116)

Они показывают изолированное влияние одного конкретного фактора на результативный признак , при зафиксированном, на среднем уровне, положении остальных, включенных в модель факторов. Влияния зафиксированных факторов в уравнениях частной регрессии присоединены к свободному члену уравнения регрессии .

Частные множественные регрессии записываются, как:

(134)

Обозначение показывает, что изучается влияние на результат , фактора , при зафиксированном на среднем уровне положении факторов . Обозначение показывает, что изучается влияние на результат , фактора , при зафиксированном на среднем уровне положении факторов , и т, д. Знак в нижнем индексе обозначения отделяет фактор влияния, которого исследуется, от факторов, влияние которых изолируется.

Частные уравнения множественной регрессии для линейной модели имеют вид:

(135)

На основе частных уравнений регрессии рассчитывают частные коэффициенты эластичности:

(136)

Частные коэффициенты эластичности отличаются от средних коэффициентов.

Частный коэффициент эластичности показывает, на сколько, в среднем, процентов изменится результат при подстановке в уравнение регрессии конкретного значения .

Средний коэффициент эластичности показывает, на сколько в среднем процентов изменится результат, если соответствующий данному коэффициенту фактор увеличится на 1%, при зафиксированных, на средних уровнях величин остальных, включенных в модель, факторов.

(137)

Пример 20. Имеются данные по 40 хозяйствам о средней урожайности (ц/га), качества почвы (балов), затратах труда (чел-час./1га.), внесение минеральных удобрений (ц.д.в. на 1га.), стоимость ОС (тыс. руб. на 100 га.) (табл. 42).

Таблица 42

№ Урожайность, ц/га

Качество пашни, балов

Затраты труда чел.-час на 1 га Внесение мин. удобрений на 1 га ц.д.в.

Стоимость ОФ на тыс.руб. 100 га


1	10,49	67	15,45	0,76	18,21	10,048113
2	8,57	53	16,13	1,06	19,17	9,601560
3	70	17,59	1,06	20,42	11,593826
4	9,23	51	18,84	0,52	20,00	8,633346
5	11,97	70	18,43	0,99	20,37	11,524121
6	8,56	56	12,44	0,67	21,04	8,887059
7	12,18	55	15,50	1,02	20,25	9,800000
8	7,93	47	16,34	0,44	17,68	7,427264
9	15,75	89	17,13	1,22	28,19	14,929855
10	13,61	74	17,10	0,72	22,63	11,502371
11	13,99	52	27,16	1,59	40,16	15,194027
12	12,57	87	14,92	1,23	21,12	13,414848
13	10,93	65	18,17	0,82	26,01	11,506605
14	9,86	54	17,24	0,98	17,99	9,461020
15	7,39	48	14,64	0,41	21,90	7,917362
16	9,23	61	14,70	0,79	20,47	9,804117
17	15,40	79	28,81	1,20	29,01	15,372985
18	13,14	85	21,87	0,99	23,40	13,824023
19	13,12	83	16,88	0,91	25,53	13,217642
20	10,27	64	16,65	0,83	21,18	10,512752
21	9,12	55	16,10	0,81	20,24	9,395289
22	13,42	72	18,02	1,21	20,22	12,140147
23	10,29	69	16,91	0,78	24,89	11,485126
24	11,55	72	14,90	0,86	20,86	11,101097
25	15,26	87	17,64	1,21	28,42	14,808601
26	12,35	79	14,41	1,20	19,73	12,305857
27	8,24	49	12,62	1,07	18,57	8,749497
28	10,41	64	18,13	0,79	21,07	10,573475
29	9,62	52	17,30	0,77	24,46	9,806811
30	10,76	65	17,16	0,82	20,46	10,532588
31	8,35	51	14,65	0,63	22,82	8,842748
32	10,31	75	13,66	0,79	19,89	10,941740
33	9,38	55	12,07	0,73	22,92	9,174913
34	14,93	72	14,38	1,05	33,99	13,502339
35	12,46	79	14,53	1,03	22,95	12,436891
36	10,45	59	16,54	0,92	23,20	10,534678
37	12,38	80	21,64	0,95	21,64	12,955222
38	7,74	76	10,27	0,65	16,87	9,872332
39	14,49	89	19,44	1,05	24,49	14,236792
40	8,50	47	15,05	0,56	17,89	7,582986
Итого	445,15	2657,00	671,41	36,09	900,31	445,152022
Среднее	11,128750	66,425000	16,785250	0,902250	22,507750
2,30556112,9593353,4585730,2406924,463267

Необходимо построить уравнение множественной линейной регрессии, рассчитать парные коэффициенты регрессии, частные и средние коэффициенты эластичности, провести прогнозирование урожайности, при различных значениях факторов, то есть рассчитать:

· максимально возможную урожайность,

· минимальную урожайность,

· урожайность для средних значений фактора,

· частные уравнения регрессии, при максимальном значении одного фактора и средних значениях двух других факторов.

Решение.

1) Уравнение множественной линейной регрессии для нашего примера имеет вид:

Для решения данного уравнения представим его в стандартизированном масштабе:

где: - стандартизованные переменные:

- стандартизованные коэффициенты регрессии

МНК для решения множественного уравнения линейной регрессии в стандартизованном виде дает систему уравнений:

Для нашего примера:

Между стандартизированными переменными и коэффициентами парной корреляции существует следующая взаимосвязь:

) Рассчитаем коэффициенты парной корреляции. Расчет проведем, используя программу Microsoft, таблица 43.

Таблица 43

	Столбец 1 y	Столбец 2 x1	Столбец 3 x2	Столбец 4 x3	Столбец 5 x4
Столбец 1 y	1,000000
Столбец 2 x1	0,749996	1,000000
Столбец 3 x2	0,545459	0,188222	1,000000
Столбец 4 x3	0,731053	0,474013	0,466501	1,000000
Столбец 5 x4	0,640037	0,223318	0,549570	0,539163	1,000000

3) Подставим значения коэффициентов корреляции в систему.

Для решения системы уравнения воспользуемся методом Гаусса.

). Составим матрицу, в которую внесем все числа (коэффициенты) при переменных , за горизонтальную черту вынесем итог по каждому уравнению:

- матрица 1

) Далее необходимо привести к нулю первые коэффициенты строк 2,3,4, первая строка остается без изменений - рабочая строка. Для этого:

а) Умножим первую (рабочую) строку на число противоположное 1-му коэффициенту второй строки матрицы 1, т.е. на , получим

суммируем полученную строку со второй строкой матрицы 1, получим расчетную строку 1.

б) Умножим первую (рабочую) строку на число противоположное 1-му коэффициенту третьей строки матрицы 1, т.е. на получим

суммируем полученную строку с третьей строкой матрицы 1, получим расчетную строку 2.

в) Умножим первую (рабочую) строку на число противоположное 1-му коэффициенту четвертой строки матрицы 1, т.е. на получим

суммируем полученную строку с четвертой строкой матрицы 1, получим расчетную строку 3.

) Составим новую матрицу (матрица 2). Первой строкой данной матрицы будет первая строка матрицы 1, второй строкой (рабочей) - расчетная строка 1, третьей - строка 2, четвертой - строка 3.

- матрица 2

) Далее, необходимо привести к нулю вторые коэффициенты строк 3 и 4 матрицы 2, первая строка остается без изменений, рабочей будет вторая строка. Для этого:

а) Найдем число, которое при умножении на второй коэффициент рабочей строки матрицы 2 - , даст число, противоположное (с другим знаком) второму коэффициенту третьей строки - . Для этого найдем отношение: , так как второй коэффициент третьей строки число положительное, полученное число возьмем со знаком минус и умножим на него вторую (рабочую) строку матрицы 2:

суммируем полученную строку с третьей строкой матрицы 2, получим расчетную строку 4:

б) Найдем число, которое при умножении на второй коэффициент рабочей строки матрицы 2 - , даст число, противоположное (с другим знаком) второму коэффициенту четвертой строки - . Для этого найдем отношение: , так как второй коэффициент четвертой строки число положительное, полученное число возьмем со знаком минус и умножим на него вторую (рабочую) строку матрицы 2:

). Составим новую матрицу - 3. Первые две строки возьмем без изменений из матрицы два, третьей строкой (рабочей) будет расчетная строка 4, четвертой строкой - расчетная строка 5.

- матрица 3

) Далее необходимо привести к нулю третий коэффициент строки 4. Для этого:

Найдем число, которое при умножении на третий коэффициент рабочей строки матрицы 3 - , даст число, противоположное (с другим знаком) третьему коэффициенту четвертой строки - . Для этого найдем отношение , так как третий коэффициент четвертой строки число положительное, полученное число возьмем со знакам минус и умножим на него третью (рабочую) строку матрицы 3.

суммируем полученную строку с четвертой строкой матрицы 3

) Составим новую матрицу - 4. Первые три строки возьмем без изменений из матрицы три, а четвертой строкой - расчетная строка 6.

- матрица 4

) Подставим полученные коэффициенты в систему

) Рассчитаем значение стандартизированных коэффициентов регрессии .

а) Из четвертого уравнения системы рассчитаем:

б) Подставим полученное значения в третье уравнение системы и рассчитаем значение :

в) Подставим значения и во второе уравнения системы и получим значение :

г) Подставим значения , , во второе уравнения системы и получим значение :

) Зная, что между -коэффициентами и коэффициентами регрессии в натуральном масштабе существует следующая взаимосвязь:

соответственно

а)

б)

в)

г)

Таким образом, используя метод Гаусса, рассчитали коэффициенты регрессии , параметр найдем по формуле:

) Подставим рассчитанные параметры в уравнение множественной регрессии:

а) Коэффициент регрессии показывает, что при увеличении фактора - качество пашни на 1 балл, средняя урожайность в среднем возрастет на 0,096083 ц/га., при фиксированном положении остальных факторов.

б) Коэффициент регрессии показывает, что при увеличении фактора - затраты труда на 1 чел.-час./га, средняя урожайность в среднем возрастет на 0,113165 ц/га., при фиксированном положении остальных факторов.

в) Коэффициент регрессии показывает, что при увеличении фактора - внесение минеральных удобрений на 1 ц.д.в./га средняя урожайность в среднем возрастет на 2,243155 ц/га., при фиксированном положении остальных факторов.

г) Коэффициент регрессии показывает, что при увеличении фактора - стоимость ОФ на одну тыс.руб./100га, средняя урожайность в среднем возрастет на 0,15490 ц/га., при фиксированном положении остальных факторов.

) Проведем прогнозирование средней урожайности на основе полученного уравнения множественной регрессии:

а) Рассчитаем максимально возможную урожайность, для этого по каждому из факторов , в уравнение подставим максимальное значение, если коэффициент регрессии для данного фактора положителен, или минимальное значение, если коэффициент регрессии для данного фактора отрицателен. В нашем примере все коэффициенты регрессии положительны, соответственно значения факторов берем максимальные , , , , и подставляем в уравнение.

б) Рассчитаем минимально возможную урожайность, для этого по каждому из факторов , в уравнение подставим минимальное значение, если коэффициент регрессии для данного фактора положителен, или максимальное значение, если коэффициент регрессии для данного фактора отрицателен. В нашем примере все коэффициенты регрессии положительны, соответственно значения факторов берем минимальные , , , , и подставляем в уравнение.

в) Рассчитаем среднюю возможную урожайность, для этого по каждому из факторов , в уравнение подставим средние значения , , , .

) Рассчитаем частные уравнения регрессии

а) Рассчитаем среднюю возможную урожайность при максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .

б) Рассчитаем среднюю возможную урожайность при максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .

в) Рассчитаем среднюю возможную урожайность при максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .

г) Рассчитаем среднюю возможную урожайность при максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .

) На основе частных уравнений регрессии рассчитаем частные коэффициенты эластичности:

а) При максимальном значении фактора , и зафиксированных на среднем уровне значении остальных факторов , , .

то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения на 0,64%, и зафиксированных на среднем уровне значении остальных факторов.

б) При максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .

то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения на 0,26%, и зафиксированных на среднем уровне значении остальных факторов.

в) При максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .

то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения на 0,28%, и зафиксированных на среднем уровне значении остальных факторов.

г) При максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов , , .

то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения на 0,45%, и зафиксированных на среднем уровне значении остальных факторов.

) Рассчитаем средние коэффициенты эластичности для каждого фактора:

а) Рассчитаем средний коэффициент эластичности для фактора

то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,57%, при фиксированном положении остальных факторов.

б) Рассчитаем средний коэффициент эластичности для фактора

то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,17%, при фиксированном положении остальных факторов.

в) Рассчитаем средний коэффициент эластичности для фактора

то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,18%, при фиксированном положении остальных факторов.

г) Рассчитаем средний коэффициент эластичности для фактора

то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,31%, при фиксированном положении остальных факторов.

) Коэффициенты средней эластичности позволяют ранжировать факторы по степени их влияния на результативный признак, для нашего примера:

. - качество пашни, балов

. - стоимость ОФ тыс.руб. на 100га

. - внесение минеральных удобрений на 1га.тыс.руб.

. - затраты труда, чел.-час.

) Расчет множественной регрессионной модели в программе Microsoft Excel аналогичен расчету парной регрессии и рассмотрен в примере 1 (вводим входной интервал, выделяя все столбики содержащие факторы ). Для данного примера приведем таблицу, содержащую результаты - рисунок 9.

Рисунок 9.

2.4.2.3 Множественная корреляция

Силу связи во множественных моделях изучают с помощью показателя множественной корреляции и его квадрата - показателя множественной детерминации.

Показатель множественной корреляции - показывает тесноту связи между результативным признаком и всеми включенными в модель факторами. Может принимать значения от 0 до 1, то есть в отличие от парной модели не показывает направление связи.

Показатель множественной детерминации - показывает часть вариации результативного признака, которая сложилась под влиянием всех включенных в модель факторов.

В статистике и эконометрике показатель множественной корреляции (детерминации) принято называть индексом или коэффициентом множественной (совокупной) корреляции.

Для линейной множественной функции и для функций нелинейных по переменным (полиномы разных степеней, равносторонняя гипербола и т.п. функции) индекс множественной корреляции совпадает с коэффициентом множественной корреляции.

Коэффициент (индекс) множественной корреляции рассчитывают, используя следующие формулы:

(138)

где:

- остаточная дисперсия (139)

- общая дисперсия для признака (140)

(141)

Коэффициент множественной корреляции можно рассчитать и, как:

(142)

где:

- парные коэффициенты корреляции между результативным признаком и одним из факторов .

Для функций нелинейных по оцениваемым параметрам (степенная, показательная, экспоненциальная и т. п. функции) индекс множественной корреляции не совпадает с коэффициентом множественной корреляции. Его называют «» и определяют как

(143)

Коэффициенты (индексы) множественной детерминации получают, возводя коэффициенты (индексы) корреляции в квадрат, или по формулам.

(144)

(145)

(146)

Скорректированный индекс множественной детерминации

Индекс множественной детерминации используют для определения качества регрессии, чем больше , к единице тем выше качество подбора регрессии.

Но использование только одного индекса детерминации для определения наилучшего уравнения регрессии недостаточно. Необходимо учитывать, что при увеличении факторов включенных в уравнение регрессии, при одном и том же числе наблюдений , при расчете показателей корреляции, за счет использования остаточной дисперсии появляется систематическая ошибка - чем больше число параметров в уравнении регрессии, при одном и том же числе наблюдений , тем больше получается расчетный показатель тесноты связи. Если число факторов приближается к числу наблюдений, то расчетный показатель корреляции будет близок к единице, то есть показывать тесную связь, даже если связь незначительна. Для того чтобы избежать этого рассчитывают скорректированный индекс множественной детерминации.

(147)

или

(148)

Скорректированный индекс множественной корреляции рассчитывают соответственно как:

(149)

или

(150)

где:

- для линейной множественной модели - число факторов включенных в регрессионную модель. Для нелинейной модели - число параметров при и их линеаризации ( и так далее), которое может быть больше числа факторов.

- число наблюдений.

В силу сказанного выше необходимо понимать, что нельзя перегружать множественную модель факторами, так как снижается достоверность расчетов, принято считать, что на каждые 8-10 наблюдений в модель целесообразно включать один фактор.

2.4.2.4 Частная корреляция

Множественный коэффициент (индекс) корреляции показывает тесноту связи между результатом и всеми включенными в модель факторами, для того, чтобы изучить силу связи между результатом и только одним из включенных в модель факторов, рассчитывают частные коэффициенты корреляции, для каждого из факторов включенных в модель.

Частный коэффициент корреляции показывает тесноту связи между результативным признаком и только одним фактором при элиминировании (устранении) влияния всех остальных включенных в модель факторов.

В зависимости от того, влияние скольких факторов необходимо исключать различают частные коэффициенты разных порядков: нулевого, первого, второго, третьего и т.д. Так, например:

· Коэффициенты частной корреляции нулевого порядка - коэффициенты парной корреляции, так как нет необходимости устранять влияние даже одного фактора.

Коэффициенты частной корреляции первого порядка - коэффициенты частной корреляции, в которых элиминируется влияние одного фактора (,,и т.д.).

Коэффициенты корреляции второго порядка - коэффициенты частной корреляции, в которых элиминируется влияние двух факторов (,,и т.д.) и так далее.

Коэффициенты частной корреляции более высоких порядков рассчитываются через коэффициенты корреляции более низких порядков. Коэффициенты первого порядка через коэффициенты нулевого порядка, второго порядка через коэффициенты первого порядка и т.д. Рекуррентная формула для расчета коэффициентов частной корреляции порядка имеет вид:

(151)

Коэффициенты частной корреляции могут принимать значения в пределах от -1 до 1.

Также частные коэффициенты корреляции можно рассчитать через множественные коэффициенты детерминации. Так коэффициент частной корреляции второго порядка рассчитывается как:

или и т.д. (152)

В общем виде уравнение для расчета коэффициентов частной корреляции порядка имеет вид:

(153)

где

- коэффициент множественной детерминации для всех факторов.

- коэффициент множественной детерминации без включения в модель фактора .

Рассчитанные через множественные коэффициенты детерминации частные коэффициенты корреляции могут принимать значения в интервале от 0 до 1.

Кроме того, частные коэффициенты корреляции можно рассчитать через . Так, например, частные коэффициенты корреляции первого порядка для двухфакторной линейной модели, выраженной в стандартизованном масштабе :

(131)

Отсюда:

и (154)

Возводя в квадрат коэффициенты частной корреляции, получают коэффициенты частной детерминации.

Частные коэффициенты корреляции используют при формировании корреляционно-регрессионной модели, для отбора факторов. При этом из модели исключают факторы несущественные по критерию Стьюдента.

Коэффициент частной детерминации показывает долю вариации результативного признака дополнительно сложившуюся при включении в модель фактора , в вариации признака, не объясненную включенными до этого в модель факторами. Можно рассчитать по формуле на основе коэффициентов множественной детерминации.

(155)

где

- коэффициент множественной детерминации для всех факторов.

- коэффициент множественной детерминации без включения в модель фактора .

Зная коэффициенты частной детерминации, последовательно нулевого, первого, второго и более высоких порядков, определяют коэффициент множественной корреляции.

(156)

Пример 21. По данным примера 20 необходимо рассчитать:

1. линейный индекс множественной корреляции, детерминации

2. линейные коэффициенты частной корреляции первого и второго порядков, детерминации.

Решение.

. Рассчитаем индекс множественной корреляции по формуле:

В таблице 44 рассчитаем все возможные значения.

Таблица 44

№
1	10,49	0,408002	10,048113	0,195264
2	8,57	6,547202	9,601560	1,064116
3	10,95	0,031952	11,593826	0,414512
4	9,23	3,605252	8,633346	0,355996
5	11,97	0,707702	11,524121	0,198808
6	8,56	6,598477	8,887059	0,106968
7	12,18	1,105127	9,800000	5,664400
8	7,93	10,232002	7,427264	0,252743
9	15,75	21,355952	14,929855	0,672638
10	13,61	6,156602	11,502371	4,442100
11	13,99	8,186752	15,194027	1,449681
12	12,57	2,077202	13,414848	0,713768
13	10,93	0,039502	11,506605	0,332473
14	9,86	1,609727	9,461020	0,159185
15	7,39	13,978252	7,917362	0,278111
16	9,23	3,605252	9,804117	0,329610
17	15,40	18,243577	15,372985	0,000730
18	13,14	4,045127	13,824023	0,467887
19	13,12	3,965077	13,217642	0,009534
20	10,27	0,737452	10,512752	0,058929
21	9,12	4,035077	9,395289	0,075784
22	13,42	5,249827	12,140147	1,638024
23	10,29	0,703502	11,485126	1,428326
24	11,55	0,177452	11,101097	0,201514
25	15,26	17,067227	14,808601	0,203761
26	12,35	1,491452	12,305857	0,001949
27	8,24	8,344877	8,749497	0,259587
28	10,41	0,516602	10,573475	0,026724
29	9,62	2,276327	9,806811	0,034898
30	10,76	0,135977	10,532588	0,051716
31	8,35	7,721452	8,842748	0,242801
32	10,31	0,670352	10,941740	0,399095
33	9,38	3,058127	9,174913	0,042061
34	14,93	14,449502	13,502339	2,038216
35	12,46	1,772227	12,436891	0,000534
36	10,45	0,460702	10,534678	0,007170
37	12,38	1,565627	0,330880
38	7,74	11,483627	9,872332	4,546840
39	14,49	11,298002	14,236792	0,064114
40	8,50	6,910327	7,582986	0,840915
Итого	445,150000	212,624438	445,152025	29,602363
В среднем	11,128750

Рассчитаем индекс множественной корреляции по формуле:

Значение стандартизованных коэффициентов регрессии и коэффициенты корреляции из примера 21.

Индекс множественной корреляции показывает, что между результативным признаком и всеми тремя включенными м модель факторами существует тесная связь (направление связи индекс множественной корреляции не определяет).

Индекс множественной детерминации:

Индекс множественной детерминации показывает, что 86% вариации результативного признака обусловлено влиянием включенных в модель факторов.

Расчет множественного индекса корреляции и множественного индекса детерминации произведем в программе Microsoft Excel рассмотрен в примере 20, рисунок 9.

. Рассчитаем частные коэффициенты корреляции по рекуррентной формуле:

Для этого воспользуемся матрицей парных коэффициентов корреляции из примера 20, (табл. 45).

Таблица 45

	Столбец 1 y	Столбец 2 x1	Столбец 3 x2	Столбец 4 x3	Столбец 5 x4
Столбец 1 y	1,000000
Столбец 2 x1	0,749996	1,000000
Столбец 3 x2	0,545459	0,188222	1,000000
Столбец 4 x3	0,731053	0,474013	0,466501	1,000000
Столбец 5 x4	0,640037	0,223318	0,549570	0,539163	1,000000

а) Рассчитаем частные коэффициенты корреляции и детерминации первого порядка.

коэффициенты частной корреляции и детерминации первого порядка между результативным признаком и фактором :

коэффициенты частной корреляции первого порядка между факторами (для расчета частных коэффициентов второго порядка):

б) Рассчитаем частные коэффициенты корреляции и детерминации второго порядка.

коэффициенты частной корреляции и детерминации второго порядка между результативным признаком и фактором :

Коэффициенты частной корреляции третьего порядка рассчитываем аналогичным образом через частные коэффициенты корреляции второго порядка.

2.4.2.5 Оценка надежности параметров множественной регрессии и корреляции

Оценка значимости множественного уравнения регрессии в целом проводится с помощью , (критерия Фишера).

(157)

где:

- факторная дисперсия (158)

- остаточная дисперсия (159)критерий можно рассчитать и по формуле:

(160)

где:

- число наблюдений

Если расчетный превышает табличный при определенном уровне значимости или , и числе свободы - , (таблицы Снедекора-Фишера - приложение 2) можно сказать, что уравнение множественной регрессии статистически значимо.

Величина позволяет также оценить статистическую значимость и коэффициента (индекса) множественной корреляции .

Кроме оценки уравнения в целом, большое практическое значение имеет статистическая оценка значимости каждого отдельно включенного в модель фактора, через частные критерии Фишера , (). Данная оценка позволяет оценить целесообразность включения в модель множественной регрессии каждого из факторов после введения в модель остальных факторов.

Расчет частного , для фактора проводится по формуле:

(161)

- коэффициент множественной детерминации для модели, включающей все факторы

- коэффициент множественной детерминации для модели, без включения фактора

Расчета частного в общем виде, для фактора проводится по формуле:

(162)

Расчета частного , для оценки значимости влияния фактора после включения в модель других факторов проводится по формуле:

(163)

Если величина расчетного частного превышает величину табличного при определенном уровне значимости или , и числе свободы - , (таблицы Снедекора-Фишера - приложение 2), можно сказать, что включение в модель фактора , после введения в модель остальных факторов, целесообразно. Если величина расчетного частного меньше табличного значения, можно сказать, что включение в модель фактора , после введения в модель остальных факторов, статистически неоправданно, и его необходимо исключить из рассматриваемой модели.

Зная величину частного критерия Фишера , рассчитывают частные критерии Стьюдента, для определения значимости каждого из коэффициентов чистой регрессии .

(164)

Критерий Стьюдента также можно рассчитать по формуле:

(165)

где:

- коэффициент чистой регрессии для фактора

- стандартная ошибка (166)

где:

- коэффициент детерминации множественного уравнения регрессии

- коэффициент множественной детерминации зависимости фактора со всеми остальными факторами уравнения множественной регрессии

- среднеквадратическое отклонение результативного признака

- среднеквадратическое отклонение факторного признака

Полученные фактические значения критерия Стьюдента сравнивают с табличными значениями при определенном уровне значимости , или , и числе степеней свободы (приложение 1). Если фактическое значение больше табличного соответствующий коэффициент регрессии статистически значим.

Фактические значения критерия Стьюдента сравнивают с табличными значениями при определенном уровне значимости , или , и числе степеней свободы , где - число исключенных переменных (приложение 1). Если фактическое значение больше табличного соответствующий коэффициент частной корреляции статистически значим.

Пример 22. По данным примеров 20 и 21 необходимо:

. провести оценку существенности уравнения регрессии и его параметров:

. рассчитать частные . Оценить с их помощью статистическую значимость включения факторов , , , решить вопрос включения в регрессионную модель одних факторов после включения других.

Решение.

. Оценку существенности множественного уравнения проведем, используя критерий Фишера (F-критерий)

где:

- число факторов включенных в регрессионную модель.

- число наблюдений

Табличное значение для данной модели при уровне значимости , и числе свободы - , (значение 35 в приложении 2 отсутствует, возьмем ближайшее значение 30) будет равно 2,69.

Расчетное значение значительно больше табличного, соответственно множественное уравнение регрессии признается статистически значимым.

Расчет фактического , в программе Microsoft Excel - рисунок 9.

. Рассчитаем частные для оценки значимости влияния фактора после включения в модель других факторов

Табличное значение при уровне значимости , и числе свободы - , будет равно 4,12.

а)

Фактическое значение больше табличного. Значит включение в модель фактора после факторов ,, статистически значимо.

б)

в)

г)

где: - коэффициент множественной детерминации для множественной регрессионной модели со всеми включенными в нее факторами.

- коэффициент множественной детерминации для множественной регрессионной модели без фактора .

Значения коэффициентов , , , , рассчитаем в программе Microsoft Excel, методика расчета рассмотрена в примере 20 рисунок 9.

. Статистическую оценку значимости коэффициентов регрессии по Стьюдента. Зная частные воспользуемся следующей формулой:

а)

б)

в)

г)

Табличное значение критерия Стьюдента при, и числе степеней свободы (значение 35 в приложении 1 отсутствует, возьмем ближайшее значение 30) равно 2,0423. Все фактические значения критерия Стьюдента больше табличного, то есть можно сделать вывод о статистической значимости всех коэффициентов регрессии .

Расчет и критериев Стьюдента для в программе Microsoft Excel приведен на рисунке 9. обозначен как F, а критерии Стьюдента как t-статистика.

Литература

Айвазян С.А., Иванова С.С. Эконометрика. Краткий курс: учеб. пособие / С.А. Айвазян, С.С. Иванова. - М.: Маркет ДС, 2007. - 104 с.

Бородич С.А. Вводный курс эконометрики: Учебное пособие. - Мн.: БГУ, 2010. - 354 с.

Бывшев В.А. Эконометрика: учеб. пособие / В.А. Бывшев. - М.: Финансы и статистика, 2008. - 480 с.

Доугерти Кристофер. Введение в эконометрику: Учебник для экон. спец. вузов / Пер. с англ. Е.Н. Лукаш и др. - М.: ИНФРА-М, 2007. - 402 с.

Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы: Учебник. - М.: Финансы и статистика, 2013. - 352 с.

Дуброва Т.А. Прогнозирование социально-экономических процессов. Статистические методы и модели: учеб. пособие / Т.А. Дуброва. - М.: Маркет ДС, 2007. - 192 с.

Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учебник. -3-е изд., перераб. и доп. - М.: Дело, 2010.- 400 с.

Методы математической статистики в обработке экономической информации: учеб. пособие / Т.Т. Цымбаленко, А.Н. Баудаков, О.С. Цымбаленко и др.; под ред. проф. Т.Т. Цымбаленко. - М.: Финансы и статистика; Ставрополь: АРГУС, 2007. - 200 с.

Палий И.А. Прикладная статистика: Учебное пособие. - М.: Издательско-торговая корпорация "Дашков и К", 2008. - 224 с.

Порядина О.В. Эконометрическое моделирование линейных уравнений регрессии: Учебное пособие. - Йошкар-Ола: МарГТУ, 2005. - 92 с.

Практикум по эконометрике: Учеб. пособие / И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2007. - 344 с.

Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2 т. 2-у изд., испр. - Т. 2: Айвазян С.А. Основы эконометрики. - М.: ЮНИТИ-ДАНА, 2001. - 432 с.

Симчера В.М. Методы многомерного анализа статистических данных: учеб. пособие. - М.: Финансы и статистика, 2008. - 400 с.

Чураков Е.П. Прогнозирование эконометрических временных рядов: учеб. пособие / Е.П. Чураков. - М.: Финансы и статистика, 2008. - 208 с.

Эконометрика: учеб. / под ред. д-ра экон. наук, проф. В.С. Мхитаряна. - М.: Проспект, 2008. - 384 с.

Эконометрика: учеб. / под ред. И.И. Елисеевой. - М.: Проспект, 2009. - 288 с.

Эконометрика: Учебник/И.И. Елисеева, С.В. Курышева, Т.В. Костеева и др., Под ред. И.И. Елисеевой. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2005. - 576 с.

Предмет и метод эконометрики. Эконометрические взаимосвязи

Предмет и метод эконометрики. Эконометрические взаимосвязи

Расчет доверительного интервала для функции регрессии

Расчет доверительного интервала для индивидуальных значений результативного признака

Спецификация модели множественной регрессии

Похожие работы на - Предмет и метод эконометрики. Эконометрические взаимосвязи