Факторы, влияющие на среднемесячную номинальную заработную плату населения по регионам Российской Федерации
Кафедра
Прикладной информатики и моделирования экономических процессов
Факторы,
влияющие на среднемесячную номинальную заработную плату населения по регионам
Российской Федерации
Специальность:
Эконометрика
Выполнила студентка
141 группы
курса
Очеретина Анастасия
Ивановна
Научный
руководитель :
К. ф.-м.н., старший
преподаватель
Я.Б. Панкратова
Санкт-Петербург
2016
Введение
Заработная плата уже долгое время привлекает к
себе внимание различных специалистов экономической сферы, таких как А. Смита,
У. Петти, К. Маркса, М. И. Туган-Барановского и других.
Заработная плата выражает интересы наёмных
рабочих, работодателей и государства в целом. Государство заинтересовано в том,
чтобы обеспечить рост благосостояния общества и социальную гармонию посредством
увеличения заработной платы.
Работодатели, устанавливая заработную плату,
стремятся увеличить прибыль своей компании и эффективность труда, рационально
использовать ресурсы производства.
Наёмные рабочие заинтересованы в том, чтобы их
труд оценивался по заслугам и заработная плата была бы равносильна вложенным
усилиям, а также способна была бы удовлетворить материальные и духовные
потребности.
Существующий продолжительное время на рынке
труда конфликт между интересами работников и работодателей обострился в
последние годы. В то время когда работники требуют увеличение оплаты их труда в
связи с растущими ценами в магазинах, работодатель стремится получить
максимальную прибыль при минимальных затратах, а в ряде случаях незаконно
уменьшая работнику заработную плату. Тем самым образуется "замкнутый
круг", из которого очень сложно найти выход.
Цель курсовой работы - выявить и изучить
факторы, влияющие на размер заработной платы, выбрать наиболее значимые факторы
и определить степень влияния данных факторов на среднемесячную номинальную
заработную плату работников за 2014 год.
Полученные результаты нельзя с уверенность
применять в сегодняшней практике, в силу того, что в 2014 году в России и в
мире был экономический кризис. Поэтому изучение данной зависимости по-прежнему
остаётся актуальным.
Анализ темы проводится с помощью
эконометрических методов по данным Федеральной службы государственной
статистики РФ.
Глава 1. Сбор данных и отбор факторов
Для проведения исследования были отобраны
следующие факторы, влияющие на среднемесячную заработную плату работников (y) в
2014 году:- численность населения за 2014 г;- численность экономически
активного населения в 2014 г., тыс. человек;- ВРП (валовой региональный
продукт) на душу населения в млрд. рублей за 2014 г;- объём инвестиций в
основной капитал в 2014 г., млн. руб.
Для исследования использовались данные,
выражающие вариацию факторов и результирующего признака по регионом
Центрального и Северо-Западного федеральных округов. Не были задействованы
данные по двум городам (Москва и Санкт-Петербург), а также по Московской
области. Это объясняется тем, что наблюдается серьёзное различие в
экономическом развитии и заработной платы, которое отражает поле корреляции.
В исследовании использовались данные Федеральной
службы государственной статистики, а также данные из единой межведомственной
информационно-статистической системы (ЕМИСС) за 2014 год.
Далее будет изучено влияние каждого из
приведённых выше факторов на среднемесячную заработную плату работников в
отдельности и влияние всех этих факторов.
Глава 2. Исследование влияния отельных факторов
2.1. Исследование влияния численности населения
на среднемесячную заработную плату работников по регионам
Представим исходные данные о среднемесячной
номинальной заработной плате и численности населения по регионам в виде
статистической таблицы, удобной для анализа (см. табл. 1).
Таблица 1
Среднемесячная номинальная
заработная плата и численность населения по регионам
Регион
|
Численность
населения за 2014 г. (x1)
|
Среднемесячная
номинальная з/п работников по полному кругу организаций за 2014 год, рублей
(y)
|
Белгородская
область
|
1
544 108
|
29821
|
Брянская
область
|
1
242 599
|
24668
|
Владимирская
область
|
1
413 321
|
27398
|
Воронежская
область
|
2
328 959
|
30172
|
Ивановская
область
|
1
043 130
|
26508
|
Калужская
область
|
1
004 544
|
34752
|
Костромская
область
|
656
389
|
25560
|
Курская
область
|
1
118 915
|
29183
|
Липецкая
область
|
1
159 866
|
30870
|
Орловская
область
|
769
980
|
27196
|
Рязанская
область
|
1
140 844
|
29678
|
Смоленская
область
|
967
896
|
27282
|
Тамбовская
область
|
1
068 934
|
27302
|
Тверская
область
|
1
325 249
|
30722
|
Тульская
область
|
1
521 497
|
31700
|
Ярославская
область
|
1
271 766
|
31575
|
Республика
Карелия
|
634
402
|
35726
|
Республика
Коми
|
872
057
|
49734
|
Архангельская
область
|
1
191 785
|
45634
|
Ненецкий
автономный округ
|
43
025
|
41980
|
Вологодская
область
|
1
193 371
|
35732
|
Калининградская
область
|
963
128
|
35577
|
Ленинградская
область
|
1
763 924
|
38448
|
Мурманская
область
|
771
058
|
57845
|
Новгородская
область
|
622
430
|
31221
|
Псковская
область
|
656
561
|
25694
|
Для изучения влияния фактора X1 на
результирующий признак Y сначала нужно построить поле корреляции (рис. 1).
Рис. 1 «Поле корреляции»
Из вида поля корреляции можно сделать
предположение, что между X1 и Y имеется обратная зависимость. Поэтому построим
модель парно-линейной регрессии и исследуем её качество.
С помощью функции ЛИНЕЙН из категории
«Статистические» построим модель парной линейной регрессии (см табл. 2).
Таблица 2
Модель парной линейной регрессии
|
b
|
a
|
|
|
-0,004
|
37004,448
|
|
mb
- стандартная ошибка коэфф., b
|
0,004
|
4272,704
|
mа
- стандартная ошибка коэфф., а
|
R^2
- коэфф., детерминации
|
0,038
|
8014,903
|
Sост.
- оценка стандартного отклонения остатков
|
F
статистика
|
0,940
|
24,000
|
Число
степеней свободы n-2
|
Регрессионная
сумма квадратов
|
60367425,19
|
1541728139
|
Остаточная
сумма квадратов
|
По найденной таблице было записано уравнение
выборочной регрессии (y^=37004,448-0,004х) и экономическая интерпретация
коэффициентов линейной регрессии: =-0,004 показывает, что при увеличении
численности населения на одного человека среднемесячная заработная плата
уменьшается на 0,4 копейки.
Коэффициент а интерпретировать невозможно, т.к.
Х не может быть равен 0.
Также, были вычислены остатки по
формуле () и построен
график остатков (см. рис.1).
Из вида поля корреляции можно
сделать предположение, что гетероскедастичность отсутствует, а присутствует
гомоскедастичность.
Проверим первое наше предположение
по тесту Голдфелда-Квандта и по тесту Спирмена. Оба теста указали на наличие
гомоскедастичности. Fg=0,29<Fkp=3,43, значит гетероскедастичность
отсутствует. Так как |tr|= 1,82<tkp=2,06, то предположение подтвердилось, в
модели присутствует гомоскедастичность.
Кроме того, из вида поля корреляции
можно предположить, что в модели присутствует положительная автокорреляция.
Используя критерий Дарбина-Уотсона мы выяснили, DW=1,45 принадлежит интервалу
[dl=1,3;du=1,46], следовательно гипотеза о положительной автокорреляции
отвергается, автокорреляция находится в зоне неопределенности. Это означает,
что у нас нет достаточных оснований для принятия решения.
Мною была найдена величина средней
ошибки аппроксимации =16,56% и был сделан следующий вывод: поскольку средняя
ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует
выборочные данные.
Для более уточненного анализа
производим проверку значимости регрессии в целом (по критерию Фишера). Находим
F-статистика и F-критическое.
Значение F-статистика берем из
таблицы (F-статистика), а F-критическое находим при помощи функции
FРАСПОБР(5%;1;24).
В результате получаем: статистика=
0,939; F-критическое=4,259.
Так как Fстат.< Fкр., то нет
основания отвергнуть гипотезу, но модель не значима в целом.
Говоря о значимости коэффициентов
регрессии (по критерию Стьюдента), нужно отметить, что коэффициент а является
значимым, т.к tа> tкр., а коэффициент b не значим, коэффициент r не значим
так как tb<tкр и tr<tкр. (см. табл. 3).
Таблица 3
Показатели значимости коэффициентов
ta
|
8,660661979
|
>
|
|
2,063898547
|
коэффициент
а значим
|
tb
|
-0,969400072
|
<
|
tкр
|
2,063898547
|
коэффициент
b не значим
|
tr
|
-0,969400072
|
<
|
|
2,063898547
|
коэффициент
r не значим
|
Был вычислен доверительный интервал линейной
регрессии. Были выявлены следующие результаты и выявлена экономическая
интерпретация только для значимых коэффициентов:
Значение параметра α
с
вероятностью 95% будет находиться в интервале [28186,01978; 45822,87636].
Значение параметра β
интерпретировать
невозможно, поскольку границы разного знака.
Далее был построен точечный прогноз значения Y
при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение
фактора равно 3264200,5. А прогнозное значение показателя у^р равно 25449,96.
Стандартная ошибка прогноза функции регрессии
получилась равной 8100,11, а ошибка индивидуального значения - 11395,19. Так же
вычислен доверительный интервал параметр для условного математического
ожидания: [8732,150812; 42167,77998] и доверительный интервал для
индивидуального значения [1931,433686; 48968,49727].
Оценим тесноту связи с помощью показателей
корреляции и детерминации.
Коэффициент корреляции rxy =-0,19.
Следовательно, по шкале Чеддока наблюдается очень слабая обратная зависимость
или вовсе отсутствует.
Коэффициент детерминации R2=0,038, говорит о
том, что лишь 3,8% вариации (дисперсии, разброса) среднемесячной заработной
платы объясняется изменением численности населения, а остальные 96,2%
факторами, не включёнными в модель.
Отсюда можно сделать вывод, что математическая
модель, выражающая данную зависимость объясняющей переменной, не подходит для
описания зависимой переменной. Поэтому включение данного фактора в модель
множественной регрессии нецелесообразно.
2.2. Исследование влияния численности
экономически активного населения на среднемесячную заработную плату работников
по регионам.
Представим исходные данные о среднемесячной
номинальной заработной плате и численности экономически активного населения по
регионам в виде статистической таблицы, удобной для анализа (см. табл. 4).
Таблица 4
Среднемесячная номинальная заработная плата и
численность экономически активного населения по регионам
Регион
|
Численность
экономически активного населения в 2014 г., тыс. человек, (х2)
|
Среднемесячная
номинальная з/п работников по полному кругу организаций за 2014 год, рублей (y)
|
Белгородская
область
|
812,2
|
29821
|
Брянская
область
|
627,1
|
24668
|
Владимирская
область
|
746,5
|
27398
|
Воронежская
область
|
1153,6
|
30172
|
Ивановская
область
|
524,2
|
26508
|
Калужская
область
|
541,6
|
34752
|
Костромская
область
|
334,7
|
25560
|
Курская
область
|
569,3
|
29183
|
Липецкая
область
|
594,2
|
30870
|
Орловская
область
|
394,8
|
27196
|
Рязанская
область
|
544,4
|
29678
|
Смоленская
область
|
545,5
|
27282
|
Тамбовская
область
|
512,4
|
27302
|
Тверская
область
|
712,3
|
30722
|
Тульская
область
|
808,1
|
31700
|
Ярославская
область
|
687,9
|
31575
|
Республика
Карелия
|
328,1
|
35726
|
Республика
Коми
|
500,1
|
49734
|
Архангельская
область
|
631,1
|
45634
|
Ненецкий
автономный округ
|
23,3
|
41980
|
Вологодская
область
|
628,2
|
35732
|
Калининградская
область
|
527,1
|
35577
|
Ленинградская
область
|
962,2
|
38448
|
Мурманская
область
|
468,3
|
57845
|
Новгородская
область
|
336,4
|
31221
|
Псковская
область
|
351,5
|
25694
|
Для изучения влияния фактора X2 на
результирующий признак Y сначала нужно построить поле корреляции (рис. 2).
Рис. 2 «Поле корреляции»
Из вида поля корреляции можно сделать
предположение, что между X2 и Y имеется обратная зависимость. Поэтому построим
модель парно-линейной регрессии и исследуем её качество.
С помощью функции ЛИНЕЙН из категории
«Статистические» построим модель парной линейной регрессии (см. табл. 5).
Таблица 5
Модель парной линейной регрессии
|
b
|
a
|
|
|
-4,354
|
35642,530
|
|
mb
- стандартная ошибка коэфф., b
|
7,235
|
4431,748
|
mа
- стандартная ошибка коэфф., а
|
R^2
- коэфф., детерминации
|
0,015
|
8109,345
|
Sост.
- оценка стандартного отклонения остатков
|
F
статистика
|
0,362
|
24,000
|
Число
степеней свободы n-2
|
Регрессионная
сумма квадратов
|
23820146,83
|
1578275417
|
Остаточная
сумма квадратов
|
По найденной таблице было записано уравнение
выборочной регрессии (y^=35642,448-4,354x)и экономическая интерпретация
коэффициентов линейной регрессии: =-4,354 показывает, что при увеличении
численности экономически активного населения на одного человека, среднемесячная
заработная плата. уменьшается на 4,3 рубля.
Коэффициент а интерпретировать невозможно, т.к.
Х не может быть равен 0.
Также, были вычислены остатки по
формуле () и построен
график остатков (см. рис. 3).
Из вида поля корреляции можно
сделать предположение, что гетероскедастичность отсутствует, а присутствует
гомоскедастичность. Проверим наше предположение по двум тестам: по тесту
Голдфелда-Квандта и тесту Спирмена. По тесту Голдфелда-Квандта наше
предположение подтвердилось. В модели действительно присутствует
гомоскедастичность, так как Fg=0,27 < Fkp=3,43. Однако тест Спирмена показал
противоположный результат, поскольку tr=2,105 > tкрит=2,063 в модели
присутствует гетероскедастичность. Такое разногласие, скорее всего, связано с
небольшим объемом выборки. Наличие гетероскедастичности приводит к тому, что
возникают большие остатки, что приводит к высоким ошибкам прогнозирования.
Кроме того, Из вида поля корреляции
можно сделать предположение, что автокорреляция отсутствует. Тест
Дарбина-Уотсона показал, что DW=1,56 принадлежит интервалу [du=1,46;
4-du=2,54], следовательно нет основания отклонять Hо - автокорреляция остатков
отсутствует, что обеспечивает состоятельность и эффективность оценок выборочных
коэффициентов регрессии.
Мною была найдена величина средней
ошибки аппроксимации =16,69% и был сделан следующий вывод: поскольку средняя
ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует
выборочные данные.
Для более уточненного анализа
производим проверку значимости регрессии в целом (по критерию Фишера). Находим
F-статистика и F-критическое.
Значение F-статистика берем из
таблицы (F-статистика), а F-критическое находим при помощи функции
FРАСПОБР(5%;1;24).
В результате получаем: статистика=
0,362; F-критическое=4,259.
Так как Fстат.< Fкр., то нет
основания отвергнуть гипотезу, но модель не значима в целом.
Говоря о значимости коэффициентов
регрессии (по критерию Стьюдента), нужно отметить, что коэффициент а является
значимым, т.к tа> tкр., а коэффициент b не значим, коэффициент r не значим
так как tb<tкр и tr<tкр. (см. табл. 6).
Таблица 6
Показатели значимости коэффициентов
ta
|
8,042544481
|
>
|
|
2,063898547
|
коэффициент
а значим
|
tb
|
-0,601847474
|
<
|
tкр
|
2,063898547
|
коэффициент
b не значим
|
tr
|
-0,601847474
|
<
|
|
2,063898547
|
коэффициент
r не значим
|
Был вычислен доверительный интервал линейной
регрессии. Были выявлены следующие результаты и выявлена экономическая
интерпретация только для значимых коэффициентов:
Значение параметра α
с
вероятностью 95% будет находиться в интервале [26495,85194; 44789,20832].
Значение параметра β
интерпретировать
невозможно, поскольку границы разного знака.
Далее был построен точечный прогноз значения Y
при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение
фактора равно 1715,20. А прогнозное значение показателя у^р равно 28173,80.
Стандартная ошибка прогноза функции регрессии
получилась равной 8424,58, а ошибка индивидуального значения - 11693,38. Так же
вычислен доверительный интервал параметр для условного математического ожидания:
[10786,30456; 45561,29799] и доверительный интервал для индивидуального
значения [4039,847983; 48968,49727].
Оценим тесноту связи с помощью показателей
корреляции и детерминации.
Коэффициент корреляции rxy =-0,12.
Следовательно, по шкале Чеддока наблюдается очень слабая обратная зависимость
или вовсе отсутствует.
Коэффициент детерминации R2=0,015, говорит о
том, что лишь 1,5% вариации (дисперсии, разброса) среднемесячной заработной
платы объясняется изменением численности экономически активного населения, а
остальные 98,5% факторами не включёнными в модель
Отсюда можно сделать вывод, что математическая
модель, выражающая данную зависимость объясняющей переменной, не подходит для
описания зависимой переменной. Поэтому включение данного фактора в модель
множественной регрессии нецелесообразно.
.3. Исследование влияния ВРП (на душу населения)
на среднемесячную заработную плату работников по регионам
Представим исходные данные о среднемесячной
номинальной заработной плате и валовом региональном продукте на душу населения
за 2014 год в виде статистической таблицы, удобной для анализа (см. табл. 7).
Таблица 7
Среднемесячная номинальная заработная плата и
ВРП на душу населения
Регион
|
ВРП
(валовой региональный продукт) на душу населения в млрд. рублей за 2014 г.
(х3)
|
Среднемесячная
номинальная з/п работников по полному кругу организаций за 2014 год, рублей
(y)
|
Белгородская
область
|
619,4
|
29821
|
Брянская
область
|
243,0
|
24668
|
Владимирская
область
|
327,9
|
27398
|
Воронежская
область
|
709,1
|
30172
|
Ивановская
область
|
26508
|
Калужская
область
|
324,9
|
34752
|
Костромская
область
|
146,3
|
25560
|
Курская
область
|
297,4
|
29183
|
Липецкая
область
|
395,7
|
30870
|
Орловская
область
|
179,7
|
27196
|
Рязанская
область
|
297,3
|
29678
|
Смоленская
область
|
234,7
|
27282
|
Тамбовская
область
|
275,8
|
27302
|
Тверская
область
|
307,4
|
30722
|
Тульская
область
|
408,5
|
31700
|
Ярославская
область
|
388,1
|
31575
|
Республика
Карелия
|
185,6
|
35726
|
Республика
Коми
|
480,9
|
49734
|
Архангельская
область
|
356,4
|
45634
|
Ненецкий
автономный округ
|
183,7
|
41980
|
Вологодская
область
|
388,4
|
35732
|
Калининградская
область
|
306,2
|
35577
|
Ленинградская
область
|
714,0
|
38448
|
Мурманская
область
|
320,3
|
57845
|
Новгородская
область
|
205,9
|
31221
|
Псковская
область
|
121,3
|
25694
|
Для изучения влияния фактора X3 на результирующий
признак Y сначала нужно построить поле корреляции (рис. 3).
Рис. 5 «Поле корреляции»
Из вида поля корреляции можно сделать
предположение, что между X3 и Y имеется прямолинейная зависимость. Поэтому
построим модель парно-линейной регрессии и исследуем её качество.
С помощью функции ЛИНЕЙН из категории
«Статистические» построим модель парной линейной регрессии ( см. табл. 8).
Таблица 8
Модель парной линейной регрессии
|
b
|
a
|
|
|
12,414
|
29061,719
|
|
mb
- стандартная ошибка коэфф., b
|
9,992
|
3641,100
|
mа
- стандартная ошибка коэфф., а
|
R^2
- коэфф., детерминации
|
0,060
|
7919,635
|
Sост.
- оценка стандартного отклонения остатков
|
F
статистика
|
1,543
|
24,000
|
Число
степеней свободы n-2
|
Регрессионная
сумма квадратов
|
96800688,73
|
1505294875
|
Остаточная
сумма квадратов
|
По найденной таблице было записано уравнение
выборочной регрессии (y^=29061,719+12,414x) и экономическая интерпретация
коэффициентов линейной регрессии: =12,414 показывает, что при увеличении ВРП
на1 млрд. рублей, среднемесячная заработная плата увеличивается на 12,414
рублей.
Коэффициент а интерпретировать невозможно, т.к.
Х не может быть равен 0.
Также, были вычислены остатки по
формуле () и построен
график остатков (см. рис. 3).
Из вида поля корреляции можно
сделать предположение, что гетероскедастичность отсутствует, а присутствует
гомоскедастичность.
Проверим первое наше предположение
по тесту Голдфелда-Квандта и по тесту Спирмена. Оба теста указали на наличие
гомоскедастичности. Fg=1,78<Fkp=3,43, значит гетероскедастичность
отсутствует. Так как |tr|= 0,35<tkp=2,06, то предположение подтвердилось, в
модели присутствует гомоскедастичность.
Из вида поля корреляции можно
сделать предположение, что автокорреляция отсутствует. Тест Дарбина-Уотсона
показал, что DW=2,05 принадлежит интервалу [du=1,46; 4-du=2,54], следовательно
нет основания отклонять Hо - автокорреляция остатков отсутствует, что
обеспечивает состоятельность и эффективность оценок выборочных коэффициентов
регрессии.
Мною была найдена величина средней
ошибки аппроксимации =16,11% и был сделан следующий вывод: поскольку средняя
ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует
выборочные данные.
Для более уточненного анализа
производим проверку значимости регрессии в целом (по критерию Фишера). Находим
F-статистика и F-критическое.
Значение F-статистика берем из
таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР
(5%;1;24).
В результате получаем: статистика=
1,543; F-критическое=4,259
Так как Fстат.< Fкр., то нет
основания отвергнуть гипотезу, но модель не значима в целом.
Говоря о значимости коэффициентов
регрессии (по критерию Стьюдента), нужно отметить, что коэффициент а является
значимым, т.к tа> tкр., а коэффициент b не значим, коэффициент r не значим
так как tb<tкр и tr<tкр. (см. табл. 9).
Таблица 9
Показатели значимости коэффициентов
ta
|
7,981575687
|
>
|
|
2,063898547
|
коэффициент
а значим
|
tb
|
1,242321648
|
<
|
tкр
|
2,063898547
|
коэффициент
b не значим
|
tr
|
1,242321648
|
<
|
|
2,063898547
|
коэффициент
r не значим
|
Значение параметра α
с
вероятностью 95% будет находиться в интервале [21546,85673; 36576,58047].
Значение параметра β
интерпретировать
невозможно, поскольку границы разного знака.
Далее был построен точечный прогноз значения Y
при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение
фактора равно 988,71. А прогнозное значение показателя у^р равно 41335,42.
Стандартная ошибка прогноза функции регрессии
получилась равной 6767,08, а ошибка индивидуального значения - 10417,008. Так
же вычислен доверительный интервал параметр для условного математического
ожидания: [27368,84514; 55302,00355] и доверительный интервал для
индивидуального значения [19835,77; 48968,49].
Оценим тесноту связи с помощью показателей
корреляции и детерминации.
Коэффициент корреляции rxy =0,24. Следовательно,
по шкале Чеддока наблюдается слабая прямо-линейная зависимость.
Коэффициент детерминации R2=0,06, говорит о том,
что 6% вариации (дисперсии, разброса) среднемесячной заработной платы
объясняется изменением ВРП, а остальные 74% факторами, не включёнными в модель.
Отсюда можно сделать вывод, что математическая
модель, выражающая данную зависимость объясняющей переменной, не подходит для
описания зависимой переменной. Поэтому включение данного фактора в модель
множественной регрессии нецелесообразно.
2.4 Исследование влияния объёма инвестиций в
основной капитал на среднемесячную заработную плату работников по регионам
Представим исходные данные о среднемесячной
номинальной заработной плате и объёме инвестиций в основной капитал за 2014 год
в виде статистической таблицы, удобной для анализа (см. табл. 10).
Таблица 10
Среднемесячная номинальная заработная плата и
объём инвестиций в основной капитал
Регион
|
Объём
инвестиций в основной капитал в 2014 г. Млн руб (х4)
|
Среднемесячная
номинальная з/п работников по полному кругу организаций за 2014 год, рублей
(y)
|
Белгородская
область
|
120390,6
|
29821
|
Брянская
область
|
66825,4
|
24668
|
Владимирская
область
|
75667
|
27398
|
Воронежская
область
|
243259,8
|
30172
|
Ивановская
область
|
29803,3
|
26508
|
Калужская
область
|
99785,7
|
34752
|
Костромская
область
|
27512,8
|
25560
|
Курская
область
|
71743
|
29183
|
Липецкая
область
|
110101,1
|
30870
|
Орловская
область
|
44931,1
|
27196
|
Рязанская
область
|
58209,9
|
29678
|
Смоленская
область
|
56747,1
|
27282
|
Тамбовская
область
|
112713,1
|
27302
|
Тверская
область
|
74491
|
30722
|
Тульская
область
|
95434,7
|
31700
|
Ярославская
область
|
76491,8
|
31575
|
Республика
Карелия
|
30834,6
|
35726
|
Республика
Коми
|
207421,6
|
49734
|
Архангельская
область
|
148128,8
|
45634
|
Ненецкий
автономный округ
|
84248
|
41980
|
Вологодская
область
|
63880,9
|
35732
|
Калининградская
область
|
64891,5
|
35577
|
Ленинградская
область
|
58501,1
|
38448
|
Мурманская
область
|
178777,4
|
57845
|
Новгородская
область
|
72254,8
|
31221
|
Псковская
область
|
64922,6
|
25694
|
Для изучения влияния фактора X4 на результирующий
признак Y сначала нужно построить поле корреляции (рис. 4).
Рис. 4 «Поле корреляции»
При рассмотрении графика сложно точно
предположить, какой вид зависимости существует между переменными. Однако мы
можем проанализировать следующие виды зависимостей:
Линейная зависимость;
Квадратичная зависимость;
Гиперболическая зависимость;
Степенная зависимость;
Показательная зависимость;
Экспоненциальная зависимость;
Логарифмическая зависимость.
Каждая из рассмотреннчых моделей получилась
значимой по критерию Фишера, поскольку Fстат>Fкр. Для того, чтобы выбрать
качественную модель, необходимо использовать следующие критерии:
Коэффициент детерминации R^2. С помощью него
можно оценить тесноту связи, и чем R^2 ближе к единице, тем лучше регрессия
описывает зависимость между зависимой и объясняющими переменными;
Средняя ошибка аппроксимации А. Лучше та модель,
у которой наименьшая ошибка аппроксимации. На практике значение этой ошибки в
пределах 5-7 % говорит о хорошем соответствии модели выбранным данным;
Стандартная ошибка регрессии Sост. Чем меньше
этот показатель, тем лучше построенная модель;
Метод абсолютных отклонений. Лучшая модель та,
которая имеет наименьший показатель МАD.
Для выбора лучшей модели рассмотрим таблицу
сравнения критериев:
Таблица 11
Таблица сравнения критериев
Тип
модели
|
R^2
|
A
|
Sost
|
MAD
|
1.
Линейная
|
0,290
|
15,00%
|
6886,262
|
5133,171311
|
2.
Квадратичная
|
0,314352636
|
14,86%
|
6910,837742
|
5103,553931
|
3.
Гиперболическая
|
0,177
|
16,49%
|
7413,272
|
5682,178706
|
4.
Степенная
|
0,262
|
14,50%
|
0,188
|
5112,279771
|
5.
Показательная
|
0,2709444
|
14,46%
|
0,1866305
|
5057,083385
|
6.
Экспоненциальная
|
0,2709444
|
14,46%
|
0,1866305
|
5057,083385
|
7.
Логарифмическая
|
0,2686112
|
15,46%
|
6987,3537596
|
5314,151177
|
В результате сравнения полученных критериев
наилучшей моделью является показательная и/или экспоненциальная. Она лучше
аппроксимирует выборочные данные и имеет более точный прогноз. Однако для
исследования факторов X3 и Y была выбрана линейная модель из-за ее простоты.
Поэтому построим модель парно-линейной регрессии и исследуем её качество.
С помощью функции ЛИНЕЙН из категории
«Статистические» строим модель парной линейной регрессии (см. табл. 12).
Таблица 12 инвестиция регрессия заработный капитал
Модель парной линейной регрессии
|
b
|
a
|
|
|
0,081
|
25855,921
|
|
mb
- стандартная ошибка коэфф., b
|
0,026
|
2695,486
|
mа
- стандартная ошибка коэфф., а
|
R^2
- коэфф., детерминации
|
0,290
|
6886,262
|
Sост.
- оценка стандартного отклонения остатков
|
F
статистика
|
9,785
|
24,000
|
Число
степеней свободы n-2
|
Регрессионная
сумма квадратов
|
464001142,5
|
1138094422
|
Остаточная
сумма квадратов
|
По найденной таблице было записано уравнение
выборочной регрессии (y^=25855,921+0,081x) и экономическая интерпретация
коэффициентов линейной регрессии:
Коэффициент b=0,081 показывает, что при
увеличении объёма инвестиций в основной капитал на 1 млн. рубл., среднемесячная
заработная плата увеличивается на 8,1 коп.
Коэффициент a=25855,921 показывает, что при
отсутствии инвестиций в основной капитал (X4=0), среднемесячная заработная
плата равна 25855,921 рубл.
Также, были вычислены остатки по
формуле () и построен
график остатков (см. рис. 4).
Из вида поля корреляции можно
сделать предположение, что гомоскедастичность отсутствует, а присутствует
гетероскедастичность. Проверим наше предположение по двум тестам: по тесту Голдфелда-Квандта
и тесту Спирмена. По тесту Голдфелда-Квандта наше предположение подтвердилось.
В модели действительно присутствует гетероскедастичность, так как Fg= 4,1 >
Fkp= 3,4. Однако тест Спирмена показал противоположный результат, поскольку tr=1,95<tкрит=2,06
в модели присутствует гомоскедастичность. Такое разногласие, скорее всего,
связано с небольшим объемом выборки. Наличие гетероскедастичности приводит к
тому, что возникают большие остатки, что приводит к высоким ошибкам
прогнозирования.
Кроме того, из вида поля корреляции
можно предположить, что в модели присутствует положительная автокорреляция.
Используя критерий Дарбина-Уотсона мы выяснили, DW=1,39 принадлежит интервалу
[dl=1,3;du=1,46], следовательно гипотеза о положительной автокорреляции отвергается,
автокорреляция находится в зоне неопределенности. Это означает, что у нас нет
достаточных оснований для принятия решения.
Мною была найдена величина средней
ошибки аппроксимации =15,00% и был сделан следующий вывод: поскольку средняя
ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует
выборочные данные. Незначительно превышает 7 %, поэтому можно считать, что
построенная модель является удовлетворительной.
Для более уточненного анализа
производим проверку значимости регрессии в целом (по критерию Фишера). Находим
F-статистика и F-критическое.
Значение F-статистика берем из
таблицы (F-статистика), а F-критическое находим при помощи функции
FРАСПОБР(5%;1;24).
В результате получаем: статистика=
9,784; F-критическое=4,259.
Так как Fстат.>Fкр., то модель
значима в целом.
Говоря о значимости коэффициентов
регрессии (по критерию Стьюдента), нужно отметить, что коэффициенты а, b и r
являются значимыми, т.к tа> tкр; tb>tкр и tr>tкр. (см. табл. 13).
Таблица 13
Показатели значимости коэффициентов
ta
|
9,592303964
|
>
|
|
2,063898547
|
коэффициент
а значим
|
tb
|
3,128066653
|
>
|
tкр
|
2,063898547
|
коэффициент
b значим
|
tr
|
3,128066653
|
>
|
|
2,063898547
|
коэффициент
r значим
|
Значение параметра а показывает, что при
отсутствии инвестиций в основной капитал с вероятностью 0,95 среднемесячная
заработная плата принимает значение в диапазоне [20292,7113; 31419,13052].
Значение параметра β
показывает,
что при увеличении инвестиций в основной капитал на 1 млн. рубл. с вероятностью
0,95 среднемесячная заработная плата увеличивается на значение в диапазоне
[0,027606745; 0,134690429].
Далее был построен точечный прогноз значения Y
при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение
фактора равно 269765,61. А прогнозное значение показателя у^р равно 47747,01.
Стандартная ошибка прогноза функции регрессии получилась равной 4857,05, а
ошибка индивидуального значения - 8426,83. Так же вычислен доверительный
интервал параметр для условного математического ожидания: [37722,55356;
57771,48587] и доверительный интервал для индивидуального значения
[30354,88429; 48968,49727].
Оценим тесноту связи с помощью показателей
корреляции и детерминации.
Коэффициент корреляции rxy =0,53. Следовательно
по шкале Чеддока между Х и У наблюдается заметная прямо-линейная зависимость.
Коэффициент детерминации R2=0,289, говорит о
том, что 28,9% вариации (дисперсии, разброса) среднемесячной заработной платы.
объясняется изменением численности населения, а остальные 71,1% факторами, не
включёнными в модель.
Отсюда можно сделать вывод, что математическая
модель, выражающая данную зависимость объясняющей переменной, подходит для
описания зависимой переменной. Поэтому данный фактор будет включён в модель
множественной регрессии.
Глава 3 Исследование влияния совокупности факторов
3.1 Процедура отбора переменных в множественной
линейной регрессии
Для того чтобы построить качественную модель
множественной регрессии, необходимо провести пошаговую процедуру включения
существенных переменных в анализируемую модель. Для этого вначале построим
корреляционную матрицу, найдём коэффициенты корреляции между всеми парами
объясняющих переменных и сделаем предположение о наличии или отсутствии
мультиколлинеарности (см. табл. 14).
Таблица 14
Корреляционная матрица
|
rx1x2
|
rx1x3
|
rx1x4
|
1
|
0,99178466
|
0,796576625
|
0,99178466
|
1
|
0,822579317
|
0,393064873
|
0,796576625
|
0,822579317
|
1
|
0,594123616
|
0,380174721
|
0,393064873
|
0,594123616
|
1
|
Можно сделать предположение о наличие
мультколлиниарности, поскольку между факторами x1 и x2, x1 и x3, x2 и x3
высокая взаимная зависимость(rxixj>0,7). Значит, не следует включать
одновременно факторы в модель.
Для того, чтобы определить, какой из факторов
связан с Y в большей степени и в какой последовательности следует включать
факторы в модель, необходимо построить скорректированную корреляционную матрицу
(см. табл. 15)
Таблица 15
Скорректированная корреляционная матрица
|
y
|
ryx1
|
ryx2
|
ryx3
|
ryx4
|
y
|
1
|
-0,194114115
|
-0,121934895
|
0,245807435
|
0,538164834
|
x1
|
-0,194114115
|
1
|
0,99178466
|
0,796576625
|
0,380174721
|
x2
|
-0,121934895
|
0,99178466
|
1
|
0,822579317
|
0,393064873
|
x3
|
0,245807435
|
0,796576625
|
0,822579317
|
1
|
0,594123616
|
x4
|
0,538164834
|
0,380174721
|
0,393064873
|
0,594123616
|
1
|
Исходя из полученных данных мы можем сделать
вывод, что первым в модель следует включать фактор х4 (объём инвестиций в
основной капитал), так как он имеет самый высокий коэффициент корреляции с
признаком у, затем фактор х3,х1,х2.
Следующим шагом необходимо проверить
целесообразность включения фактора х3 (валовый региональный продукт) в модель
ух4, используя частный критерий Фишера.
Так как частный критерий Фишера равен 0,28, а
табличное значение 4,28, то включение данного фактора в модель yx4
нецелесообразно.
Аналогично с фактором х1 (численность
населения), где Fч=8,15 > Fкр=4,28. Из этого следует, что фактор х1
целесообразно включать в модель ух4.
Последний фактор х2 (численность экономически
активного населения) включать в модель целесообразно, т.к. Fч=5,23>
Fкр=4,28.
Поскольку факторы х1 и х2 в модель yx4 включать
целесообразно, проверим целесообразность включения фактора х1 в модель ух2х4.
Получилось следующее: Fч=19,49>Fкр=4,3,
значит включение переменной х1 оправдано.
Таким образом, исключив нецелесообразный фактор
х3, можно приступить к построению множественной линейной регрессии х1, х2, x4.
3.2 Построение множественной регрессии
Для построения множественной регрессии нужно
исследовать влияние таких факторов, как:- численность населения за 2014 г;-
численность экономически активного населения в 2014 г., тыс. человек;- объём инвестиций
в основной капитал в 2014 г., млн. руб.
Объясняемым фактором по-прежнему является Y -
среднемесячная заработная плата работников за 2014 год. Исходные данные
представлены выборкой объема n=26.
С помощью функции ЛИНЕЙН из категории
«Статистические» построим модель множественной регрессии (см. табл. 16):
Таблица 16
Модель множественной регрессии
b4
|
b2
|
b1
|
a
|
0,097476688
|
131,4519007
|
-0,074594338
|
30395,69181
|
0,019434042
|
33,27883906
|
0,016894172
|
2698,538067
|
0,693103801
|
4727,468281
|
#Н/Д
|
#Н/Д
|
16,56182519
|
22
|
#Н/Д
|
#Н/Д
|
1110418525
|
491677039,6
|
#Н/Д
|
#Н/Д
|
Получим уравнение регрессии: y^=a+b1x1+b2x2
+b4x4, то есть y^= 30395-0,07х1+131,45х2+0,09х4
Дадим экономическую интерпретацию коэффициентов
множественной регрессии:
а - показывает, что если не будет численности
населения (х1=0), экономически активного населения (х2=0) и объёма инвестиций в
основной капитал (х4=0), то среднемесячная зарплата составит 30 395 руб.;-
показывает, что при увеличении численности населения на 1 человека, средняя
заработная плата уменьшается на 0,07 рублей, при неизменных остальных
факторах.- показывает, что при увеличении численности экономически активного
населения на 1 человека, средняя заработная плата увеличивается на 131 рубль,
при неизменных остальных факторах.- показывает, что при увеличении объёма
инвестиций в основной капитал на 1 млн. рубл., средняя заработная плата
увеличивается на 0,09 рублей, при неизменных остальных факторах.
Проверим значимость уравнения множественной
линейной регрессии в целом по критерию Фишера:
Fстатистика
|
16,56182519
|
>
|
Fкрит
|
3,049125006
|
Поскольку Fстат.>Fкрит., значит уравнение
регрессии значимо в целом.
Проверим значимость коэффициентов множественной
линейной регрессии по критерию Стьюдента при уровне значимости 5% (см. табл.
17):
Таблица 17
Показатели значимости коэффициентов
множественной регрессии
ta
|
11,26376247
|
>
|
|
|
а
значим
|
tb2
|
-4,415388812
|
>
|
tкр
|
2,073873058
|
b1
значим
|
tb3
|
3,950014616
|
>
|
|
|
b2
значим
|
tb4
|
5,015770066
|
>
|
|
|
b3
значим
|
Все факторы значимы, из этого следует, что их
можно использовать для дальнейшего исследования.
Для статистически значимых коэффициентов были
построены доверительные интервалы (см. табл. 18):
Таблица 18
Доверительные интервалы
α
|
24799,26641
|
35992,1172
|
β1
|
-0,109630706
|
-0,03955797
|
β2
|
62,43581295
|
200,4679884
|
β4
|
0,057172951
|
0,137780424
|
Дадим их экономическую интерпретацию:
α - показывает, что
если не будет численности населения (х1=0), экономически активного населения
(х2=0) и объёма инвестиций в основной капитал (х4=0), то среднемесячная зарплата
изменяется в пределах [24799,3; 35992,1] с вероятностью 95%.
β1 - показывает, что при
увеличении численности населения на 1 человека, средняя заработная плата
изменяется в пределах [-0,109; -0,039] с вероятностью 95%
β2 - показывает, что при
увеличении численности экономически активного населения на 1 человека, средняя
заработная плата изменяется в пределах [62,435; 200,467] с вероятностью 95%
β4 - показывает, что при
увеличении объёма инвестиций в основной капитал на 1 млн. рубл., средняя
заработная плата изменяется в пределах [0,057; 0,137] с вероятностью 95%
Говоря о качестве построенной регрессии следует
отметить, что модель имеет неплохую объясняющую способность, поскольку
коэффициент детерминации R^2= 0,69 показывает, что 69% изменения средней заработной
платы объясняется изменениями факторов, включенных в модель, а остальные 31% не
включенными факторами.
Так как R² близок
к 1, уравнение регрессии неплохо аппроксимирует эмпирические данные.
Средняя ошибка аппроксимации (A=11,10% > 10%)
незначительно превышает 10%, поэтому можем считать, что построенная модель
является удовлетворительной.
Был вычислен скорректированный коэффициент
детерминации: R^2adj=0,65.
В ходе исследования были найдены
стандартизованные коэффициенты регрессии b'i и частные средние коэффициенты
эластичности Эi. '=-4,09;'=3,68;'=0,64.
Поскольку b1' больше, чем все остальные
стандартизированные коэффициенты, можем считать, что фактор x1 (численность
населения) больше влияет на y (среднемесячная заработная плата), чем другие
факторы (x2,х4)
Средней коэффициент эластичности Эср1=-2,44
показывает, что при увеличении x1 (численности населения) на 1 %, у
(среднемесячная заработная плата) уменьшается на 244%. Средней коэффициент
эластичности Эср2=2,26 показывает, что при увеличении х2 (численности
экономически активного населения) на 1%, у (среднемесячная заработная плата)
увеличивается на 226%. Средней коэффициент эластичности Эср4=0,26 показывает,
что при увеличении x4 (объёма инвестиций в основной капитал ) на 1 %, y
(среднемесячная заработная плата ) увеличивается на 26%.
Чтобы определить наличие мультиколлинеарности в
данной модели, необходимо построить матрицу выборочных коэффициентов корреляции
Q с помощью функции КОРЕЛЛ (см. табл. 19).
Таблица 19
Матрица выборочных коэффициентов корреляции Q
|
|
rx1х2
|
rx1х4
|
|
|
1
|
0,99178466
|
0,380174721
|
|
rx1х2
|
0,99178466
|
1
|
0,393064873
|
rx2х4
|
|
0,380174721
|
0,393064873
|
1
|
|
|
rx1х4
|
rx2х4
|
|
|
Проанализировав полученную матрицу, можно
предположить, что между факторами х1 и х2 существует мультиколлинеарность, так как
rx1x2 больше 0,7.
Необходимо проанализировать частные коэффициенты
детерминации, которые были получены в результате возведения в квадрат частных
коэффициентов корреляции:^2yx1 = 0,47 показывает, что на 47 % изменение средней
заработной платы объясняется изменением численности населения, а оставшиеся 53
% - факторами, не включёнными в модель.^2yx2 =0,41 показывает, что на 41 %
изменение средней заработной платы объясняется изменением численности
экономически активного населения, а оставшиеся 59 % - факторами, не включёнными
в модель.^2yx4 =0,53 показывает, что на 53% изменение средней заработной платы
объясняется изменением объёма инвестиций в основной капитал, а оставшиеся 47 %
- факторами, не включёнными в модель.
В результате проверки значимости частных
коэффициентов корреляции было выявлено, что все коэффициенты значимы, так как
tr>tкр по модулю.
tryx1/x2x4
|
-4,415388812
|
tryx2/x1x4
|
3,950014616
|
tryx4/x1x2
|
5,015770066
|
tкр(5%,
22)=
|
2,073873058
|
Чтобы убедиться в наличии
мультиколлинеарности вычислим определитель матрицы =1,52374E+29.
По этому критерию мультиколлиниарность отсутствует, поскольку определитель
матрицы не равен нулю.
Таким образом, при построении
множественной модели не удалось полностью избежать мультиколенниарность ,
поскольку между факторами х1 и х2 она существует, так как rx1x2 больше 0,7.
Поэтому, необходимо построить модель, состоящую из двух факторов, х2 и х4. О
том, какая модель является лучшей будет сказано в заключение.
Заключение
Во время проведения исследования
была выявлена и изучена зависимость каждого фактора на результирующий признак
как в отдельности, так и в совокупности. Для этого были построены четыре парные
линейные регрессии и две модели множественной регрессии.
Проведённое исследование показало,
что значимыми можно признать не все построенные модели. Модель, отражающая
зависимость среднемесячной номинальной заработной платы от численности
населения, а также модель, отражающая зависимость среднемесячной номинальной
заработной платы от численности экономически активного населения и модель,
отражающая зависимость среднемесячной номинальной заработной платы от валового
регионального продукта являются незначимыми. Модель, отражающая зависимость
среднемесячной номинальной заработной платы от объёма инвестиций в основной
капитал значима.
Для того чтобы построить
качественную множественную регрессию, необходимо, во-первых, проверить
отсутствие или присутствие мультиколлинеарности в модели, во-вторых проверить
целесообразность включения фактора хi в модель, используя частный критерий
Фишера. Построив корреляционную матрицу, обнаружилось, что между факторами
x1x2, x1x3, x2x3 высокая взаимная зависимость, а значит можно сделать
предположение о наличие мультколлиниарности. Это говорит о том, что не следует
включать одновременно факторы в модель. Поскольку фактор х4 имеет самый высокий
коэффициент корреляции с признаком у, значит его следует включить в модель
первым, а затем фактор х3,х1,х2. Как оказалось не все факторы можно включать в
модель множественной регрессии. Включение фактора х3 в модель ух4
нецелесообразно, поскольку Fч=0,27<Fкр=4,27. Поэтому фактор х3 был исключён
из модели. Сделав проверку включения факторов х1 в модель ух4, а также х2 в
модель ух4, а затем х1 в модель ух2х4, оказалось, что включение всех этих
факторов целесообразно. Поэтому для исследования была построена модель
множественной регрессии y^=a+b1x1+b2x2+b4x4 или
y^=30395-0,07х1+131,45х2+0,09х4.
Полученной модели можно дать
экономическую интерпретацию: при увеличении численности населения на 1
человека, средняя заработная плата уменьшается на 0,07 рублей, при неизменных
остальных факторах; при увеличении численности экономически активного населения
на 1 человека, средняя заработная плата увеличивается на 131 рубль, при неизменных
остальных факторах; при увеличении объёма инвестиций в основной капитал на 1
млн. рубл., средняя заработная плата увеличивается на 0,09 рублей, при
неизменных остальных факторах. Коэффициент а интерпретировать невозможно, так
как тяжело представить регион, где не существует людей, способных и желающих
работать и где нет инвестиций в основной капитал.
Анализ данной модели установил, что
69% изменения средней заработной платы в 2014 году объясняется изменением
численности населения, численности экономически активного населения и объёма
инвестиций в основной капитал. При увеличении x1 (численности населения) на 1
%, у (среднемесячная заработная плата) уменьшается на 244%. При увеличении х2
(численности экономически активного населения) на 1%, у (среднемесячная
заработная плата) увеличивается на 226%. При увеличении x4 (объёма инвестиций в
основной капитал ) на 1 %, y (среднемесячная заработная плата ) увеличивается
на 26%.
Данная модель значима в целом по
критерию Фишера, с удовлетворительной ошибкой аппроксимации и достаточно
большим коэффициентов детерминации, т.е. в целом пригодной для прогнозирования.
Однако между факторами х1 и х2 существует мультиколлинеарность в стохастической
форме. Определитель матрицы хоть и отличен от нуля, но очень
мал. Однако стандартные ошибки коэффициентов регрессии получились небольшими, и
коэффициенты получились значимы по t-критерию. Несмотря на то, что свойства
несмещённости и эффективности оценок остаются в силе, мультиколлинеарность в
любом случае затрудняет разделение влияния объясняющих переменных на поведение
зависимой переменной и делает оценки коэффициентов регрессии ненадёжными.
Но следует иметь в виду, что у
нескольких факторов, а именно х2 и х4, нельзя точно определить присутствует
гомоскедастичность или гетероскедастичность, так как результаты тестов
Голдфелда-Квандта и Спирмена противоречат друг другу. Скорее всего, неточность
связана с небольшим объёмом выборки. Кроме того, у факторов х1 и х4
автокорреляция находится в зоне неопределенности. Это означает, что у нас нет
достаточных оснований для принятия решения. Все этого говорит о том, что в
построенной модели возможны ошибки, которые следует принять к сведению при
построении прогнозов.
Чтобы уменьшить наличие
мультиколлинеарности было решено исключить из модели y^=a+b1x1+b2x2+b4x4
переменную х1.
Была построена множественная
регрессия y^=a+b2x2+b4x4 или y^=31806-14,08х2+0,104х4.
Несмотря на отсутствие
мультиколлинеарности данная модель, по -моему мнению, получилась хуже.
Сделаем сводную таблицу и сравним
модель парной регрессии, которая значима, и модели множественной регрессии по
наиболее существенным критериям (см. табл. 20):
Таблица 20
Сравнение моделей
Тип
модели
|
R^2
|
R^2adj
|
Sост
|
MAD
|
A
|
Парная
y^=a+bx4
|
0,289621389
|
0,26002228
|
6886,261751
|
5133,171311
|
15,00%
|
y^=a+b1x1+b2x2+b4x4
|
0,693103801
|
0,651254319
|
4727,468281
|
3603,473623
|
11,10%
|
y^=a+b2x2+b4x4
|
0,421142735
|
0,37080732
|
6349,887562
|
4626,062355
|
13,89%
|
Как мы видим, по большинству критериев лучшая
модель - множественная модель с тремя факторами y^=a+b1x1+b2x2+b4x4. Данная
модель в большей степени влияет на величину заработной платы, чем остальные.
Скорее всего это связано с тем, что сами работники, их количество и инвестиции
в основной капитал заставляют работодателей изменять величину заработной платы.
В заключении хотелось бы отметить, что данный
вопрос требует особого внимания и дальнейшего изучения, так как заработная
плата играет значительную роль в развитии экономики, государства и жизни
каждого человека. Дальнейшее изучение данного вопроса поможет в построении
прогнозов и принятии целесообразных решений, а возможно приведёт к более
качественной модели.
Список использованных источников
Евсеев
Е.А., Буре В.М., Эконометрика: Учебник, Изд-во МБИ, 2007 г.
Тарашнина
С. И., Панкратова Я.Б., Выполнение курсовой работы по эконометрике:
учебно-методическое пособие, 2007 г.
Курс
эконометрика: электронный ресурс URL:
http://eos.ibi.spb.ru/course/view.php?id=608
Сайт
федеральной статистики: электронный ресурс URL: <http://www.gks.ru/>
Федеральная
служба государственной статистики (Росстат): электронный ресурс URL:
http://government.ru/department/250/events/