корреляционный детерминация анализ переменный
Результаты предварительных корреляционного анализа и анализа рядов указывают на возможность нарушения предпосылок МНК об отсутствии мультиколлинеарности и автокорреляции соответственно.
. ПОСТРОЕНИЕ И АНАЛИЗ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ
.1 АНАЛИЗ ИСХОДНОЙ МОДЕЛИ НА СООТВЕТСТВИЕ ПРЕДПОСЫЛКАМ МНК
В ходе работы была получена следующая эконометрическая модель:
= 1519.730+5178.134*X1-217.0063*X2+0.004311*X3
R2 = 0,8264 P (F) = 0,000 DW = 0,5217 (Приложение 2)
Несмотря на высокое значение коэффициента детерминации и нулевое P-значение F-статистики, необходимо заметить, что P-значения всех переменных выходят за 5%-ный уровень. Это говорит о статистической незначимости коэффициентов на приведенных уровнях. А модель, составленная из незначимых экзогенных переменных, не может быть адекватной.
Высокое значение коэффициента детерминации при низких t-статистиках экзогенных переменных есть формальный признак наличия в модели мультиколлинеарности. Это предположение подтверждается также предварительным корреляционным анализом, где высокие коэффициенты корреляции указывали на сильные связи между переменными.
Совокупность корреляционного анализа и низких t-статистик свидетельствуют об отклонении от предпосылки МНК об отсутствии мультиколлинеарности в модели.
Следующей проверяемой предпосылкой будет отсутствие автокорреляции в модели. Предварительный анализ стохастических свойств рядов переменных определил нестационарность всех рядов: как эндогенной переменной «уровень депозитов», так и всех экзогенных переменных. В большинстве случаев последствием этого является наличие автокорреляции в модели.
Кроме анализа стохастических свойств рядов, существует ряд тестов для определения наличия автокорреляции в модели, такие как статистика Дарбина-Уотсона, автокорреляционная функция, тест Бреуша-Годфри (Бройша-Годфри).
Статистика DW (DW = 0,5217), свидетельствует о наличии сильной положительной автокорреляции первого порядка, поскольку dl(5,37) = 1,19, что больше, чем в 2 раза, превышает полученные значения DW.
При проведении автокорреляционной функции ACF отчетливо заметна сильная автокорреляция первого и второго порядков, которые накладываются и на остальные порядки (P-значение во всех лагах равно 0,000).
В заключении приводится Тест Бреуша-Годфри, который только подтверждает вывод о наличии автокорреляции в модели:
=Obs*R-squared = 37*0.563014 = 20.83150; P (1) = 0,000;
Заключительной проверяемой предпосылкой МНК является предпосылка о наличии гомоскедастичности в модели. Она проверяется с помощью теста Вайта:
= Obs*R-squared = 37*0.752840=27.85509; P (19) = 0.0863
Полученные значения свидетельствуют об отсутствии гетероскедастичности в модели на 8,63%-ном уровне.
Таким образом, в полученной модели нарушаются предпосылки метода наименьших квадратов об отсутствии мультиколлинеарности и автокорреляции, поэтому данная модель не является статистически значимой. Модель не пригодна для объяснения зависимости изменения численности населения от изменения социально-экономических условий в стране.
.2 АНАЛИЗ УЛУЧШЕННОЙ МОДЕЛИ
Первой предпосылкой, которая исправляется в данной работе, является мультиколлинеарность. Существуют разные способы удаления ее из модели, но единственным подходящим для приведенных данных является исключение наиболее коррелирующих с остальными переменных (наиболее грубый из способов).
Чтобы все переменные стали статистически значимыми из исходной модели пришлось исключить X2. Это было вынужденное действие, т.к. при сохранении этой переменной модель резко ухудшалась. Таким образом, была получена новая модель (Приложение 3):
Y = 12.0497 - 7.0616e-11*X1 + 0.1362*X3
(P) (0,000) (0,000) (0,000)2 = 0,7707 P (F) = 0,000 DW = 0,497849
После удаления незначимых переменных произошли существенные положительные изменения в модели:
.отчетливо видно, что все переменные и даже свободный член статистически значимы (P-Значения равны нулю);
.изменился знак при коэффициенте X1, что сделало модель полностью соответствующей теории;
Но также сохранились или появились и отрицательные стороны в модели:
.Уменьшилось значение коэффициента детерминации, хоть и не существенно;
.Статистика DW еще больше снизилась;
.По тесту Бреуша-Годфри (BG=Obs*R-squared = 37*0.542709 = 20.08024; P (1) = 0,000) особых изменений не произошло;
.Полученные значения в тест Вайта немного ухудшились (Wh=Obs*R-squared = 37*0,282830= 10,46470; P (5) = 0,0631)
В качестве вывода можно сказать, что удаление незначимой переменной улучшило модель, но только относительно устранения мультиколлинеарности. Наличие автокорреляции сохраняется. Необходимо дальнейшее улучшение модели.
.3 АВТОРЕГРЕССИОННАЯ СХЕМА КАК МЕТОД УСТРАНЕНИЯ АВТОКОРРЕЛЯЦИИ
В качестве коэффициента авторегрессии берется оценка по статистике Дарбина-Уотсона из предыдущей модели: p=1-DW/2.
Была получена следующая модель (Приложение 4):
Y-0.7510755*Y(-1) = 3.0514 - 5.58048e-11*(X1-0.7510755*X1(-1)) + 0.06102*(X3-0.7510755*X3(-1))
P (C) = 0,000;(X1-0.7510755*X1(-1)) = 0,0151;(X3-0.7510755*X3(-1)) = 0,0997.= 0,198673 P (F) = 0,025874 DW = 1,441937.
Внесенные в модель изменения можно трактовать по-разному. С одной стороны, P-Значения экзогенных переменных выросли, по сравнению с исходным вариантом. Но все же на 10%-ном уровне все переменные являются значимыми.
А с другой стороны, коэффициент Дарбина-Уотсона увеличился практически в 3 раза и теперь указывает на отсутствие автокорреляции первого порядка (dl(2,37) = 1,36 < DW = 1,44 < du(2,37) = 1,59).
Автокорреляционная функция подтверждает выводы об отсутствии автокорреляции первого порядка в улучшенной модели, но существует вероятность присутствия автокорреляции второго порядка.
Для опровержения данного предположения проверим значение BG, полученное с помощью теста Бреуша-Годфри второго порядка:
=Obs*R-squared = 36*0.125729 = 4.526260; P (2) = 0,1040;
Полученное значение свидетельствует об отсутствии автокорреляции на 10,4%-ном уровне.
Тест Вайта определяет отсутствие гетероскедастичности:
=Obs*R-squared = 36*0,184078= 6.626822; P (5) = 0,2499.
Таким образом, использование авторегрессионной схемы позволило получить адекватную модель:
.Несмотря на то, что коэффициент детерминации является низким (R2 = 0,198673), он значим, т.к. P (F) = 0,025874, т.е. с помощью этой модели можно объяснить только пятую часть изменений в уровне депозитов, но это объяснение будет значимым;
.все экзогенные переменные являются статистически значимыми на 10%-ном уровне;
.все предпосылки МНК соблюдаются (на 10%-ном уровне).
ЗАКЛЮЧЕНИЕ
В данной работе производился анализ влияния доходов банка, ставки рефинансирования и валютного курса на уровень депозитов. В качестве изначальной гипотезы была выдвинута гипотеза о обратно прямо пропорциональной связи между этими показателями.
Исходная гипотеза была подтверждена в данной работе на основании данных с ноября 2010 по октябрь 2013 года.
По исходным данным была построена эконометрическая модель, которую, несмотря на высокий коэффициент детерминации, нельзя было отнести к адекватным, ввиду отсутствия выполнимости всех предпосылок МНК.
Для исправления смещения точечных оценок коэффициентов при экзогенных переменных (последствие присутствия мультиколлинеарности в модели; несоответствие знака при X1 экономической теории) была удалена незначимая переменная X2. Данное изменение улучшило модель лишь частично.
После применения авторегрессионной схемы модель получилась адекватной и статистически значимой. Все предпосылки МНК соблюдаются, коэффициенты не смещены. Единственным минусом данной модели является низкая объясняющая способность (низкий коэффициент детерминации). Несмотря на то, что по F-статистике коэффициент детерминации является значимым, вряд ли данную модель можно использовать для анализа изменения уровня депозитов.
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1.Экономика. Толковый словарь. - М.: "ИНФРА-М", Издательство "Весь Мир". Дж. Блэк. Общая редакция: д.э.н. Осадчая И.М.. 2000.
.С. А. Бардасов. ЭКОНОМЕТРИКА: учебное пособие. 2-е изд., пере- раб. и доп. Тюмень: Издательство Тюменского государственного университета,2010. 264 с., 2010
3.Депозиты в банках // infobank.by [электронный ресурс]. - 2013. -Режим доступа: <#"justify">4.
ПРИЛОЖЕНИЕ А
Исходные данные
ObsYX1X2X310.201396721.7125723.59148.2109.201395348.41198.423.59031.8808.201393527.21012.923.58915.8707.20139205192623.58839.9606.201391123.5715.123.58713.9405.201390713.3451.1258674.9904.201389742.6414278650.4203.201386722515.228.58622.4702.201384123.2620.4308627.4301.201378973.8525.8308629.0112.201276653.2815308565.9611.201273987.5956.3308544.2610.201274113.21013.2308525.5309.201269237.3865.7308428.4508.201267017834.530.58333.8407.201266220.9645.7318325.3706.201260214323.8328310.2505.201248513.2237.6348171.0804.201241227.3231.8368059.3203.201239437.7354.6388105.8602.201237687.2523.3438288.8001.201238901.9915.5458389.9712.201137987.31307.6408470.0911.201140413.21347.4358700.8910.201131671.61013.2306551.3809.201125523.5704.3275363.3708.201123457.3450.6205016.3507.201122997.2230.7184970.3706.201120573.4205.7164976.2105.201119764170.2143547.9704.201118742.2156.3133048.2703.201119157.3176.8123013.0202.201119542.5185.310.53015,1901.201119094.2187.210.53010.8412.201018632.2199.710.53010.9811.201019452.3144.710.53026.94
ПРИЛОЖЕНИЕ Б
Исходная модель и тесты
Dependent Variable: YMethod: Least SquaresDate: 12/12/13 Time: 20:04Sample: 2010:11 2013:10Included observations: 37VariableCoefficientStd. Errort-StatisticProb.C41.6592016.467012.5298580.0167X13.73E-113.98E-110.9348350.3571X20.0584280.0399101.4640060.1533X30.0397740.0492790.8071310.4257
Breusch-Godfrey Serial Correlation LM Test:F-statistic38.65202Prob. F(1,30)0.0000Obs*R-squared20.83150Prob. Chi-Square(1)0.0000Test Equation:Dependent Variable: RESIDMethod: Least SquaresDate: 12/12/13 Time: 20:14Sample: 2010:11 2013:10Included observations: 37Presample missing value lagged residuals set to zero.VariableCoefficientStd. Errort-StatisticProb.C-12.9437211.25961-1.1495720.2594X1-2.45E-112.71E-11-0.9058880.3722X2-0.0253470.027127-0.9343880.3576X30.0221140.0333050.6639900.5118RESID(-1)0.8010420.1288466.2170750.0000R-squared0.563014Mean dependent var3.43E-15Adjusted R-squared0.475616S.D. dependent var0.453725S.E. of regression0.328562Akaike info criterion0.780477Sum squared resid3.238593Schwarz criterion1.085245Log likelihood-7.438818Hannan-Quinn criter.0.887922F-statistic6.442003Durbin-Watson stat1.963079Prob(F-statistic)0.000192
Heteroskedasticity Test: WhiteF-statistic2.725337Prob. F(19,17)0.0213Obs*R-squared27.85509Prob. Chi-Square(19)0.0863Scaled explained SS9.012545Prob. Chi-Square(19)0.9733Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 12/12/13 Time: 20:26Sample: 2010:11 2013:10Included observations: 37Collinear test regressors dropped from specificationVariableCoefficientStd. Errort-StatisticProb.C-109.283443.72458-2.4993580.0230X15.77E-093.47E-091.6628680.1147X1^27.08E-215.16E-211.3717350.1880X1*X2-3.33E-113.42E-11-0.9747190.3434X1*X3-2.25E-112.81E-11-0.8019460.4337X24.1305816.0075720.6875620.5010X2^2-0.0227160.015133-1.5011210.1517X2*X3-0.0454130.035852-1.2666700.2224X36.7491503.1236752.1606440.0453X3^2-0.0062030.007138-0.8690240.3969R-squared0.752840Mean dependent var0.200303Adjusted R-squared0.476603S.D. dependent var0.194968S.E. of regression0.141052Akaike info criterion-0.776003Sum squared resid0.338225Schwarz criterion0.094764Log likelihood34.35605Hannan-Quinn criter.-0.469017F-statistic2.725337Durbin-Watson stat2.587745Prob(F-statistic)0.021341
ПРИЛОЖЕНИЕ В
Удаление незначимой переменной из модели
Dependent Variable: YMethod: Least SquaresDate: 12/12/13 Time: 21:06Sample: 2010:11 2013:10Included observations: 37VariableCoefficientStd. Errort-StatisticProb.C12.049720.19248662.600640.0000X1-7.06E-111.45E-11-4.8725420.0000X30.1362130.0231925.8733350.0000R-squared0.770675Mean dependent var12.27838Adjusted R-squared0.757186S.D. dependent var1.088867S.E. of regression0.536552Akaike info criterion1.670298Sum squared resid9.788195Schwarz criterion1.800913Log likelihood-27.90052Hannan-Quinn criter.1.716346F-statistic57.13072Durbin-Watson stat0.497849Prob(F-statistic)0.000000
Breusch-Godfrey Serial Correlation LM Test:F-statistic39.16416Prob. F(1,33)0.0000Obs*R-squared20.08024Prob. Chi-Square(1)0.0000Test Equation:Dependent Variable: RESIDMethod: Least SquaresDate: 12/12/13 Time: 21:26Sample: 2010:11 2013:10Included observations: 37Presample missing value lagged residuals set to zero.VariableCoefficientStd. Errort-StatisticProb.C-0.0413380.132288-0.3124850.7566X15.19E-129.98E-120.5196650.6068X30.0030730.0159260.1929310.8482RESID(-1)0.7411430.1184296.2581270.0000R-squared0.542709Mean dependent var-1.32E-16Adjusted R-squared0.501137S.D. dependent var0.521435S.E. of regression0.368291Akaike info criterion0.941917Sum squared resid4.476051Schwarz criterion1.116070Log likelihood-13.42546Hannan-Quinn criter.1.003314F-statistic13.05472Durbin-Watson stat1.914917Prob(F-statistic)0.000009
Heteroskedasticity Test: WhiteF-statistic2.445086Prob. F(5,31)0.0559Obs*R-squared10.46470Prob. Chi-Square(5)0.0631Scaled explained SS5.575125Prob. Chi-Square(5)0.3498Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 12/12/13 Time: 21:42Sample: 2010:11 2013:10Included observations: 37VariableCoefficientStd. Errort-StatisticProb.C0.3046780.1943851.5673960.1272X14.61E-113.40E-111.3577440.1843X1^2-3.81E-211.54E-21-2.4687870.0193X1*X31.09E-115.05E-122.1648130.0382X3-0.0527340.046798-1.1268500.2685X3^20.0026490.0026231.0099010.3204R-squared0.282830Mean dependent var0.264546Adjusted R-squared0.167157S.D. dependent var0.301268S.E. of regression0.274937Akaike info criterion0.402847Sum squared resid2.343309Schwarz criterion0.664077Log likelihood-1.452675Hannan-Quinn criter.0.494943F-statistic2.445086Durbin-Watson stat1.359347Prob(F-statistic)0.055886
ПРИЛОЖЕНИЕ Г
Авторегрессионная схема как метод устранения автокорреляции в модели
Dependent Variable: Y-0.7510755*Y(-1)Method: Least SquaresDate: 12/12/13 Time: 22:07Sample (adjusted): 2010:11 2013:10Included observations: 36 after adjustmentsVariableCoefficientStd. Errort-StatisticProb.C3.0514030.07248942.094940.0000X1-0.7510755*X1(-1)-5.58E-112.18E-11-2.5649000.0151X3-0.7510755*X3(-1)0.0610240.0360221.6940540.0997R-squared0.198673Mean dependent var2.993018Adjusted R-squared0.150108S.D. dependent var0.362377S.E. of regression0.334074Akaike info criterion0.724744Sum squared resid3.682970Schwarz criterion0.856704Log likelihood-10.04540Hannan-Quinn criter.0.770802F-statistic4.090852Durbin-Watson stat1.441937Prob(F-statistic)0.025874
Breusch-Godfrey Serial Correlation LM Test:F-statistic2.229066Prob. F(2,31)0.1246Obs*R-squared4.526260Prob. Chi-Square(2)0.1040Test Equation:Dependent Variable: RESIDMethod: Least SquaresDate: 12/12/13 Time: 22:23Sample: 2010:11 2013:10Included observations: 36Presample missing value lagged residuals set to zero.VariableCoefficientStd. Errort-StatisticProb.C-0.0175980.070801-0.2485560.8053X1-0.7510755*X1(-1)9.89E-122.15E-110.4597720.6489X3-0.7510755*X3(-1)-0.0012050.035973-0.0334950.9735RESID(-1)0.1811730.1783511.0158240.3176RESID(-2)0.2754740.1796591.5333140.1353R-squared0.125729Mean dependent var3.99E-16Adjusted R-squared0.012920S.D. dependent var0.324388S.E. of regression0.322286Akaike info criterion0.701490Sum squared resid3.219912Schwarz criterion0.921423Log likelihood-7.626819Hannan-Quinn criter.0.778253F-statistic1.114533Durbin-Watson stat1.773563Prob(F-statistic)0.367415
Heteroskedasticity Test: WhiteF-statistic1.353648Prob. F(5,30)0.2694Obs*R-squared6.626822Prob. Chi-Square(5)0.2499Scaled explained SS4.225335Prob. Chi-Square(5)0.5175Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 12/12/13 Time: 22:41Sample: 2010:11 2013:10Included observations: 36VariableCoefficientStd. Errort-StatisticProb.C0.1454120.0312244.6571230.0001X1-0.7510755*X1(-1)-2.66E-112.28E-11-1.1648910.2532(X1-0.7510755*X1(-1))^21.07E-212.99E-210.3585400.7225(X1-0.7510755*X1(-1))*(X3-0.7510755*X3(-1))-1.28E-127.54E-12-0.1694690.8666X3-0.7510755*X3(-1)0.0359610.0204741.7564470.0892(X3-0.7510755*X3(-1))^2-0.0094000.005086-1.8481870.0745R-squared0.184078Mean dependent var0.102305Adjusted R-squared0.048091S.D. dependent var0.127819S.E. of regression0.124707Akaike info criterion-1.174683Sum squared resid0.466557Schwarz criterion-0.910763Log likelihood27.14429Hannan-Quinn criter.-1.082568F-statistic1.353648Durbin-Watson stat2.643981Prob(F-statistic)0.269443