Статистическое изучение динамики социально-экономических явлений

  • Вид работы:
    Курсовая работа (т)
  • Предмет:
    Социология
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    506,06 Кб
  • Опубликовано:
    2015-02-03
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Статистическое изучение динамики социально-экономических явлений

Содержание

1. Теоретическая часть

1.1 Оценка адекватности тренда и прогнозирование (критерий Фишера)

2. Практическая часть

2.1 Задача 1. Статистическое исследование, сводка и группировка данных

.2 Задача 2. Статистическое изучение динамики социально-экономических явлений

.3 Задача 3. Выборочный метод в статистических исследованиях. Показатели вариаций

.4 Задача 4. Статистика заработанной платы

.5 Задача 5. Выявление основной тенденции развития ряда динамики

Список литературы

1. Теоретическая часть

.1 Оценка адекватности тренда и прогнозирование (критерий Фишера)

Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.

Анализ качества эмпирического уравнения парной и множественной линейной регрессии начинают с построения эмпирического уравнения регрессии, которое является начальным этапом эконометрического анализа. Первое же, построенное по выборке, уравнение регрессии очень редко является удовлетворительным по тем или иным характеристикам. Поэтому следующей важнейшей оценкой является проверка качества уравнения регрессии. В эконометрике принята устоявшаяся схема такой проверки, которая проводится по следующим направлениям:

·проверка статистической значимости коэффициентов уравнения регрессии

·проверка общего качества уравнения регрессии

·проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполнимости предпосылок МНК).

Прежде, чем проводить анализ качества уравнения регрессии, необходимо определить дисперсии и стандартные ошибки коэффициентов, а также интервальные оценки коэффициентов. Корреляционный и регрессионный анализ, как правило, проводится для ограниченной по объёму совокупности.

Поэтому параметры уравнения регрессии (показатели регрессии и корреляции), коэффициент корреляции и коэффициент детерминации могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.

При анализе адекватности уравнения регрессии (модели) исследуемому процессу, возможны следующие варианты:

. Построенная модель на основе F-критерия Фишера в целом адекватна и все коэффициенты регрессии значимы. Такая модель может быть использована для принятия решений и осуществления прогнозов.

. Модель по F-критерию Фишера адекватна, но часть коэффициентов не значима. Модель пригодна для принятия некоторых решений, но не для прогнозов.

. Модель по F-критерию адекватна, но все коэффициенты регрессии не значимы. Модель полностью считается неадекватной. На ее основе не принимаются решения и не осуществляются прогнозы.

Проверить значимость (качество) уравнения регрессии-значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным, достаточно ли включенных в уравнение объясняющих переменных для описания зависимой переменной. Чтобы иметь общее суждение о качестве модели, по каждому наблюдению из относительных отклонений определяют среднюю ошибку аппроксимации. Проверка адекватности уравнения регрессии (модели) осуществляется с помощью средней ошибки аппроксимации, величина которой не должна превышать 12-15% (максимально допустимое значение).


Оценка значимости уравнения регрессии в целом производится на основе F-критерия Фишера, которому предшествует дисперсионный анализ. В математической статистике дисперсионный анализ рассматривается как самостоятельный инструмент статистического анализа. В эконометрике он применяется как вспомогательное средство для изучения качества регрессионной модели. Согласно основной идее дисперсионного анализа, общая сумма квадратов отклонений переменной (y) от среднего значения (yср.) раскладывается на две части: "объясненную" и "необъясненную":


Схема дисперсионного анализа имеет следующий вид:

(n -число наблюдений, m-число параметров при переменной x)

Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-критерия Фишера. Фактическое значение F -критерия Фишера сравнивается с табличным значением Fтабл. (α, k1, k2) при заданном уровне значимости α и степенях свободы k1= m и k2=n-m-1. При этом, если фактическое значение F-критерия больше табличного Fфакт > Fтеор, то признается статистическая значимость уравнения в целом. Для парной линейной регрессии m=1 , поэтому:


Эта формула в общем виде может выглядеть так:


Отношение объясненной части дисперсии переменной (у) к общей дисперсии называют коэффициентом детерминации и используют для характеристики качества уравнения регрессии или соответствующей модели связи. Соотношение между объясненной и необъясненной частями общей дисперсии можно представить в альтернативном варианте:


Коэффициент детерминации R2 принимает значения в диапазоне от нуля до единицы 0≤ R2 ≤1. Коэффициент детерминации R2 показывает, какая часть дисперсии результативного признака (y) объяснена уравнением регрессии. Чем больше R2, тем большая часть дисперсии результативного признака (y) объясняется уравнением регрессии и тем лучше уравнение регрессии описывает исходные данные. При отсутствии зависимости между (у) и (x) коэффициент детерминации R2 будет близок к нулю. Таким образом, коэффициент детерминации R2 может применяться для оценки качества(точности) уравнения регрессии. Значение R-квадрата является индикатором степени подгонки модели к данным (значение R-квадрата близкое к 1.0 показывает, что модель объясняет почти всю изменчивость соответствующих переменных). Чтобы определить, при каких значениях R2 уравнение регрессии следует считать статистически не значимым, что, в свою очередь, делает необоснованным его использование в анализе, рассчитывается F-критерий Фишера: Fфакт > Fтеор - делаем вывод о статистической значимости уравнения регрессии. Величина F-критерия связана с коэффициентом детерминации R2xy (r2xy) и ее можно рассчитать по следующей формуле:


Либо при оценке значимости индекса детерминации (аналог коэффициента детерминации):


где: i2 - индекс (коэффициент) детерминации, который рассчитывается:


Использование коэффициента множественной детерминации R2 для оценки качества модели, обладает тем недостатком, что включение в модель нового фактора (даже несущественного) автоматически увеличивает величину R2. Поэтому, при большом количестве факторов, предпочтительнее использовать, так называемый, улучшенный, скорректированный коэффициент множественной детерминации R2, определяемый соотношением:


где p - число факторов в уравнении регрессии, n - число наблюдений. Чем больше величина p, тем сильнее различия между множественным коэффициентом детерминации R2и скорректированным R2. При использовании скорректированного R2, для оценки целесообразности включения фактора в уравнение регрессии, следует учитывать, что увеличение его величины (значения), при включении нового фактора, не обязательно свидетельствует о его значимости, так как значение увеличивается всегда, когда t-статистика больше единицы (|t|>1). При заданном объеме наблюдений и при прочих равных условиях, с увеличением числа независимых переменных (параметров), скорректированный коэффициент множественной детерминации убывает. При небольшом числе наблюдений, скорректированная величина коэффициента множественной детерминации R2 имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель. Низкое значение коэффициента множественной корреляции и коэффициента множественной детерминации R2 может быть обусловлено следующими причинами:

·в регрессионную модель не включены существенные факторы;

·неверно выбрана форма аналитической зависимости, которая нереально отражает соотношения между переменными, включенными в модель.

Следует также обратить внимание на важность анализа остатков . Остаток представляет собой отклонение фактического значения зависимой переменной от значения, полученного расчетным путем. При построении уравнения регрессии, мы можем разбить значение (у) в каждом наблюдении на 2 составляющие:


Отсюда:

Если εi=0, то для всех наблюдений фактические значения зависимой переменной совпадают с расчетными (теоретическими) значениями. Графически это означает, что теоретическая линия регрессии (линия, построенная по функции у=а0+а1х) проходит через все точки корреляционного поля, что возможно только при строго функциональной связи. Следовательно, результативный признак (у) полностью обусловлен влиянием фактора (х). На практике, как правило, имеет место некоторое рассеивание точек корреляционного поля относительно теоретической линии регрессии, т.е. отклонения эмпирических данных от теоретических εi≠0. Величина этих отклонений и лежит в основе расчета показателей качества (адекватности) уравнения.

Большинство предположений множественной регрессии нельзя в точности проверить, однако можно обнаружить отклонения от этих предположений. В частности, выбросы (экстремальные наблюдения) могут вызвать серьезное смещение оценок, сдвигая линию регрессии в определенном направлении и, тем самым, вызывая смещение коэффициентов регрессии. Часто исключение всего одного экстремального наблюдения приводит к совершенно другому результату. Выбросы оказывают существенное влияние на угол наклона регрессионной линии и соответственно, на коэффициент корреляции. Всего один выброс может полностью изменить наклон регрессионной линии и, следовательно, вид зависимости между переменными. Одна точкавыброса обуславливает высокое значение коэффициента корреляции, в то время, как в отсутствие выброса, он практически равен нулю.

При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин. Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n<30) осуществляют с помощью t-критерия Стьюдента. При этом вычисляют расчетные (фактические) значения t-критерия для параметров a0 а1:


·n - число наблюдений, m-число параметров уравнения регрессии,

·σε - (остаточное) среднее квадратическое отклонение результативного признака от выровненных значений ŷ,

·σх - среднее квадратическое отклонение факторного признака от общей средней.

Вычисленные, по вышеприведенным формулам, значения сравнивают с критическими t, которые определяют по таблице значений Стьюдента с учетом принятого уровня значимости (α) и числа степеней свободы вариации k (ν)=n-2. В социально-экономических исследованиях уровень значимости α обычно принимают 0,05. Параметр признается значимым (существенным) при условии, если tрасч. > tтабл. В этом случае, практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями.

Для оценки значимости парного коэффициента корреляции (корень квадратный из коэффициента детерминации), при условии линейной формы связи между факторами, можно использовать t-критерий Стьюдента:


Анализ качества эмпирического уравнения множественной линейной регрессии предусматривает оценку мультиколлинеарности факторов. При оценке мультиколлинеарности факторов следует учитывать, что чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. Для отбора наиболее значимых факторов Хi должны быть учтены следующие условия:

·связь между результативным признаком и факторным должна быть выше межфакторной связи

·связь между факторами должна быть не более 0.7

·при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними

Более объективную характеристику тесноты связи дают частные коэффициенты корреляции, измеряющие влияние на результативный фактор Уi фактора Хi при неизменном уровне других факторов. Коэффициент частной корреляции отличается от простого коэффициента линейной парной корреляции тем, что он измеряет парную корреляцию соответствующих признаков (У и Хi) при условии, что влияние на них остальных факторов (Хj) устранено.


2. Практическая часть


С целью изучения зависимости между среднегодовой стоимостью основных производственных фондов (ОПФ) и стоимостью выпуска продукции (ПР) необходимо произвести группировку фирм по среднегодовой стоимости производственных фондов. По каждой группе и совокупности фирм рассчитать:

) число фирм;

) среднегодовую стоимость основных производственных фондов (ОПФ);

) стоимость продукции (ПР);

) среднегодовую стоимость основных производственных фондов на одну фирму;

) стоимость продукции на одну фирму;

) стоимость продукции на 1 руб. основных производственных фондов (фондоотдачу).

Решение:

В качестве группировочного признака принимаем среднегодовую стоимость основных производственных фондов.

Число групп определяем по формуле Стерджесса:

=1+3,322lgN=1+3,221lg30=6

Определяем величину интервала:

=(9-0,5)/6=1,42

(

группа 0.5+1,42=1,92

группа 1,92+1,42=3,34

группа 3,34+1,42=4,76

группа 4,76+1,42=6,18

группа 6,18+1,42=7,6

группа 7,6+1,42=9,02

Таблица 1

Исходные данные

ФирмыОПФПР13,43,523,13,334,14,545,87,555,26,963,84,374,15,985,64,894,65,8104,24,6116,18,4126,57,3131,52,1146,47,8157,510,6165,15,8174,95,3185,86192,82,5202,21,92111,52288,5237,78246,36,52554,5261,72,4274,15,1280,51,2298,29,930911,3

Таблица 2

Ранжированный ряд.

ОПФПР0,5 1 1,5 1,71,2 1,5 2,1 2,42,2 2,8 3,11,9 2,5 3,33,4 3,8 4,1 4,1 4,1 4,2 4,63,5 4,3 4,5 5,1 5,9 4,6 5,84,9 5 5,1 5,2 5,6 5,8 5,8 6,15,3 4,5 5,8 6,9 4,8 7,5 6 8,46,3 6,4 6,5 7,58,5 7,8 7,3 10,67,7 8 8,2 98 8,5 9,9 11,3

. Среднегодовая стоимость основных производственных фондов:

Σ ОПФ

. Стоимость продукции:

Σ ПР

. Среднегодовая стоимость основных производственных фондов на одну фирму:

Σ ОПФ/n

. Стоимость продукции на одну фирму:

Σ ПР/n

. Фондоотдача:

Σ ПР/n: Σ ОПФ/n

группа: 1,8/1,175=1,53

группа: 2,6/2,7=0,95

группа: 4,81/4,04=1,19

группа: 6,15/5,44=1,13

группа: 8,55/6,675=1,28

группа: 9,425/8,225=1,15

Таблица 3

Результаты группировки

Номер группыГруппы фирм по среднегодовой стоимости ОПФЧисло фирмСреднегодовая стоимость ОПФстоимость продукцииСреднегодовая стоимость ОПФ на 1 фирмуСтоимость продукции в среднем на 1 фирмуФондоотдача1234567810,5-1,9244,77,21,1751,81,5321,92-3,3438,17,72,72,60,9533,34-4,76728,333,74,044,811,1944,76-6,18843,549,25,446,151,1356,18-7,6426,734,26,6758,551,2867,6-9,02432,937,78,2259,4251,15

Рис. 1 Гистограмма распределения

Рис. 2 Полигон распределения

Рис. 3 Кумулята

Вывод: Разбив неоднородную совокупность из 30 фирм на 6 групп с равным интервалом по признаку среднегодовой стоимости ОПФ. Самая многочисленная группа 4 (8 фирм) и которая примерно равна 27%, а самая малочисленная 2 (3 фирмы) и примерно равна 10%.

2.2 Задача 2. Статистическое изучение динамики социально-экономических явлений

По данным ряда динамики об объёмах строительно-монтажных работ (СМР) (тыс. руб.), выполненных строительными организациями за пятилетний период

Таблица 4

Исходные данные

годОбъем СМР128235341447551

Вычислить:

) абсолютные приросты (или снижения) - цепные и базисные

) темпы роста (или снижения) - цепные и базисные;

) темпы прироста (или снижения) - цепные и базисные;

) абсолютное содержание 1% прироста (или снижения). Полученные данные по пунктам 1-4 представить в табл. 4.

) среднегодовой объём работ;

) средний абсолютный прирост.

) среднегодовой темп роста и прироста (или снижения).

Таблица 5

Результаты расчета

ГодОбъем работ (тыс.руб.)Абсолютный прирост (тыс.руб.)Темп роста (%)Темп прироста (%)Абсод. 1%прироста (тыс.руб.)базисныйцепнойбазисныйцепнойбазисныйцепной128-------2357712512525250,28341136146,4117,146,417,10,35447196167,9114,567,914,60,41551234182,1108,582,18,50,47Итого202

1. Определяем базисный и цепной абсолютные приросты по формулам:

регрессия фишер статистика вариация

=35-28=7 (шт.)

=41-28=13

=47-28=19

=51-28=23

=35-28=7

=41-35=6

=47-41=6

=51-47=4

где yi - изучаемый уровень ряда;б - уровень ряда, принятого за базисный;- уровень ряда, предшествующий изучаемому.

. Рассчитываем базисный и цепной темпы роста:


. Определяем базисный и цепной темпы прироста:

Тп=Тр-100%

125%-100%=25%

146,4%-100%=46,4%

167,9%-100%=67,9%

182,1%-100%=82,1%

=125%-100%=25%

=117,1%-100%=17,1%

=114,6%-100%=14,6%

=108,5%-100%=8,5%

. Находим абсолютное содержание одного процента прироста:

. Вычисляем среднегодовой объем работ:

6. Рассчитываем средний абсолютный прирост:


. Находим средний темп роста:


. Определяем средний прирост:


Рис. 4 Динамика объемов строительных работ

Вывод: На графике виден стабильный рост по годам объема строительно-монтажных работ, выполненных строительными организациями за 5 лет.

2.3 Задача 3. Выборочный метод в статистических исследованиях. Показатели вариации

Для изучения дневной выработки рабочих предприятия была проведена 10%-я бесповторная выборка, в результате которой получены исходные данные о распределении рабочих по производительности труда, представленные в таблице.

Таблица 6

Исходные данные

Группа рабочих с дневной выработкой изделий, штукЧисло рабочих, чел.10-20520-301030-404040-502750-6010Итого92

На основе приведенных данных вычислить:

) среднедневную выработку рабочего;

) дисперсию и среднеквадратическое отклонение;

) коэффициент вариации;

4) с вероятностью 0,954 предельную ошибку выборки и возможные границы, в которых ожидается среднедневная выработка всех рабочих строительного предприятия.

Решение.

Таблица 7

хfхiхi·fi10-2051575-23529264520-301025250-13169169030-4040351400-393640-5027451215749132750-601055550172892890Итого9217534908588

1.Определяем среднедневную выработку рабочих:


2.Вычисляем дисперсию:


3.Рассчитываем среднеквадратическое отклонение:


4.Находим коэффициент вариации по формуле:


5.Определяем среднюю ошибку выборки по формуле:

где п - число рабочих выборочной совокупности, чел.

6.Определяем предельную ошибку выборки по формуле:


7.Находим границы среднедневной выработки генеральной совокупности:

Среднее значение выработки одного рабочего строительного предприятия находится в пределах от 36,1 до 39,9, при вероятности p=0,954. Таким образом среднедневная выработка как раз находится в пределах 36,1-39,9.

2.4 Задача 4. Статистика заработной платы

Имеются следующие данные о количестве рабочих и их заработной плате по предприятиям в двух отраслях.

Таблица 8

ОтрасльБазисный периодОтчетный периодЧисло работающих, чел.Средняя з/п. тыс. руб.Число работающих, чел.Средняя з/п. тыс. руб.115056020060022709303001200Вычислить индексы средней заработной платы:

1) по каждой отрасли;

) по двум отраслям:

а) индекс переменного состава;

б) индекс постоянного состава;

в) индекс структурных сдвигов.

Решение.

1.Определяем индивидуальный индекс средней з/п:


2.Рассчитываем индекс переменного состава:


3.Вычисляем индекс постоянного состава:


4.Находим индекс структурных сдвигов:


Вывод: Средняя заработная плата в первой отрасли возросла на 7%, во второй - на 29%. Поскольку индекс среднегодовой заработной платы переменного состава равен 1,17, значит уровень средней заработной платы по двум отраслям вырос на 17%. Индекс среднегодовой заработной платы постоянного состава равен 1,23, значит, уровень средней заработной платы по двум отраслям возрос на 23%.

.5 Задача 5. Выявление основной тенденции развития ряда динамики

Выявить тенденцию, складывающуюся в динамике объема продаж, используя метод аналитического выравнивания. Построить график зависимости изменения уровней ряда от времени. Используя уравнение адекватной математической функции, рассчитать прогнозный объем продаж на четвертый квартал. Сделать выводы.

Таблица 9

Исходные данные

МесяцыОбъем продаж, млн. руб.12123225,4324,7426,2527,3628,2733,7836,8940,1Порядок выполнения:

1.Прямолинейная функция


Таблица 10

Расчётные данные для прямолинейной функции

12345123-416-9212345225,4-39-76,2324,7-24-49,4426,2-11-26,2527,3000628,21128,2733,72467,4836,839110,4940,1416160,4Итого265,4060122,6



Таблица 11

Расчёт стандартной ошибки аппроксимации

121,662,75562,024,0804-0,720,5184-1,261,5876-2,24,8412-3,3411,15560,120,01441,181,39242,445,9536Итого32,298


- стандартная ошибка выборки.


2.Парабола 2-го порядка


Таблица 12

Расчётные данные для параболы 2-го порядка

1234567123-416256-92368225,4-3981-76,2228,6324,7-2416-49,498,8426,2-111-26,226,2527,300000628,211128,228,2733,7241667,4134,8836,83981110,4331,2940,1416256160,4641,6Итого265,4060708122,61857,4


Таблица 13

Расчёт стандартной ошибки аппроксимации

12-0,8360,6988961,4862,2081960,1360,0184960,4140,171396-0,280,0784-1,7463,0485160,8160,6658560,4060,164836-0,3760,141376Итого7,195968


- стандартная ошибка выборки.


3.Парабола 3-го порядка


Таблица 14

Расчётные данные для параболы 3-го порядка

12345678910123-416-642564096-92368-1472225,4-39-2781729-76,2228,6-685,8324,7-24-81664-49,498,8-197,6426,2-11-111-26,226,2-26,2527,300000000628,21111128,228,228,2733,7248166467,4134,8269,6836,8392781729110,4331,2993,6940,1416642564096160,4641,62566,4Итого265,406007089780122,61857,41476,2


Таблица 15

Расчёт стандартной ошибки аппроксимации

12-0,6160,3794561,211,4641-0,2580,0665640,1540,023716-0,280,0784-1,4862,2081961,211,46410,6820,465124-0,5960,355216Итого6,504872

стандартная ошибка выборки.


4.Показательная функция


Таблица 16

Расчётные данные для показательной функции

123456123-4161,361728-5,44691225,4-391,404834-4,2145324,7-241,392697-2,78539426,2-111,418301-1,4183527,3001,4361630628,2111,4502491,450249733,7241,527633,05526836,8391,5658484,697543940,14161,6031446,412577Итого265,406013,160591,750522


Таблица 17

Расчёт стандартной ошибки аппроксимации

120,9981020,9962081,8579693,45205-0,489970,240073-0,753270,567417-1,542,3716-2,65887,0692170,6810840,4638751,469762,1601942,2966435,274569Итого22,5952


- стандартная ошибка выборки.


Парабола 3-го порядка - адекватная математическая функция, т.к. стандартная ошибка аппроксимации имеет наименьшее значение равное . Используя уравнение адекватной математической функции, необходимо рассчитать прогнозируемый объем продаж на четвертый квартал: октябрь (), ноябрь (), декабрь ().


Рис. 5. Динамика изменения уровней ряда от времени для теоритических и эмпирических уровней.

Вывод. Адекватной математической функцией признается парабола 3-го порядка, т.к. стандартная ошибка аппроксимации имеет наименьшее значение, равное 0,850155.

Список литературы

1. Методические указания к выполнению курсовой работы / В.В. Бызеев. Л.А. Раевский, К.А. Малышева. - Пенза: ПГУАС, 2008. - 20 с.

. Теория статистики: Учебник / Р.А. Шмойлова, В.Г. Минашкин, Н.А. Садовникова, Е.Б. Шувалова; под ред. Р.А. Шмойловой. - 4-е изд., перераб. и доп. - М.: Финансы и статистика, 2003. - 656 с.

. HELPSTAT.ru

Похожие работы на - Статистическое изучение динамики социально-экономических явлений

 

Не нашел материал для своей работы?
Поможем написать качественную работу
Без плагиата!