Анализ статистических данных

  • Вид работы:
    Курсовая работа (т)
  • Предмет:
    Эктеория
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    521,52 Кб
  • Опубликовано:
    2015-02-20
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Анализ статистических данных













Пояснительная записка

к курсовой работе на тему

«Анализ статистических данных»

по дисциплине «Статистика»

ОГЛАВЛЕНИЕ

Введение

1. Задание к курсовой работе

2. Построение ряда распределения

. Расчет выборочных параметров ряда

. Построение диаграммы накопленных частот и гистограммы выборки

4.1 Диаграмма накопленных частот

.2 Гистограмма выборки

5. Проверка основной гипотезы распределения

6. Линейная диаграмма исходного временного ряда

7. Статистические показатели временного ряда

8. Сглаживание временного ряда методом скользящей средней

9. Аналитическое выравнивание временного ряда с помощью линейной функции

10. Прогнозирование временного ряда

Заключение

Библиографический список

Приложения

ВВЕДЕНИЕ

выборочный временной ряд выравнивание

С переходом на рыночные условия хозяйствования изменились требования к качеству подготовки экономистов, менеджеров и руководителей предприятий. Они в совершенстве должны владеть современным статистическим инструментарием анализа экономической информации, поскольку от этого в значительной степени зависит эффективность управления предприятием.

Статистические методы являются важной частью процесса управления. Они позволяют вырабатывать обоснованные стратегические решения, сочетающие интуицию специалиста с тщательным анализом имеющейся информации. Использование статистики становится важным преимуществом в конкурентной борьбе.

В качестве исследуемого экономического показателя в работе взята урожайность зерновых культур. Такой выбор обусловлен следующими соображениями.

. Доступность статистической информации.

. В значительной степени упрощается само исследование. Это связано с тем, что, исходя из существа изучаемого явления, для описания урожайности может быть принята математической модель в виде стационарного (на определённом отрезке времени) случайного процесса с нормальным законом распределением.

Российская Федерация занимает четвёртое место в общемировом производстве зерна. Её доля в мировой торговле зерном - более 8%. Зерно - это продукт, являющийся основой питания для человека, кормовой базой для сельскохозяйственных животных и сырьём для многих отраслей промышленности.

Урожайность - один из основных экономических показателей сельскохозяйственного производства. В нём суммируются различия в уровне хозяйствования, агроклиматических условий и т.д. Исследование урожайности с позиций статистической науки позволяет осуществлять прогнозы, оценивать риск и многое другое. Поэтому анализ урожайности имеет важное практическое значение.

Источником информации для выполнения исследования служат ежегодные статистические сборники, выпускаемые Челябинским областным комитетом государственной статистики.

Курсовая работа предполагает определение и анализ основных статистических показателей урожайности, изучение закона распределения и корреляционной связи, количественную оценку риска неурожайности, построение, сглаживание и анализ структуры временного ряда, а также выделение тренда.

Наряду с выравниванием временного ряда предлагается осуществить его прогнозирование. Аналогичные по постановке задачи возникают и в других, несельскохозяйственных сферах деятельности. Освоение подходов к решению подобных задач позволит студентам решать проблемы статистического анализа в любой предметной области и грамотно интерпретировать полученные результаты.

В курсовой работе статистические методы обработки информации сочетаются с графическим представлением полученных результатов и использованием для расчётов компьютерной техники.

Методы исследования базируются на знании общей теории статистики и теории вероятностей.

1. ЗАДАНИЕ К КУРСОВОЙ РАБОТЕ

Провести статистическое исследование урожайности зерновых культур и проанализировать полученные результаты.

В расчётах необходимо использовать данные по фактическому сбору урожая в среднем с 1 га посевной (или убранной) площади за последние годы, начиная с 1998 года.

Варианту 14 соответствует Нязепетровский район.

2. ПОСТРОЕНИЕ РЯДА РАСПРЕДЕЛЕНИЯ

Из выданных преподавателем данных отберем те, которые относятся к 14 варианту работы, и занесём в табл. 2.1.

Таблица 2.1

Исходные статистические данные по урожайности

для Нязепетровского района Челябинской области

Годы

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

2010

2011

yi

y1

y2

y3

y4

y5

y6

y7

y8

y9

y10

y11

y12

y13

y14

Урожай- ность,ц/га

4,8

6,4

6,0

8,3

11,8

10,6

7,7

8,0

10,0

11,1

8,3

9,9

8,8

11,9


Составим ранжированный ряд распределения  путём расположения исходных данных в порядке возрастания от  до

 , (2.1)

где  - объём выборки.

Результаты представим в виде табл. 2.2.

Таблица 2.2

Ранжированный вариационный ряд

xi

x1

x2

x3

x4

x5

x6

x7

x8

x9

x10

x11

x12

x13

x14

Урожай- ность,ц/га

4,8

6,0

6,4

7,7

8,0

8,3

8,3

8,8

9,9

10,0

10,6

11,1

11,8

11,9



Мы получили xmin=4,8 ц/га и x max =11,9 ц/га. Таким образом, ранжировав исходные данные, представляется возможным посчитать выборочные параметры ряда распределения.

3. РАСЧЕТ ВЫБОРОЧНЫХ ПАРАМЕТРОВ РЯДА РАСПРЕДЕЛЕНИЯ

Произведем оценку среднего значения , дисперсии  и среднеквадратического отклонения  генеральной совокупности с помощью выборочных параметров ,  и  соответственно по следующим формулам

; (3.1)

; (3.2)

. (3.3)

Итак,

=

= =4,74

==2,18

Результаты расчёта сведем в табл. 3.1.

Таблица 3.1

Выборочные параметры ряда распределения



8,82

4,74

2,18


Определим доверительный интервал для генеральной средней

, (3.4)

где  - среднее значение в генеральной совокупности;

 - средняя ошибка в определении среднего значения величины  для малой выборки ;

 - коэффициент доверия.

Примем вероятность выполнения условия (3.4) (доверительную вероятность) равной .

Величину коэффициента  определим воспользовавшись таблицей значений интеграла Лапласа: t=1,96

= 0,6


Таким образом, при помощи рассчитанных показателей мы можем проводить дальнейший анализ данной совокупности. Доверительный интервал [7,6; 9,9], полученный в ходе вычислений показывает, что вероятность выхода за пределы этой области генеральной средней мала.

4. ПОСТРОЕНИЕ ДИАГРАММЫ НАКОПЛЕННЫХ ЧАСТОТ И ГИСТОГРАММЫ ВЫБОРКИ

.1 Построение диаграммы накопленных частот

Диаграмма накопленных частот  строится в соответствии с формулой

 , (4.1)

где  - число элементов в выборке, для которых значение ;  - объём выборки.

При  значение . Величина  равна нулю левее точки . В точке  и далее во всех других точках  диаграмма имеет скачок, равный .

Результаты расчёта занесем в табл. 4.1. Здесь  - числовые значения, принимаемые величиной . Диаграмма представлена в Приложении 1.

Таблица 4.1

Данные для построения диаграммы накопленных частот


x<x1

x<x2

x<x3

x<x4

x<x5

x<x6

x<x7

x<x8

x<x9

x<x10

x<x11

x<x12

x<x13

x<x14

x<∞

Fn(x)

0/14

1/14

2/14

3/14

4/14

5/14

6/14

7/14

8/14

9/14

10/14

11/14

12/14

13/14

14/14


0

0,07

0,14

0,21

0,28

0,35

0,42

0,5

0,57

0,64

0,71

0,78

0,85

0,92

1


Она имеет ступенчатый вид и представляет собой эмпирическую функцию распределения.

.2 Построение гистограммы выборки

Определим число интервалов , на которое должна быть разбита ось . Число интервалов может быть рассчитано по формуле Стерджесса

, (4.2)

где  - объём выборки.

 = 4,65»5.

Определим длину интервала

. (4.3)

=  = 1,5.

Примем за центр некоторого интервала середину области изменения изучаемого признака (центр распределения)

= = 8,4.

Подсчитаем количество элементов (частоту) ряда распределения , попавшее в каждый интервал. Значение  равно числу элементов вариационного ряда, для которых справедливо , где  и  - границы -го интервала. Значения , попавшие на границу между -м и -м интервалами, отнесём к -му интервалу.

Подсчитаем относительное количество элементов (частость)  совокупности, попавших в данный интервал.

Построим гистограмму, представляющую собой ступенчатую кривую, значение которой на -м интервале  постоянно и равно  (). (Приложение 2).

Результаты расчёта занесем в табл. 4.2.

Таблица 4.2

Данные для построения гистограммы выборки

12345






4,8;6,36,3;7,87,8;9,39,3;10,810,8;12,3






22433






 0,090,090,190,140,14







Итак, с помощью полученных данных мы построили диаграмму накопленных частот и гистограмму выборки, которые представлены в приложениях. Гистограмма выборки имеет 4 столбца. При помощи этой гистограммы в дальнейшем мы сможем определить моду.

5. ПРОВЕРКА ОСНОВНОЙ ГИПОТЕЗЫ РАСПРЕДЕЛЕНИЯ

Если выборочные асимметрия  и эксцесс  удовлетворяют неравенствам

; (5.1)

и

, (5.2)

то изучаемое распределение можно считать нормальным.

Выборочные асимметрия и эксцесс рассчитываются по формулам

; (5.3)

 , (5.4)

где - элементы выборки; - выборочное среднее; - среднеквадратическое отклонение выборки;  - объём выборки.

Дисперсия асимметрии  и дисперсия эксцесса , входящие в выражения (5.1) и (5.2), вычисляются по формулам

; (5.5)

 . (5.6)

Итак, проведем расчеты

= = -0,19

= [] - 3 = 0,86

 =  = 0,3

 = 0,6

Сведем результаты расчётов в табл. 5.1.

Таблица 5.1

Данные для проверки основной гипотезы

Выполнение

критерия





1,13

1,64

0,86

3,9

Да


Таким образом, наша гипотеза о нормальном распределении подтвердилась, т.к. 1,13<1,79 и 0,86<3,84, и данное распределение действительно можно рассматривать как нормальное.

6. ЛИНЕЙНАЯ ДИАГРАММА ИСХОДНОГО ВРЕМЕННОГО РЯДА

Урожайность, наблюдаемую в течение определённого периода времени, можно рассматривать как числовые значения статистического показателя в последовательные моменты времени, т.е. в виде временного ряда или ряда динамики.

Изобразим на рисунке в Приложении 3 исходный временной ряд   в виде линейной диаграммы.

По оси абсцисс расположим время (годы), а по оси ординат соответствующие этим годам фактические уровни временного ряда . Полученные таким образом точки соединим отрезками прямых линий.

Итак, теперь мы можем графически увидеть зависимость между годом и урожайностью зерна в этот год. На графике видны резкие скачки - различия между значениями урожайности зерна в разные годы.

7. СТАТИЧЕСКИЕ ПОКАЗАТЕЛИ ВРЕМЕННОГО РЯДА

Вычислим основные показатели временного ряда.

. Абсолютный прирост (цепной и базисный) определяется как разность между двумя уровнями динамического ряда

 , (7.1)

где индекс  следует заменить

для цепного абсолютного прироста b = i - 1;

для базисного абсолютного прироста b = 1.

Таким образом, если рассчитывается разность между уровнем i-го периода yi и предыдущим уровнем yi-1, то определяем цепной абсолютный прирост. Когда же уровни сопоставляются с исходным показателем ряда y1, то получаем базисный абсолютный прирост.

. Коэффициент роста (цепной) рассчитывается по формуле

. (7.2)

. Темп роста (цепной) рассчитывают по формуле

 (%). (7.3)

. Темп прироста (цепной) находят из выражения

 (%). (7.4)

5. Абсолютное значение одного процента прироста (цепного или базисного) равно

. (7.5)

Абсолютное значение 1 % базисного прироста, в отличие от цепного, является для всего ряда динамики величиной постоянной.

Занесем результаты расчёта в табл. 7.1.

Таблица 7.1

Аналитические характеристики временного ряда урожайности зерновых

Годы

Урожай-ность ц /г

Абсолютный прирост

Коэффици-ент роста

Темп роста

Темп прироста

Абсолютное значение 1 % прироста



ri

Кр

Тр

Тпр

a



ц/га

доля

%

%

ц/га



цепной

Базис-ный

цепной

цепной

цепной

цепной

базисный

1998

4,8

-

0

-

-

-

-

0,048 0,048

1999

6,4

1,6

1,6

1,3

133,3

33,3

0,048

0,048

2000

6,0

- 0,4

1,2

0,9

93,75

-6,25

0,064

0,048

2001

8,3

2,3

3,5

1,4

138,3

38,3

0,06

0,048

2002

11,8

3,5

7,0

1,4

142,1

0,083

0,048

2003

10,6

- 1,2

5,8

0,9

89,8

-10,2

0,118

0,048

2004

7,7

- 2,9

2,9

0,7

72,6

-27,3

0,106

0,048

2005

8,0

0,3

3,2

1,0

103,9

3,9

0,077

0,048

2006

10,0

2,0

5,2

1,2

125

25

0,08

0,048

2007

11,1

1,1

6,3

1,1

111

11

0,1

0,048

2008

8,3

- 2,8

3,5

0,7

74,7

-25,2

0,111

0,048

2009

9,9

1,6

5,1

1,2

119,3

19,3

0,083

0,048

2010

8,8

- 1,1

4,0

0,8

88,8

-11,1

0,099

0,048

2011

11,9

3,1

7,1

1,3

135,2

35,2

0,088

0,048


Определим другие показатели ряда динамики.

Средний уровень ряда , дисперсия , среднеквадратическое отклонение  возьмем из таблицы 6.1. А коэффициент вариации  рассчитаем по формуле:

  (7.6)

=  = 24,7

. Средний (цепной и базисный) прирост

 . (7.7)


. Средний коэффициент роста - показатель, вычисляемый по формуле средней геометрической из показателей коэффициентов роста за отдельные периоды:

 , (7.8)

где K,K,...Kn-1, - коэффициенты роста по сравнению с уровнем предшествующего периода; n - число уровней ряда.

. Средний темп роста, рассчитываемый по формуле средней геометрической.

Цепной средний темп роста

 (%) . (7.9)


. Средний темп прироста (цепной и базисный)

. (7.10)


Размах вариации

. (7.11)=11,9 - 4,8 =7,1

. Мода . Графически моду можно определить по гистограмме выборки. Для этого выбирают самый высокий (модальный) прямоугольник (см. приложение 2). Верхнюю правую вершину модального прямоугольника соединяют с верхней правой вершиной предшествующего прямоугольника. Верхнюю левую вершину модального прямоугольника соединяют с верхней левой вершиной последующего прямоугольника. Абсцисса точки пересечения (точка О) и есть мода. В моем случае Мо=8,8.

. Медиана . В ранжированном ряду распределения одна половина ряда имеет значения признака больше медианы, а другая - меньше. При чётном числе членов ряда номер медианы определяется как , а для ряда с нечётным числом членов он равен , где  - объём выборки.=14 - четное число членов ряда => номер медианы равен =x7=8,3

Полученные значения занесем в табл. 7.2.

Таблица 7.2

Статистические показатели временного ряда












8,82

4,74

2,18

24,7

0,62

4,34

1,04

107,2

7,2

7,1

8,8

8,3


Итак, мы свели в таблицу основные аналитические и статистические показатели, важные для нашей работы. Из таблицы 7.1 мы видим, что на протяжении 14 лет показатели урожайности росли неровными темпами. Это объясняется как природными, так и другими факторами.

Исходя из таблицы 7.2, мы видим достаточно большой размах вариации (7,1), тогда как средний цепной темп прироста составляет 7,2%.

8. СГЛАЖИВАНИЕ ВРЕМЕННОГО РЯДА МЕТОДОМ СКОЛЬЗЯЩЕЙ СРЕДНЕЙ

В курсовой работе операцию сглаживания предлагается использовать для устранения случайных отклонений экспериментальных значений исходного временного ряда .

При сглаживании по методу скользящей средней фактические уровни временного ряда необходимо заменить средними уровнями, рассчитанными для последовательно подвижных интервалов.

Так, например, при сглаживании с помощью трёхчленной средней по значениям первых трёх уровней  и  рассчитывается средняя (сглаженная) величина для уровня

. (8.1)

Затем по следующей тройке уровней  и  находится средняя величина для уровня

 (8.2)

и т. д.


Крайние точки ряда  и  сглаживают по специальным формулам. Для уровня  сглаженное значение равно

. (8.3)

Для уровня  сглаженное значение находится по формуле

, (8.4)

где  и  - уровни в начале и в конце исходного ряда;

 и  - уровни сглаженного ряда в крайней левой () и крайней правой () точках исходного ряда соответственно.

В нашем случае

,

.

Результаты расчёта сглаженных значений временного ряда занесем в таблицу 8.1.

Таблица 8.1

Результаты сглаживания временного ряда методом скользящей средней

Годы

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

2010

2011

yi

4,8

6,4

6,0

8,3

11,8

10,6

7,7

8,0

10,0

11,1

8,3

9,9

8,8

11,9

yiср

5,1

5,7

6,9

8,7

10,2

10,0

8,8

8,6

9,7

9,8

9,8

9,0

10,2

9,2


Изобразим сглаженный с помощью трёхчленной скользящей средней временной ряд на рисунке в Приложении 4, где ранее была построена линейная диаграмма исходного ряда динамики. На рисунке видно, что ряд стал более гладким.


9. ВЫРАВНИВАНИЕ ВРЕМЕННОГО РЯДА С ПОМОЩЬЮ ЛИНЕЙНОЙ ФУНКЦИИ

Для получения математической модели, выражающей общую тенденцию (тренд) изменения уровней временного ряда, проводят его аналитическое выравнивание.

Суть выравнивания заключается в замене сглаженных уровней ряда уровнями, вычисленными на основе определённой аппроксимирующей функции. При выборе аппроксимирующей функции часто прибегают к анализу графического изображения сглаженного временного ряда.

Рассмотрим выравнивание сглаженного с помощью трёхчленной скользящей средней временного ряда линейной функцией (линейным трендом)

, (9.1)

где  - выровненные уровни временного ряда;

 - порядковый номер периода времени (фактор времени).

Параметры  и  тренда (12.1) рассчитываются по методу наименьших квадратов.

. (9.2)

Поиск параметров уравнения (12.1) упростится, если отсчёт времени производить так, чтобы сумма факторов времени временного ряда удовлетворяла условию

. (9.3)

Если число уровней временного ряда чётное, то нулевое значение фактора времени отсутствует. В этом случае периоды времени, относящиеся к середине ряда, имеют номера  и . Более ранние значения фактора времени ряда нумеруются , а более поздние  и т.д.

Тогда, при выполнении условия (9.3) параметры уравнения (9.1) находятся по формулам

; (9.4)

, (9.5)

где  - уровни сглаженного временного ряда.

Посчитаем параметры уравнения:


Решим уравнение 9.1


Среднюю ошибку аппроксимации временного ряда линейным трендом можно определить как величину среднеквадратического отклонения выровненных уровней ряда от сглаженных

 , (9.6)

где  и  - соответственно выровненные и сглаженные уровни временного ряда.


Результаты расчётов сведем в таблицу 9.1.

Таблица 9.1

Результаты выравнивания временного ряда

с помощью линейной функции

Сглажённые и выровненные уровни ряда




Годы




8,7

0,25

1,4

1998

-7

5,1

6,95




1999

-6

5,7

7,2




2000

-5

6,9

7,45




2001

-4

8,7

7,7




2002

-3

10,2

7,95




2003

-2

10,0

8,2




2004

-1

8,8

8,45




2005

1

8,6

8,95




2006

2

9,7

9,2




2007

3

9,8

9,45




2008

4

9,8

9,7




2009

5

9,0

9,95




2010

6

10,2

10,2




2011

7

9,2

10,45





На рисунке в Приложении 5, где изображены вместе линейная диаграмма исходного временного ряда и временной ряд, сглаженный методом скользящей средней, построим график линейного тренда. По полученному уравнению =8,7+0,25t мы получили линию тренда с небольшим углом наклона.

.ПРОГНОЗИРОВАНИЕ ВРЕМЕННОГО РЯДА НА ОСНОВЕ ЛИНЕЙНОГО ТРЕНДА

Для точности прогноза построим ряд отклонений фактических уровней ряда от выровненных уровней ряда по тренду. Затем найдем тренд для данного ряда, по формулам, используемым в предыдущей главе.

Отклонения найдем по следующей формуле:

∆i = уi -

Таблица 9.1. Ряд отклонений фактических уровней ряда от тренда.

Годы

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

2010

2011

∆i

∆1

∆2

∆3

∆4

∆5

∆6

∆7

∆8

∆9

∆10

∆11

∆12

∆13

∆14

Значения

-2,15

-0,8

-1,45

0,6

3,85

2,4

-0,75

-0,95

1,65

-1,4

-0,05

-1,4

1,45


Рассчитаем параметры  и  тренда для отклонений по следующим формулам:

 

 


Теперь приступим к решению уравнения  :


Просчитаем прогнозное отклонение от тренда на 2012 год:


Фактическая урожайность в 2012 году составила 4,8 ц/га. Прогнозное значение урожайности по тренду равно 10,7 ц/га.

Абсолютную  и относительную  ошибки прогноза определите по формулам:

;

где  и  - фактическое и прогнозное значение урожайности.


Результаты расчётов занесены в таблицу 9.2.

Таблица 9.2. Прогнозное значение.

Прогнозное значение  урожайности по тренду

Параметры тренда для отклонений

Прогнозное отклонение от тренда

Прогноз  урожайности

Ошибка прогноза










10,7

0,13

0,05

0,53

4,8

5,9

123%


Как видно из сравнения полученного прогноза и предоставленного, ошибка прогноза составляет 123%. Это говорит о ненадежности нашего прогноза. Для повышения точности прогноза построим линейный тренд для отклонений (отклонений фактических уровней ряда от выравненных), который представлен в Приложении 6.

ЗАКЛЮЧЕНИЕ И ВЫВОДЫ

В работе было проведено статистическое исследование урожайности зерновых культур Пластовского района Челябинской области. В ходе вычислений были найдены следующие характеристики: среднее значение урожайности за 13 лет, мода и медиана, темпы роста и прироста, среднее абсолютное отклонение, которое показывает, насколько ежегодно в среднем изменялась урожайность, коэффициент риска неурожайности. Также была спрогнозирована урожайность на 2012 год.

Цель работы достигнута, все задачи решены. Можно сделать следующие выводы:

Гипотеза о нормальном законе распределения была принята, т.е. изучаемое распределение можно считать нормальным.

Временной ряд, сглаженный методом скользящей средней имеет более мягкие колебания по сравнению с исходным.

Линия тренда показывает, что урожайность с каждым годом постепенно возрастает.

Построив прогноз на 2012г. и сравнив его с фактическими показателями урожайности, получили расхождения.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

Матвеев, Б.А. Анализ статистических данных: учебное пособие к курсовой работе. - Челябинск: Изд-во ЮУрГУ, 2007. - 27с.

Теория статистики: Учебник/ Под ред. Р.А. Шмойловой. - 2-е изд., доп. И перераб. - М.: Финансы и статистика, 2008. - 576 с.

Френкель А.А., Адамова Е.В. Вариационные ряды и их статистические характеристики. - М.: МЭСИ, 2010.

Четыркин Е.М. Статистические методы прогнозирования. - М.: Статистика, 2013 - 184 с.

Методические указания по выполнению курсовой работы для студентов/ под ред. А.В. Пархоменко - Тамбов: ТГТУ, 2011

ПРИЛОЖЕНИЕ 1

Диаграмма накопленных частот



ПРИЛОЖЕНИЕ 2

Гистограмма выборки



ПРИЛОЖЕНИЕ 3

Линейная диаграмма исходного временного ряда




ПРИЛОЖЕНИЕ 4

Сглаженный временной ряд методом скользящей средней



ПРИЛОЖЕНИЕ 5

График линейного тренда



ПРИЛОЖЕНИЕ 6

Похожие работы на - Анализ статистических данных

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!