Вариационные ряды

  • Вид работы:
    Практическое задание
  • Предмет:
    Математика
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    66,14 Кб
  • Опубликовано:
    2014-04-06
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Вариационные ряды

1.      Построение и графическое изображение вариационных рядов


Имеем статистическую совокупность из 30 сельскохозяйственных организаций, охарактеризованных двумя признаками: качеством почв и урожайностью зерновых.

вариационный сельскохозяйственный почва ряд

Таблица 1. Исходные данные

№ хозяйства

Качество почв, балл (х)

Урожайность зерновых, ц/га (у)

1

80

30

2

64

21

3

68

21

4

67

21

5

88

36

6

89

37

7

79

35

8

78

25

9

65

20

10

79

35

11

65

20

12

69

25

13

75

30

14

68

30

15

65

21

16

88

36

17

70

36

18

80

30

19

90

37

20

78

30

21

58

21

22

65

36

23

80

30

24

88

30

25

70

25

26

78

30

27

80

35

28

88

36

29

78

35

30

64

20

В результате логического рассуждения приходим к выводу, что зависимым, результативным признаком в данном случае является урожайность зерновых, а независимым, факторным - качество почв.

Следовательно, в соответствии с заданием дискретный вариационный ряд строим по результативному признаку - урожайности зерновых, интервальный вариационный ряд - по факторному признаку - качеству почв.

Для того чтобы составить дискретный вариационный ряд, необходимо расположить значения признака в порядке возрастания, т.е. произвести ранжирование статистических данных, а затем подсчитать частоты.

Таблица 2. Дискретный ряд распределения урожайности зерновых

Варианты

Частоты

Накопленные частоты

20

3

3

21

8

11

22

7

18

23

6

24

24

5

29

25

8

37

26

8

45

27

8

53

28

7

60

29

6

66

30

13

79

31

12

91

32

11

102

33

10

112

34

9

121

35

10

131

36

13

144

37

13

157


Для графического изображения дискретного ряда служит многоугольник (полигон). При его построении на оси абсцисс откладываются варианты, на оси ординат - частоты.

Рис. 1. Полигон распределения сельскохозяйственных предприятий по урожайности зерновых

Для построения интервального вариационного ряда:

·        определяется число групп (число интервалов) по формуле Стерджесса:

К=1+3.32*log(n), (1)

где К - число групп (интервалов); n - число единиц наблюдения;

К=1+3.32*log(30) = 5.9 ≈ 6

·        рассчитывается величина интервала, т.е. разность между верхним и нижним значением признака в группе:

, (2)

где xmax - максимальное значение признака; xmin - минимальное значение признака.

·        формируются группы, т.е. устанавливаются верхние и нижние границы для каждого интервала;

·        рассчитываются частоты и накопленные частоты для интервального ряда;

Графически интервальный ряд изображают с помощью гистограммы. На оси абсцисс берутся отрезки, соответствующие величине интервала. На каждом отрезке строят прямоугольник, длина второй стороны которого соответствует частоте.

Для построения диаграммы необходимо найти середины интервалов по формуле:

, (3)

Таблица 3. Интервальный вариационный ряд распределения качества почв

Интервалы

Частоты

Накопленные частоты

Середины интервалов

58,0 - 63,33

1

1

60,67

63,33 - 68,67

0

1

66,00

68,67 - 74,0

8

9

71,33

74,0 - 79,33

10

19

76,67

79,33 - 84,67

16

35

82,00

84,67 - 90,0

19

54

87,33



Рис. 2. Гистограмма распределения сельскохозяйственных предприятий по качеству почв

2.      Статистические характеристики рядов распределения


2.1    Показатели центра распределения

·        средняя арифметическая;

·        мода;

·        медиана.

Средняя арифметическая вычисляется по формулам:

простая

; (4)

взвешенная

, (5)

где среднее значение признака;  - варианты;  - частоты;

Мода вычисляется по формуле:

, (6)

где  - нижняя граница интервала, содержащего моду;

 - величина модального интервала;

 - частота модального интервала;

 - частота интервала, предшествующего модальному;

 - частота послемодального интервала.

Медиана рассчитывается по формуле:

, (7)

где  - нижняя граница медианного интервала;

 - величина медианного интервала;

 - сумма накопленных частот, предшествующих медианному интервалу;

 - частота медианного интервала.

2.2    Показатели колеблемости признака

·        размах вариации;

·        среднее линейное отклонение;

·        дисперсия;

·        среднее квадратическое отклонение;

·        коэффициент вариации.

Дисперсия определяется по формуле:

, (8)

Среднеквадратическое отклонение вычисляется по формуле:

, (9)

Коэффициент вариации вычисляется по формуле:

, (10)

 - коэффициент вариации для качества почв

 - коэффициент вариации для урожайности зерновых

2.3    Показатели формы распределения

·        коэффициент асимметрии определяется по формуле:

; (11) или , (12)

где  - центральный момент третьего порядка.

·        коэффициент эксцесса определяется по формуле:

, (13)

где  - центральный момент четвертого порядка.

Таблица 4. Показатели центра, вариации и формы распределения

Качество почв, балл (х)

Урожайность зерновых, ц/га (у)

Название показателя

Размер

Название показателя

Размер

Среднее

80,91

Среднее

29,13

Стандартная ошибка

1,15

Стандартная ошибка

1,12

Медиана

82

Медиана

30

Мода

85,4

Мода

30

Среднее квадратическое отклонение

6,28

Среднее квадратическое отклонение

6,15

Дисперсия выборки

39,39

Дисперсия выборки

37,85

Эксцесс

0,24

Эксцесс

- 1,48

Асимметричность

- 0,83 (- 0,71)

Асимметричность

- 0,14

Интервал

32

Интервал

17

Минимум

58

Минимум

20

Максимум

90

Максимум

37

Сумма

2254

Сумма

874

Счет

30

Счет

30

Уровень надежности (95,0%)

3,43

Уровень надежности (95,0%)

2,34

Коэффициент вариации

7,76%

Коэффициент вариации

21,11%


На основе данных таблицы формулируем выводы.

В данной совокупности сельскохозяйственных предприятий средняя урожайность зерновых составляет 29,13 ц/га, средний показатель качества почв составляет 80,91 баллов.

Медиана  показывает, что половина сельскохозяйственных предприятий совокупности имеет качество почв меньше 82 баллов, а половина - больше 82 баллов; Медиана = 30 показывает, что половина сельскохозяйственных предприятий имеет урожайность зерновых меньше 30 ц/га, а половина - больше 30 ц/га.

Мода = 85,4 показывает, что наиболее часто в данной совокупности встречается качество почв 85,4 баллов; Мода  = 30 показывает, что наиболее часто в данной совокупности встречается урожайность зерновых 30 ц/га.

Коэффициент вариации свидетельствует о слабой вариации обоих признаков, так как оба коэффициента меньше 33%.

Коэффициенты эксцесса показывают, что распределение хозяйств по качеству почв является островершинным, так как = 0,240, а распределение по урожайности зерновых является плосковершинным, так как .

По коэффициентам асимметрии можно сделать вывод, что распределение хозяйств по урожайности зерновых и по качеству почв имеет левую асимметричность, так как .

2.4    Статистические оценки параметров распределения

Изучаемую совокупность можно считать выборкой из генеральной совокупности, состоящей из большого множества сельскохозяйственных предприятий. На основе показателей, рассчитанных по выборке, дают статистическую оценку параметров генеральной совокупности.

Возможное расхождение между выборочными и генеральными характеристиками составляет ошибку выборки.

Стандартная ошибка выборки определяется по формуле:

, (14)

Для определения интервальной оценки необходимо найти доверительный интервал:

, (15)

, (16)

,

где  - предельная ошибка выборочной средней;  - коэффициент доверия, который определяют по таблице распределения Стьюдента по заданным n и  при малой выборке n 30.

Коэффициент доверия по таблице Стьюдента равен 2,0452.

Для урожайности зерновых предельная ошибка

Строим доверительный интервал:

Для качества почв предельная ошибка

Строим доверительный интервал:

.

С вероятностью 0,95 можно утверждать, что генеральная средняя урожайности зерновых не выйдет за пределы от 26,79 до 31,47 ц/га.

С вероятностью 0,95 можно утверждать, что генеральная средняя качества почв находится в интервале от 78,52 до 83,3 баллов и не выйдет за его пределы.

2.5    Проверка гипотезы о законе нормального распределения по критерию Пирсона

Для объективной оценки степени соответствия эмпирического распределения теоретическому используется ряд особых показателей, называемых критериями согласия. На их базе проверяется гипотеза о законе нормального распределения. Это критерии Пирсона, Колмогорова, Романовского и др.

Критерий Пирсона (хи-квадрат) определяется по формуле:

, (17)

где  (хи-квадрат) - критерий Пирсона;  - эмпирические частоты;

 - теоретические частоты.


, (18)

где  - теоретические частоты;  - фактические частоты; h - шаг;

 - нормированные отклонения;  - значения функции плотности стандартизированного нормального распределения.

Вычисления выполняются в следующей последовательности:

1)      Определяются нормированные отклонения;

)        При рассчитанных значениях нормированных отклонений по таблице плотности нормального распределения отыскиваются значения функции плотности стандартизированного нормального распределения;

3)      Вычисляется выражение ;

)        Определяются теоретические частоты;

)        Рассчитывается критерий Пирсона.

Таблица 5. Расчет теоретических частот

Группа предприятий по качеству почв

Фактические частоты

Середины интервалов

t

φ(t)

(hƩfi)/σ

58,0 - 63.33

1

60.67

-3,22

0,0022

45,83

63.33 - 68.67

0

66.0

-2,37

0,0241

45,83

68.67 - 74,0

8

71.34

-1,52

0,1257

45,83

74,0 - 79.33

10

76.67

-0,68

0,3166

45,83

79.33 - 84.67

16

82.0

0,17

0,3932

45,83

84.67 - 90,0

19

87.34

1,02

0,2371

45,83


54






Критерий согласия Пирсона рассчитываем в следующей таблице.

Таблица 6. Расчет критерия согласия Пирсона

Варианты

Частоты


эмпирические

теоретические




58.0 - 63.33

1

0,100826

0,899174

0,808514

8,018903

63.33 - 68.67

0

1,104503

-1,1045

1,219927

1,104503

68.67 - 74.0

8

5,760831

2,239169

5,013878

0,870339

74.0 - 79.33

10

14,50978

-4,50978

20,3381

1,401682

79.33 - 84.67

16

18,02036

-2,02036

4,081838

0,226513

84.67 - 90.0

19

10,86629

8,133707

66,15719

6,088294


17,71023 (фактическое значение критерия Пирсона)

 (критическое значение критерия Пирсона по таблице)

Так как фактическое значение критерия Пирсона больше критического значения, можно утверждать, что исследуемое эмпирическое распределение имеет отличный от теоретического закон распределения, т.е. нулевая гипотеза о том, что распределение подчиняется закону нормального распределения, не принимается.

Генеральная совокупность не распределена по нормальному закону.

3.      Корреляционно-регрессионный анализ


В процессе корреляционно-регрессионного анализа решаются следующие задачи:

)        Определение формы и направления связи, ее количественное выражение в виде уравнения регрессии.

)        Определение характеристики тесноты связи.

)        Определение значимости выборочных характеристик тесноты корреляционной связи.

Таблица 7. Результаты вычисления параметров и показателей для КРА

ВЫВОД ИТОГОВ






Регрессионная статистика






Множественный R

0,754929






R-квадрат

0,569918






Нормированный R-квадрат

0,554558






Стандартная ошибка

0,079849






Наблюдения

30






Дисперсионный анализ






df

SS

MS

F

Значимость F


Регрессия

1

647,1226

647,1226

37,10382

1,43E-06


Остаток

28

488,3441

17,44086




Итого

29

1135,467






Коэф.

Станд. ошибка

t-статистика

Р-значение

Нижние 95%

Верхние 95%

Y-пересечение

-9,53209

6,393286

-1,49095

0,147155

-22,6281

3,563966

Переменная X1

0,514624

0,084485

6,091291

1,43E-06

0,341564

0,687684


На основе данных таблицы построим уравнение регрессии:

ух = - 9,532 + 0,515х

Выводы

Коэффициент регрессии а1 = 0,515 означает, что с повышением качества почв на 1 балл урожайность зерновых повышается на 0,515 ц/га.

Коэффициент корреляции r = 0,750,7, следовательно, связь между изучаемыми признаками в данной совокупности тесная.

Коэффициент детерминации r2 = 0,57 показывает, что 57% вариации результативного признака (урожайности зерновых) вызвано действием факторного признака (качества почв).

В таблице критических точек распределения Фишера-Снедекора находим критическое значение F - критерия при уровне значимости 0,05 и числе степеней свободы К1 = m - 1=2 - 1=1 и К2 = n - m=30 - 2=28, оно равно 4,21.

Так как рассчитанное значение F - критерия больше F табличного (F=37,1, то уравнение регрессии признается значимым.

Для оценки значимости коэффициента корреляции рассчитываем t - критерий Стьюдента:


В таблице критических точек распределения Стьюдента найдем критическое значение t-критерия при уровне значимости 0,05 и числе степеней свободы n - 1=30 - 1=29, оно равно 2,0452.

Так как рассчитанное значение t-критерия больше табличного, то коэффициент корреляции является значимым.

Похожие работы на - Вариационные ряды

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!