Особенности расчета статистических показателей
Задания
Имеются следующие выборочные данные по городам одного из
регионов страны в отчетном периоде (выборка 10% -ная, механическая):
№ города п. /п.
|
Товарооборот,
млрд. руб.
|
Численность
населения, тыс. чел.
|
№ города п. /п.
|
Товарооборот,
млрд. руб.
|
Численность
населения, тыс. чел.
|
1
|
4,00
|
50
|
16
|
7,70
|
86
|
2
|
4, 20
|
60
|
17
|
2,00
|
45
|
3
|
7,90
|
89
|
18
|
7,00
|
80
|
4
|
7,80
|
88
|
19
|
7,90
|
89
|
5
|
4,15
|
60
|
20
|
7,60
|
85
|
6
|
2,00
|
45
|
21
|
7,00
|
86
|
7
|
4,05
|
60
|
22
|
5,30
|
70
|
8
|
7,80
|
87
|
23
|
7,95
|
89
|
9
|
4,50
|
60
|
24
|
6,30
|
80
|
10
|
5,00
|
70
|
25
|
9,80
|
105
|
11
|
4,00
|
60
|
26
|
9,05
|
100
|
12
|
10,00
|
105
|
27
|
9,60
|
105
|
13
|
7,95
|
89
|
28
|
3,90
|
50
|
14
|
6,00
|
70
|
29
|
2,10
|
45
|
15
|
7,90
|
89
|
30
|
9,70
|
105
|
Задание 1
. Провести группировку единиц наблюдения статистической
совокупности по факторному признаку, образовав четыре группы с равными
интервалами. Построить аналитическую таблицу. Построить гистограмму и круговую
диаграмму. Сделать выводы.
. По данным первоначальной и аналитической таблицы по
факторной и результативной переменными расчетным путем (в форме расчетной
таблицы) и с использованием статистических функций в Excel (в качестве проверки
правильности расчета) определить и обосновать:
средние значения, моду и медиану. Сравнить их между собой и
сделать соответствующие выводы.
показатели вариации (среднее линейное отклонение, дисперсию,
среднеквадратическое отклонение, коэффициент вариации). Оценить исходную
информацию на устойчивость и сделать выводы.
Решение
задания 1
Первичные данные выборочной совокупности могут содержать
аномальные значения изучаемых признаков. Выявим их и исключим из дальнейшего
рассмотрения с целью обеспечения устойчивости данных статистического анализа.
№ города п. /п.
|
Товарооборот,
млрд. руб.
|
Численность
населения, тыс. чел.
|
1
|
4
|
50
|
2
|
4,2
|
60
|
3
|
7,9
|
89
|
4
|
7,8
|
88
|
5
|
4,15
|
60
|
6
|
2
|
45
|
7
|
4,05
|
60
|
8
|
7,8
|
87
|
9
|
4,5
|
60
|
10
|
5
|
70
|
11
|
4
|
60
|
12
|
10
|
105
|
13
|
7,95
|
89
|
14
|
6
|
70
|
15
|
7,9
|
89
|
16
|
7,7
|
86
|
17
|
2
|
45
|
18
|
7
|
80
|
19
|
7,9
|
89
|
20
|
7,6
|
85
|
21
|
7
|
86
|
22
|
5,3
|
70
|
23
|
7,95
|
89
|
24
|
6,3
|
80
|
25
|
9,8
|
105
|
26
|
9,05
|
100
|
27
|
9,6
|
105
|
28
|
3,9
|
50
|
29
|
2,1
|
45
|
30
|
9,7
|
105
|
Анализируя исходные табличные данные, видим, что в данной
выборке нет аномальных единиц.
Провести группировку единиц наблюдения статистической
совокупности по факторному признаку, образовав пять групп с равными интервалами.
Проведем сортировку данных городов по товарообороту в порядке
возрастания (используя в MS Excel функцию сортировка).
Группировочный признак - товарооборот.
Результативный признак - численность населения.
Число групп задано по условию и равно 4.
Рассчитаем интервал для групп: минимальный элемент - 2,
максимальный элемент - 10.
Тогда размах интервала вычисляем по формуле:
(млрд. руб.)
№ п. /п.
|
нижняя граница
|
верхняя граница
|
1
|
2
|
4
|
2
|
4
|
6
|
3
|
6
|
8
|
4
|
8
|
10
|
Определив нижнюю и верхнюю границы, выделяем по ранжированной
таблице городов, попавшие в каждую группу по товарообороту различными цветами и
определяем их число.
№ города п. /п.
|
Товарооборот,
млрд. руб.
|
Численность
населения, тыс. чел.
|
6
|
2
|
45
|
17
|
2
|
45
|
29
|
2,1
|
45
|
28
|
3,9
|
50
|
1
|
4
|
50
|
11
|
4
|
60
|
7
|
4,05
|
60
|
5
|
4,15
|
60
|
2
|
4,2
|
60
|
9
|
4,5
|
60
|
10
|
5
|
70
|
22
|
5,3
|
70
|
14
|
6
|
70
|
24
|
6,3
|
80
|
18
|
7
|
80
|
21
|
7
|
86
|
20
|
7,6
|
85
|
16
|
7,7
|
86
|
4
|
7,8
|
88
|
8
|
7,8
|
87
|
3
|
7,9
|
89
|
15
|
7,9
|
89
|
19
|
7,9
|
89
|
13
|
7,95
|
89
|
23
|
7,95
|
89
|
26
|
9,05
|
100
|
27
|
9,6
|
105
|
30
|
9,7
|
105
|
25
|
9,8
|
105
|
12
|
10
|
105
|
Построим аналитическую таблицу:
№
|
группы по
товарообороту
|
количество
городов
|
Товарооборот,
млрд. руб.
|
Численность
населения, тыс. чел.
|
|
|
|
всего
|
в ср. на 1
город
|
всего
|
в ср. на 1
город
|
1
|
2 - 4
|
4
|
10,00
|
2,50
|
185,00
|
46,25
|
2
|
4 - 6
|
8
|
35, 20
|
4,40
|
490,00
|
61,25
|
3
|
6 - 8
|
13
|
96,80
|
7,45
|
1107,00
|
85,15
|
4
|
8 - 10
|
5
|
48,15
|
9,63
|
104,00
|
Итого
|
|
190,15
|
|
2302,00
|
|
В среднем на 1
город
|
|
|
5,99
|
|
74,16
|
Вывод: Аналитическая таблица показывает взаимосвязь
рассматриваемых переменных. Следовательно, с увеличением товарооборота на 1
город численность населения увеличивается. Товарооборот на 1 город по
совокупности предложенных городов равен 5,99 млрд. руб., а численность
населения составляет 74,16 тыс. чел.
Построить гистограмму и круговую диаграмму.
гистограмма распределения числа городов по группам
товарооборота
круговая диаграмма распределения числа городов по группам
товарооборота
Вывод: самое большое городов находится в интервалах от 6 до 8
млрд. руб. и составляет 13 городов, доля которых составляет 43%, а самая
малочисленная группа городов имеет от 2 до 4 млрд. руб., что составляет 13% от
общего числа городов.
. По данным первоначальной и аналитической таблицы по
факторной и результативной переменными расчетным путем и с использованием
статистических функций в Excel (в качестве проверки правильности расчета)
определим: средние значения моду и медиану.
Расчетным путем.
. Мода определяется по формуле:
Наиболее часто встречаемое значение признака соответствует
интервалу - [6 - 8] и этот интервал является модальным.
Вывод: Для рассматриваемой совокупности городов наиболее
распространенный объем товарооборота характеризуется средней величиной 11 млрд.
руб.
Медиана определяется по формуле:
Определим накопленную частоту:
группы городов
по товарообороту
|
число городов
|
накопленная
частота
|
2 - 4
|
4
|
4
|
4 - 6
|
8
|
12
|
6 - 8
|
13
|
25
|
8 - 10
|
5
|
30
|
Медианный интервал - [6 - 8]
Вывод: У одной половины городов товарооборот до 9 млрд. руб., а у
другой половины - свыше 9 млрд. руб.
Вывод: Средняя величина Моды больше Медианы, соответственно можно
сделать вывод, что распределение городов на группы по товарообороту не
соответствует нормальному закону распределения, то в распределении существует
левосторонняя асимметрия.
С использованием статистических функций в Excel МОДА (), МЕДИАНА ():
=МОДА (B2: B31)
=МЕДИАНА (B2: B31)
по факторной переменной (товарооборот) мода =7,9, медиана =7, по
результативной переменной (численность населения) мода = 60, медиана =82,5.
Теперь рассчитаем показатели вариации. Рассчитываем при помощи Excel среднее для Х и Y:
=СРЗНАЧ (B2: B31)
Хср =6,338, Уср =76,733
Найдем среднее линейное отклонение по формуле:
=СРОТКЛ (B2: B31)
Вывод: Средний товарооборот городов равен 6,338 млрд. руб. и
отличается в среднем от фактического товарооборота для каждого города на 2,082
млрд. руб. Средняя численность населения 76,733 тыс. чел. и отличается от фактической
численности населения в каждом городе на 16,836 тыс. чел. Рассчитаем столбец
(Хi-Хср) ^2 при помощи Excel и найдем
дисперсию для Х по формуле:
=169,238/30 = 5,641
Воспользуемся встроенной статистической функцией для расчета
дисперсии фактора Х и результата У: =ДИСПР (B2: B31)
Дисперсия (Х) = 5,641, Дисперсия (У) =365,662
По дисперсии вывода нет, она экономической интерпретации не
подлежит.
Найдем среднее квадратическое отклонение по формуле:
Тогда и для упрощения нахождения корня
воспользуемся встроенной математической функцией КОРЕНЬ ().
Вывод: Имеет тот же экономический смысл, что и найденное среднее
линейное отклонение. Средний товарооборот городов равен 6,338 млрд. руб. и
отличается в среднем от фактического товарооборота на каждый город на 2,375
млрд. руб. Средняя численность населения равна 76,733 тыс. чел. и отличается от
фактической численности населения на каждый город на 19,122 тыс. чел.
Рассчитаем коэффициент вариации по формуле:
Коэффициент вариации для Х = 37,473%, для У = 24,92%.
Вывод: Отобранная совокупность городов по товарообороту является
качественно однородной и средний показатель является надежной величиной
(37,473%). Отобранная совокупность городов по численности населения является
качественно однородной и средний показатель является надежной величиной
(24,92%). Таким образом, сопоставляя среднее линейное отклонение со средним
квадратическим, можно сделать вывод об устойчивости.
Если (индикатор устойчивости данных) > 0,8,
то значения признака неустойчивы, в них имеются аномальные выбросы.
Коэффициент устойчивости по х=0,88, это значит, что сформированные
данные являются не устойчивыми, т.е. в них имеются аномальные единицы.
Коэффициент устойчивости по у=0,877, это значит, что сформированные данные
являются не устойчивыми, т.е. в них имеются аномальные единицы.
Аномальные единицы:
№ города п/п
|
Товарооборот,
мл рд руб.
|
Численность
населения, тыс. чел.
|
6
|
2
|
45
|
17
|
2
|
45
|
Задание 2
. Установить наличие и направление связи между факторной и
результативной переменными
. Дать количественную оценку тесноте связи между исследуемыми
переменными на основе расчета линейного коэффициента корреляции как расчетным
путем (в форме расчетной таблицы) так и в автоматическом режиме с
использованием статистической функций в Excel в качестве проверки
правильности расчета. Сделать вывод.
. Построить уравнение регрессии и показать его на графике.
Обосновать параметры уравнения. Определить теоретические значения
результативной переменной. Рассчитать коэффициент эластичности. Все расчеты
представить в виде расчетной таблицы. Проверить полученные расчеты в
автоматическом режиме с использованием статистических функций в Excel. Сделать выводы.
. Провести дисперсионный анализ на основе расчета общей,
факторной и остаточной дисперсий (расчеты показать в виде данных расчетной
таблицы). На основе правила сложения дисперсий определить эмпирический
коэффициент детерминации и эмпирическое корреляционное отношение. Оценить
выведенное уравнение регрессии на статистическую значимость. Сделать
соответствующие выводы.
Выполнение
задания 2
. Установить наличие и направление связи между факторной и
результативной переменными
В задании 1 выполнена группировка исходных данных и на основе
группировки построена аналитическая таблица
№
|
группы по
товарообороту
|
количество
городов
|
Товарооборот,
млрд. руб.
|
Численность
населения, тыс. чел.
|
|
|
|
всего
|
в ср. на 1
город
|
всего
|
в ср. на 1
город
|
1
|
2 - 4
|
4
|
10,00
|
2,50
|
185,00
|
46,25
|
2
|
4 - 6
|
8
|
35, 20
|
4,40
|
490,00
|
61,25
|
3
|
6 - 8
|
13
|
96,80
|
7,45
|
1107,00
|
85,15
|
4
|
8 - 10
|
5
|
48,15
|
9,63
|
520,00
|
104,00
|
Итого
|
|
190,15
|
|
2302,00
|
|
В среднем на 1
город
|
|
|
5,99
|
|
74,16
|
Вывод: Аналитическая таблица показывает взаимосвязь
рассматриваемых переменных.
Следовательно, с увеличением товарооборота в среднем на 1
город численность населения в среднем на 1 город увеличивается, что позволяет сделать
вывод о наличии связи между факторной (товарооборот) и результативной
(численность населения) переменными.
При этом направление связи - прямое.
. Дать количественную оценку тесноте связи между исследуемыми
переменными на основе расчета линейного коэффициента корреляции:
расчетным путем (в форме расчетной таблицы) по формуле
№ п/п
|
X
|
Y
|
X*Y
|
(Xі-Xср) ^2
|
(Yі-Yср) ^2
|
1
|
4,000
|
50,000
|
200,000
|
5,468
|
714,671
|
2
|
4, 200
|
60,000
|
252,000
|
4,572
|
280,004
|
3
|
7,900
|
89,000
|
703,100
|
2,439
|
150,471
|
4
|
7,800
|
88,000
|
686,400
|
2,136
|
126,938
|
5
|
4,150
|
60,000
|
249,000
|
4,789
|
280,004
|
6
|
2,000
|
45,000
|
90,000
|
18,821
|
1007,004
|
7
|
4,050
|
60,000
|
243,000
|
5,236
|
280,004
|
8
|
7,800
|
87,000
|
678,600
|
2,136
|
105,404
|
9
|
4,500
|
60,000
|
270,000
|
3,379
|
280,004
|
10
|
5,000
|
70,000
|
350,000
|
1,791
|
45,338
|
11
|
4,000
|
60,000
|
240,000
|
5,468
|
280,004
|
12
|
10,000
|
105,000
|
1050,000
|
13,408
|
799,004
|
13
|
7,950
|
89,000
|
707,550
|
2,597
|
150,471
|
14
|
6,000
|
70,000
|
420,000
|
0,114
|
45,338
|
15
|
7,900
|
89,000
|
703,100
|
2,439
|
150,471
|
16
|
7,700
|
86,000
|
662, 200
|
1,854
|
85,871
|
17
|
2,000
|
45,000
|
90,000
|
18,821
|
1007,004
|
18
|
7,000
|
80,000
|
560,000
|
0,438
|
10,671
|
19
|
7,900
|
89,000
|
703,100
|
2,439
|
150,471
|
20
|
7,600
|
85,000
|
646,000
|
1,592
|
68,338
|
21
|
7,000
|
86,000
|
602,000
|
0,438
|
85,871
|
22
|
5,300
|
70,000
|
371,000
|
1,078
|
45,338
|
23
|
7,950
|
89,000
|
707,550
|
2,597
|
150,471
|
24
|
6,300
|
80,000
|
504,000
|
0,001
|
10,671
|
25
|
9,800
|
105,000
|
1029,000
|
11,983
|
799,004
|
26
|
9,050
|
100,000
|
905,000
|
7,353
|
541,338
|
27
|
9,600
|
105,000
|
1008,000
|
10,638
|
799,004
|
28
|
3,900
|
50,000
|
195,000
|
5,945
|
714,671
|
29
|
2,100
|
45,000
|
94,500
|
17,963
|
1007,004
|
30
|
9,700
|
105,000
|
1018,500
|
11,301
|
799,004
|
итого
|
190,150
|
2302,000
|
15938,600
|
169,238
|
10969,867
|
сред. знач
|
6,338
|
76,733
|
531,287
|
5,641
|
365,662
|
Тогда линейный коэффициент корреляции составит:
,
| | > 0,75
и приближается к 1, значит связь сильная, и наличие знака плюс
говорит о прямой направленности зависимости
в автоматическом режиме с использованием статистической функций в Excel в качестве проверки правильности расчета
В результате расчетов получили, что линейный коэффициент
корреляции r = 0,989.
Связь между факторной (товарооборот) и результативной численность
населения) переменными сильная, и характер зависимости - прямой.
. Построим уравнение регрессии в виде линейное уравнение
регрессии:
Расчеты представим в виде расчетной таблицы:
№ п/п
|
X
|
Y
|
X*Y
|
X^2
|
1
|
4,000
|
50,000
|
200,000
|
16
|
2
|
4, 200
|
60,000
|
252,000
|
17,64
|
3
|
7,900
|
89,000
|
703,100
|
62,41
|
4
|
7,800
|
88,000
|
686,400
|
60,84
|
5
|
4,150
|
60,000
|
249,000
|
17,2225
|
6
|
2,000
|
45,000
|
90,000
|
4
|
7
|
4,050
|
60,000
|
243,000
|
16,4025
|
8
|
7,800
|
87,000
|
678,600
|
60,84
|
9
|
4,500
|
60,000
|
270,000
|
20,25
|
10
|
5,000
|
70,000
|
350,000
|
25
|
11
|
4,000
|
60,000
|
240,000
|
16
|
12
|
10,000
|
105,000
|
1050,000
|
100
|
13
|
7,950
|
89,000
|
707,550
|
63, 2025
|
14
|
6,000
|
70,000
|
420,000
|
36
|
15
|
7,900
|
89,000
|
703,100
|
62,41
|
16
|
7,700
|
86,000
|
662, 200
|
59,29
|
17
|
2,000
|
45,000
|
90,000
|
4
|
18
|
7,000
|
80,000
|
560,000
|
49
|
19
|
7,900
|
89,000
|
703,100
|
62,41
|
20
|
7,600
|
85,000
|
646,000
|
57,76
|
21
|
7,000
|
86,000
|
602,000
|
49
|
22
|
5,300
|
70,000
|
371,000
|
28,09
|
23
|
7,950
|
89,000
|
707,550
|
63, 2025
|
24
|
6,300
|
80,000
|
504,000
|
39,69
|
25
|
9,800
|
105,000
|
1029,000
|
96,04
|
26
|
9,050
|
100,000
|
905,000
|
81,9025
|
27
|
9,600
|
105,000
|
1008,000
|
92,16
|
28
|
3,900
|
50,000
|
195,000
|
15,21
|
29
|
2,100
|
45,000
|
94,500
|
4,41
|
30
|
9,700
|
105,000
|
1018,500
|
94,09
|
итого
|
190,150
|
2302,000
|
15938,600
|
1374,4725
|
Воспользуемся методом наименьших квадратов и получим значения
коэффициентов линейного уравнения регрессии на основе системы линейных
уравнений:
Заносим данные из строки Итого расчетной таблицы и получаем
систему вида:
Решив систему получим: а0 = 26,255, а1 =
7,964
Тогда линейное уравнение регрессии имеет вид:
Таким образом, при увеличении значения товарооборота на 1 млрд.
руб. значение результативной переменной численность населения увеличивается на
7,964 тыс. чел., т.е. при увеличении товарооборота численность населения
растет.
Параметр а0=26,257 не имеет экономического смысла
Определим теоретические значения результативной переменной.
Для этого в полученное уравнение линейной регрессии подставим
вместо переменной х значения товарооборота из исходной таблицы данных.
товарооборот, X
млрд. руб.
|
численность
населения, тыс. чел. фактическая
|
численность
населения, тыс. чел. теоретическое
|
4,000
|
50,000
|
58,113
|
4, 200
|
60,000
|
59,706
|
7,900
|
89,000
|
89,173
|
7,800
|
88,000
|
88,376
|
4,150
|
60,000
|
59,308
|
2,000
|
45,000
|
42,185
|
4,050
|
60,000
|
58,511
|
7,800
|
87,000
|
88,376
|
4,500
|
60,000
|
62,095
|
5,000
|
70,000
|
66,077
|
4,000
|
60,000
|
58,113
|
10,000
|
105,000
|
105,897
|
7,950
|
89,000
|
89,571
|
6,000
|
70,000
|
74,041
|
7,900
|
89,000
|
89,173
|
7,700
|
86,000
|
87,580
|
2,000
|
45,000
|
42,185
|
7,000
|
80,000
|
82,005
|
7,900
|
89,000
|
89,173
|
7,600
|
85,000
|
86,783
|
7,000
|
86,000
|
82,005
|
5,300
|
70,000
|
68,466
|
7,950
|
89,000
|
89,571
|
6,300
|
80,000
|
76,430
|
9,800
|
105,000
|
104,304
|
9,050
|
100,000
|
98,331
|
9,600
|
105,000
|
102,711
|
3,900
|
50,000
|
57,317
|
2,100
|
45,000
|
42,981
|
9,700
|
105,000
|
103,508
|
Покажем на графике линейное уравнение регрессии
Рассчитаем коэффициент эластичности по формуле:
,
т.е. на 0,342% в среднем по совокупности изменится результат у от
своей средней величины при изменении фактора х на 1% от своего среднего
значения.
Проверим полученные расчеты в автоматическом режиме с
использованием статистических функций в Excel:
для расчета параметра а0 используем статистическую
функцию
=ОТРЕЗОК (C87: C116; B87: B116) =26,257
для расчета параметра а1 используем статистическую
функцию
=НАКЛОН (C87: C116; B87: B116) =7,964
Выводы: Связь между факторной (товарооборот) и результативной
(численность населения) переменными сильная и прямая зависимость. Уравнение
линейной регрессии наиболее точно подходит для описания характеристики
изучаемого явления и уравнение линейной регрессии имеет вид. При увеличении значения товарооборота на
1 млрд. руб. значение результативной переменной численности населения
увеличивается на 7,964 тыс. чел., т.е. при увеличении товарооборота численность
населения растет.
Расчеты на основе расчетной таблицы совпадают с полученными
результатами расчетов в автоматическом режиме с использованием статистических
функций в Excel, что говорит о правильности выполненных
действий.
. Провести дисперсионный анализ на основе расчета общей, факторной
и остаточной дисперсий (расчеты показать в виде данных расчетной таблицы).
Строим расчетную таблицу по определению трех дисперсий:
№ п/п
|
Y фактическая
|
Y теоретическое
|
(Уф-Уср) ^2
|
(Ут-Уср) ^2
|
(Уф-Ут) ^2
|
1
|
50,000
|
58,113
|
714,671
|
346,717
|
65,821
|
2
|
60,000
|
59,706
|
280,004
|
289,937
|
0,087
|
3
|
89,000
|
89,173
|
150,471
|
154,735
|
0,030
|
4
|
88,000
|
88,376
|
126,938
|
135,556
|
0,142
|
5
|
60,000
|
59,308
|
280,004
|
303,656
|
0,479
|
6
|
45,000
|
42,185
|
1007,004
|
1193,587
|
7,924
|
7
|
60,000
|
58,511
|
280,004
|
332,046
|
2,217
|
8
|
87,000
|
88,376
|
105,404
|
135,556
|
1,894
|
9
|
60,000
|
62,095
|
280,004
|
214,281
|
4,389
|
10
|
70,000
|
66,077
|
45,338
|
113,557
|
15,390
|
11
|
60,000
|
58,113
|
346,717
|
3,561
|
12
|
105,000
|
105,897
|
799,004
|
850,519
|
0,805
|
13
|
89,000
|
89,571
|
150,471
|
164,801
|
0,326
|
14
|
70,000
|
74,041
|
45,338
|
7,249
|
16,330
|
15
|
89,000
|
89,173
|
150,471
|
154,735
|
0,030
|
16
|
86,000
|
87,580
|
85,871
|
117,646
|
2,496
|
17
|
45,000
|
42,185
|
1007,004
|
1193,587
|
7,924
|
18
|
80,000
|
82,005
|
10,671
|
27,790
|
4,020
|
19
|
89,000
|
89,173
|
150,471
|
154,735
|
0,030
|
20
|
85,000
|
86,783
|
68,338
|
101,004
|
3,181
|
21
|
86,000
|
82,005
|
85,871
|
27,790
|
15,960
|
22
|
70,000
|
68,466
|
45,338
|
68,345
|
2,353
|
23
|
89,000
|
89,571
|
150,471
|
164,801
|
0,326
|
24
|
80,000
|
76,430
|
10,671
|
0,092
|
12,743
|
25
|
105,000
|
104,304
|
799,004
|
760,153
|
0,484
|
26
|
100,000
|
98,331
|
541,338
|
466,468
|
2,785
|
27
|
105,000
|
102,711
|
799,004
|
674,860
|
5,238
|
28
|
50,000
|
57,317
|
714,671
|
377,010
|
53,533
|
29
|
45,000
|
42,981
|
1007,004
|
1139, 193
|
4,075
|
30
|
105,000
|
103,508
|
799,004
|
716,872
|
2,227
|
сумма
|
2302,000
|
2302,065
|
10969,867
|
10733,997
|
236,795
|
среднее
|
76,733
|
76,735
|
365,662
|
357,800
|
7,893
|
Добщ= ∑ (Уi факт - Yсред) ^2/n=365,662
Дфакт =∑ (Уi теор - Yсред) ^2/n=357,800
Дост = ∑ (Уi факт - Уi теор) ^2/n=7,893
Общая дисперсия равна сумме внутригрупповой и межгрупповой
дисперсий:
Добщ. =Дфакт. +Дост.
Подставим то, что получилось: 357,800+ 7,893= 365,693. Почти
равнозначно.
Проверим выведенное уравнение регрессии на статистическую
значимость.
Дфакт > Дост => 357,800> 7,893
Вывод: полученное уравнение регрессии статистически значимо.
Найдем эмпирический коэффициент детерминации R² по формуле:
R²= Дфакт/ Добщ = 357,800/
365,662= 0,978
В Excel: =E219/D219= 0,978
< 0,978 < 1
Вывод: На 97,8% изменение численности населения зависит от
влияния товарооборота и на 2,2% от других факторов.
Теперь извлечем корень из эмпирического коэффициента
детерминации R² и получим эмпирическое корреляционное
отношение R:
R=√ R² = √0,978 = 0,989
Вывод: Связь между товарооборотом и численностью населения
тесная.
R=r (коэфф. кореляции)
Между товарооборотом и численностью населения существует
линейная зависимость. И между ними существует линейная закономерная связь.
Задание 3
По результатам выполнения задания 1 с вероятностью 0,954
определите:
) ошибку выборки средней численности населения города и
границы, в которых она будет находиться для генеральной совокупности городов;
) ошибку выборки доли городов с численностью 90,0 тыс.
человек и более и границы, в которых будет находиться генеральная доля.
Выполнение
задания 3
По условию задачи вероятность р=0,954, следовательно t=2,0 (по табл. Значение
коэффициента доверия в зависимости от вероятности) и выборка 10% -ная,
механическая
n/N=10%=0,1, N=30/10%=300 городов - генеральная совокупность.
) ошибку выборки среднего товарооборота на один город в год и
границы, в которых он будет находиться для генеральной совокупности городов
Средний товарооборот - , дисперсия -
Вывод: На основании проведенного выборочного обследования с
вероятностью 0,954 можно утверждать, что средний товарооборот находиться в
пределах от 5,515 млрд. руб. до 7,161 млрд. руб.
) ошибку выборки доли городов с численностью 90,0 тыс. человек и
более и границы, в которых будет находиться генеральная доля.
Доля городов с численностью 90 тыс. чел. Составляет
=СЧЁТЕСЛИ (C2: C31; ">90") =5
w=5/30=0,167
Предельная ошибка для доли вычисляется по формуле и составляет:
Таким образом, от 3,8% до 29.6%, т.е. от 11 до 88 городов в
генеральной совокупности имеют численность населения более 90 тыс. чел.
Задание 4
По материалам государственной статистики построить за
последние пять лет ряд динамики, характеризующий изменение общей численности
населения на любом территориальном уровне. Ряд динамики представить в табличной
и графической (в виде линейной диаграммы) форме.
На основе построенного ряда динамики определить:
. Показатели анализа ряда динамики (абсолютный прирост, темп
роста, темп прироста, абсолютное содержание 1% прироста, средний уровень ряда,
средний абсолютный прирост, средние темпы роста и прироста). Все расчеты
представить в виде данных расчетной таблицы. Сделать выводы по рассчитанным
показателям. Определить тенденцию развития исследуемого явления.
. Построить уравнение тренда, определив теоретические
значения уровня ряда динамики за каждый период, обосновать параметры уравнения
тренда, определить точечный прогноз по исследуемому показателю.
Выполнение
задания 4
Источник: данные Росстата. Общая численность населения.
Обновлено 27.03.2014
Годы
|
Все
|
в том числе
|
В общей
численности населения, процентов
|
|
население,
|
|
|
|
млн. человек
|
городское
|
сельское
|
городское
|
сельское
|
2009
|
142,7
|
104,9
|
37,8
|
74
|
26
|
2010
|
142,9
|
105,3
|
37,6
|
74
|
26
|
2011
|
142,9
|
105,4
|
37,5
|
74
|
26
|
2012
|
143,0
|
105,7
|
37,3
|
74
|
26
|
2013
|
143,3
|
106,1
|
37,2
|
74
|
26
|
Берем для изучения Суммарный коэффициент городского
населения:
годы
|
городское
население
|
2009
|
104,9
|
2010
|
105,3
|
2011
|
105,4
|
2012
|
105,7
|
2013
|
106,1
|
Представим данные в графической (в виде линейной диаграммы)
форме:
На основе построенного ряда динамики определить:
. Показатели анализа ряда динамики (абсолютный прирост, темп
роста, темп прироста, абсолютное содержание 1% прироста, средний уровень ряда,
средний абсолютный прирост, средние темпы роста и прироста).
Воспользуемся формулами:
Абсолютный прирост: цепной: базисный:
Коэффициент роста: цепной: базисный:
Темп роста: цепной: базисный:
Темп прироста: цепной: базисный:
Процент прироста: цепной:
показатель
|
годы
|
2009
|
2010
|
2011
|
2012
|
2013
|
городское
населен
|
показатель
|
104,9
|
105,3
|
105,4
|
105,7
|
106,1
|
абсолютный
прирост
|
цепной
|
|
0,4
|
0,1
|
0,3
|
0,4
|
|
базисный
|
|
0,4
|
0,5
|
0,8
|
1,2
|
темп роста
|
цепной
|
|
100,381
|
100,095
|
100,285
|
100,378
|
|
базисный
|
|
100,381
|
100,477
|
100,763
|
101,144
|
темп прироста
|
цепной
|
|
0,381
|
0,095
|
0,285
|
0,378
|
|
базисный
|
|
0,381
|
0,477
|
0,763
|
1,144
|
Абсолютное знач
1% прироста
|
|
|
1,049
|
1,053
|
1,054
|
1,057
|
Вывод: величины абсолютного прироста свидетельствуют, что
суммарный коэффициент численности населения по сравнению с 2009г. увеличивался,
сравнительная оценка показателей цепного прироста выявила тенденцию увеличения
суммарного коэффициента численности населения в 2013 г. Цепные темпы роста
показывают увеличение суммарного коэффициента населения до 2013г. В 2013 г. по
сравнению с 2012г. произошло увеличение всего на 0,378%. Получаем, что с 2009г.
по 2013г. наблюдалось увеличение суммарного коэффициента численности населения.
Воспользуемся формулами:
Средний уровень ряда:
Средний абсолютный прирост:
Средний темп роста:
Средний темп прироста
Средний уровень
ряда
|
105,480
|
Средний
абсолютный прирост
|
0,300
|
Средний темп
роста
|
100,285
|
Средний темп
прироста
|
0,285
|
Вывод: суммарный коэффициент численности населения ежегодно
увеличивался на 0,285%.
. Построить уравнение тренда, определив теоретические
значения уровня ряда динамики за каждый период, обосновать параметры уравнения
тренда, определить точечный прогноз по исследуемому показателю.
Уравнение имеет вид:
Строим вспомогательную таблицу:
годы
|
Городское
население
|
t
|
t^2
|
y*t
|
2009
|
104,9
|
1
|
1
|
104,9
|
2010
|
105,3
|
2
|
4
|
210,6
|
2011
|
105,4
|
3
|
9
|
316,2
|
2012
|
105,7
|
4
|
16
|
422,8
|
2013
|
106,1
|
5
|
25
|
530,5
|
Итого
|
527,4
|
15
|
55
|
1585
|
Для определения параметров надо решить систему уравнений:
n*+*∑t=∑y; *∑t+*=∑yt.
Подставляем известные значения:
и в результате решения получаем: =0,28, =104,64
Подставим значение параметров и получим уравнение тренда:
= 0,28*t+104,64
Подставим в полученное уравнение тренда значения t, рассчитаем теоретическое значение .
годы
|
Y расч
|
2009
|
104,92
|
2010
|
105,2
|
2011
|
105,48
|
2012
|
105,76
|
2013
|
106,04
|
Итого
|
527,4
|
В Excel получили точно такое же уравнение тренда, что и расчетным путем:
Прогнозное значение суммарного коэффициента численности
населения на 2014 г.:
= 0,28*6+104,64 = 106,32
Вывод: с 2009 г. по 2013 г. наблюдалось увеличение суммарного
коэффициента численности населения. В среднем ежегодный прирост составляет
0,285%.
При сохранении данной тенденции суммарного коэффициента
численности населения в 2014 г. составит 106,32.
статистический показатель вариация выборка
Список
литературы
1. Ефимова
М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. - М.:
ИНФРА-М, 2004.
2. Практикум
по статистике: Учебное пособие / под. ред. В.М. Симчеры. - Финстатинформ, 1999
. Статистика:
Учебник /под. ред. С.А. Орехова. - ЭКСМО, 2010
4. <http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/population/demography/>
доступ свободный, сайт Росстата